1. 数据准备,实例数据如下
参考序列:ref.fna
下机测序序列:test.fastq(nanopore下机数据)
2. conda安装variant识别软件clair3
创建虚拟环境,安装软件
conda create -n clair3 -c bioconda clair3 python=3.9.0 -y
激活环境
conda activate clair3
如果发现激活不了,可以:source deactivate 再进行conda activate clair3
3. minimap2产生中间比对文件,建立索引
本文以三代测序结果举例,选用minimap2(https://github.com/lh3/minimap2)作为比对软件:
a. 产生sam格式中间比对软件
minimap2 -ax map-ont ../01_data/ref.fna../01_data/test.fastq > test.sam #比对alignmet
b. sam格式转化成bam格式
samtools view -Sb -o test.bam test.sam
c. 对bam文件进行排序
samtools sort test.bam -o test_sorted.bam
d. 建立索引,生成.bai文件
samtools index test_sorted.bam
e. 创建fna文件索引
samtools faidx ../01_data/ref.fna
4.variant 识别
run_clair3.sh --bam_fn ~/test/02_minimap2/test_sorted.bam --ref_fn ~/test/02_minimap2/ref.fna --threads=20 --platform="ont" --model_path ~/.conda/envs/clair3/bin/models/r941_prom_sup_g5014 --output=variant --include_all_ctgs
--model_path:这里的模式显示的是prom,并非只能适用于PromethIon下机数据,也可使用GridION, MinION 下机数据
--include_all_ctgs:如果是非人类测序结果,需要加上此项参数,选择所有contigs
结果展示:
5.一代测序验证
经一代验证后确有对应位置的突变出现:311 C→T;312 A→G,其他一致性位点未展出。