Unicycler是专为细菌基因组设计的组装工具,既支持纯二代(Illumina)或纯三代(Nanopore/PacBio)数据,也擅长混合组装。它融合了 De Bruijn 图(适用于短读段)和字符串图(String Graph,适用于长读段)两种策略,兼顾准确性与连续性。上一期我们详细介绍了Unicycler在混合组装中的应用,这期我们将带来Unicycler单独进行二代与三代组装的应用。
二代:Illumina NovaSeq PE150,覆盖度100x;
三代:Nanopore PromethION,N50=15 kb,覆盖度50x。
输出文件:
assembly.fasta:最终组装序列(含环化信息);
assembly.gfa:组装图文件,可用Bandage可视化。
若N50偏低,可加大 --racon_iterations 5以提高抛光轮次。
二代:增加测序深度,调整 --min_kmer_coverage;
三代:尝试提高 --min_overlap(如设为5000)。
在这两期推文中,我们详细介绍了 Unicycler 在微生物基因组组装中的应用场景、核心原理与实操策略,涵盖了 Illumina 与 Nanopore 等不同平台的组装优化方案。Unicycler 凭借其对 De Bruijn 图与字符串图的融合设计,以及自动纠错与环化输出机制,在原核基因组研究中表现出色。
后续我们将陆续推出以下专题,帮助大家从入门到进阶掌握二代/三代测序分析技能:
敬请关注,解锁更多生信实战干货!