MENU

新闻中心

当前位置: 首页» 新闻中心» 科研进展

Genomics, Proteomics & Bioinformatics|基因组所刘永鑫组综述长读长宏基因组工具资源版图

2025-11-27 04:37:00

【字体:

  

2025年11月20日,中国农业科学院深圳农业基因组研究所(岭南现代农业科学与技术广东省实验室深圳分中心)刘永鑫团队在国际期刊《基因组蛋白质组与生物信息学报(Genomics, Proteomics & Bioinformatics(GPB))》发表了题为“Computational Tools and Resources for Long-read Metagenomic Sequencing Using Nanopore and PacBio”的综述论文,文章全面梳理了长读长宏基因组学的发展历程,回顾了关键性的技术进步和重要里程碑事件。同时,深入探讨了长读长技术在多个研究领域的广泛应用,重点分析其在解析复杂微生物生态系统中的重要作用,并系统总结了用于提升宏基因组数据处理效率与准确性的关键计算资源,包括软件、数据库和工具包,提供了一份实用指南,帮助研究者安装和使用相关软件。该文章为宏基因组学研究者探索微生物世界提供了重要指引,通过整合资源和创新思路,进一步推动了复杂微生物生态系统的深入研究与发现。



自然界中大多数微生物难以分离和培养。1998年,Handelsman等人提出“宏基因组”概念,涵盖可培养和不可培养微生物的遗传物质。自2005年首台高通量测序仪发布以来,宏基因组研究迅速发展,为探索土壤、水体及人类肠道等环境中的微生物多样性提供了强大工具。短读长鸟枪法测序因其高效和易用性被广泛采用,但在组装完整基因组和检测结构变异方面存在局限,难以准确解析复杂微生物群落。长读长测序技术(如PacBio和ONT)凭借其生成超长DNA序列的能力,克服了短读长技术的缺点。2011年,PacBio推出RS测序仪,其读长超过10 kb,但早期错误率较高。2014年,PacBio技术首次应用于宏基因组研究。同年,ONT推出MinION测序仪,标志着长读长宏基因组学的兴起。长读长技术通过生成连续数千到数万个碱基的读长,使科学家能更准确地解析微生物群落的组成与功能。


近年来,长读长技术精确度显著提升。2022年,PacBio Revio和ONT R10.4.1流动槽进一步缩短了测序时间,并提升了数据精确度。此外,针对长读长数据的分析工具(如HiFiasm-meta和metaFlye)加速了高质量基因组组装和功能解析。2023年,《Nature Methods》评论文章指出,长读长宏基因组学推动了微生物生命树的完善。2025年,本团队开发了EasyNanoMeta流程,专注于长读长宏基因组数据分析,显著提升了微生物种群的解析效率。


未来,随着长读长测序技术和生物信息学工具的进一步发展(图1),宏基因组学将在微生物多样性、生态功能研究和新物种发现中发挥更大作用。


图1|长读长宏基因组学的起源与关键发展


长读长宏基因组测序通过提供覆盖完整基因、操纵子甚至整个基因组的连续序列,大大提升了微生物群落的分析能力。与短读长测序方法相比,长读长测序克服了传统技术的诸多限制,为解析复杂微生物群落的功能潜力提供了更全面的视角。因此,这项技术近年来受到研究者的广泛关注。以下是过去十年中长读长宏基因组技术在实际应用中的总结,主要包括快速鉴定群落结构、组装环状基因组、预测基因与移动遗传元件、微生物变异与种群遗传、表观遗传与关联分析等五大应用领域(图2)。


图 2|应用长读长测序解析微生物群落结构与功能


随着长读长宏基因组技术的快速发展,生成的数据量迅速增加,推动了新的计算模型和分析工具的改进和应用。因此,本文总结了适用于长读长宏基因组数据分析的生物信息学流程(图3),并在文中和附加表中列出了可用工具的详细清单与概览。


图3|应用长读长测序解析微生物群落结构与功能


未来,PacBio的测序通量预计将显著提高,从而支持更快、更全面的大规模宏基因组研究。同时,ONT的读长准确性预计将大幅提升,甚至可能达到Q30。随着这些技术的进步,研究人员将能够以前所未有的深度洞察微生物、病毒和宿主生物多样性中的大规模遗传变异和表观遗传模式,从而加深对遗传学与环境之间复杂交互作用在健康和疾病中的理解。


基因组所刘永鑫研究员和武汉贝纳科技有限公司(贝纳基因)杨路路博士为论文的共同通讯作者。基因组所博士后张天缘为论文第一作者。相关软件安装代码及使用说明已在 GitHub 平台开源发布(https://github.com/zhangtianyuan666/LongMetagenome)。


该研究得到了国家自然科学基金、中国农业科学院科技创新工程等项目资助。


原文链接:https://doi.org/10.1093/gpbjnl/qzaf075

TOP TOP