MENU

新闻中心

当前位置: 首页» 新闻中心» 科研进展

基因组所1项研究成果入选2023年度中国农业科学院青年科技创新奖

2024-02-28 06:00:35来源:

【字体:

  


近日,中国农业科学院公布了2023年度中国农业科学院青年科技创新奖,此次共有5项成果获奖,其中基因组所(省实验室深圳分中心)阮珏团队的“复杂基因组三代测序组装算法”研究成果入选2023年度中国农业科学院青年科技创新奖。


复杂基因组三代测序组装算法

导读:

随着三代测序的飞速发展,农业育种已进入基因组设计育种阶段。本项目针对三代测序高错误率和计算效率瓶颈的问题,提出同聚碱基压缩索引的方法和点阵图比对方法,开发出SMARTdenovo组装算法,能够容忍极高的错误率并降低序列比对复杂度,显著提高组装效率;提出模糊布鲁因图理论,开发出WTDBG组装算法,解决了三代测序中德布鲁因范式的适用性问题,首次突破了组装速度落后于测序速度的领域难题,支撑完成高杂合茶树、超大脊椎动物肺鱼、超大裸子植物银杏等多项农业重难点基因组项目。相关研究成果累计被引用1630次,其中wtdbg方法学论文单篇引用超过600次,获得国内外同行的高度评价。


介绍:

基因组学在农业科学技术进步,特别是种业创新中发挥着重要的引领作用。三代测序通量的逐年增长,满足了泛基因组、生命之树等大规模基因组组装项目的数据需求,但是缺少一款“高效率、高准确”的组装算法来避免上述工作成为计算资源的无底洞。比如早期的PacBio组装算法HGAP在谷歌云组装一个人类基因组消耗40万核心小时,相当于单台电脑运行45年;CANU组合了MHAP比对模块和Celera-Assembler组装模块,需要使用大量计算节点历时约一个月才能完成人类基因组组装。传统序列比对和组装算法的优化空间已经不足,需要从理论上创新突破限制才能分析日趋增长的海量数据。


阮珏研究员团队针对三代测序高错误率和计算效率瓶颈的问题,提出同聚碱基压缩索引的方法和点阵图比对方法,开发出SMARTdenovo组装算法,能够容忍极高的错误率并降低序列比对复杂度,显著提高组装效率,能够在3,000 核心小时(CPU * hours)内完成人类基因组组装,效率较早期算法HGAP提高100多倍,是早期纳米孔测序组装的首选组装算法。


原文链接:https://gigabytejournal.com/articles/15


随着三代测序技术的不断发展,基于字串图范式的组装算法的组装效率受限于长序列比对算法,无法满足三代测序数据分析需求。研究团队提出模糊布鲁因图理论,开发出WTDBG组装算法,解决了三代测序中德布鲁因范式的适用性问题,首次突破了组装速度落后于测序速度的领域难题,较同期主流算法提升了2~17倍,首次在单机上实现了一天之内完成人类基因组组装,超越了三代测序速度(两天)。该研究成果发表在《Nature Methods》,获评 Springer Nature 出版社“2020 年中国科研生命科学与生物医学领域高影响力论文”(共20篇),中国科学技术信息研究所“2020 年中国百篇最具影响国际学术论文”,Genomics, Proteomics & Bioinformatics杂志 “2020 年度中国生物信息学十大进展”。此外,团队以WTDBG作为核心算法支撑,合作完成了高杂合茶树、超大脊椎动物肺鱼、超大裸子植物银杏等多项农业重难点基因组项目。相关研究成果累计被引用1630次,其中wtdbg方法学论文单篇引用超过600次,获得国内外同行的高度评价。


原文链接:https://www.nature.com/articles/s41592-019-0669-3


往期报道:Nature Methods | 阮珏/李恒合作开发更快更精准的第三代测序数据组装算法——wtdbg2




TOP TOP