MENU

新闻中心

当前位置: 首页» 新闻中心» 科研进展

基因组所研发出植物线粒体基因组组装新工具GSAT

2023-01-31 04:00:00来源:

【字体:

  


近日,基因组所武志强课题组在《生物信息学简报(Briefing in Bioinformatics)》在线发表了题为“Master graph: an essential integrated assembly model for the plant mitogenome based on a graph-based framework”的研究论文,报道了一种新的植物图形化线粒体基因组的构建策略与组装工具GSAT(graph-based sequence assembly toolkit),并应用在模式物种水稻和拟南芥中。




植物线粒体基因组组装的“困境”


同于大多数植物叶绿体基因组和动物线粒体基因组保守的单一环状分子结构,植物线粒体基因组的分子结构相对更加复杂和多变。植物线粒体基因组的大小变幅很大,从68 kb (Viscum scurruloideum)11,319 kb (Silene conica),相差可达百倍以上;序列重组十分频繁,具有包括环状、线状、分枝状等多种不同的分子结构。但其基因编码序列则高度保守,突变速率远低于核基因组和叶绿体基因组。然而,现有的植物线粒体基因组组装工具仍然倾向于产生一个或多个环状序列作为最终组装形式,对于线粒体基因组多样化的结构信息难以进行充分解析。因此,目前仍然缺乏系统性的可靠工具来探索植物线粒体基因组的完整结构信息,这也是导致植物线粒体基因组的完成程度远远落后于动物线粒体基因组和植物叶绿体基因组的主要原因。


GSAT:找回“丢失”的结构信息


为了实现对植物线粒体基因组结构信息的完整评估,我们提出了图形化线粒体基因组的组装形式,以涵盖其所有序列和结构形式。借助于植物线粒体基因组常用的主环(Mater circle)模型,我们将图形化线粒体基因组称为主图(Master graph),其中包含了所有化学计量水平的线粒体DNA序列和潜在结构信息。在此基础上,我们开发了植物线粒体基因组组装新工具GSAT(下载地址:https://github.com/hwc2021/GSAT),能够利用二、三代高通量基因组测序数据,通过图形化比对策略快速组装获得植物的图形化线粒体基因组。


1 | 植物图形化线粒体基因组的组装策略及其潜在应用


GSAT在水稻和拟南芥中的应用


研究人员将GSAT应用于两个模式植物物种水稻和拟南芥线粒体基因组主图(MMG)的组装。水稻和拟南芥的MMG长度分别为346,562 bp358,041 bp,分别包含9个和6contig, 12个和8link,可分别进一步分为6个和3个最小主环与4个和2个最小次环。拟南芥的核-线粒体转移片段(NUMTs)对线粒体基因组中同源结构的频率评价有很强的影响,而水稻的NUMTs则影响相对较弱。两个物种的线粒体-叶绿体转移片段(MTPTs)MMG的评估没有影响。对所有潜在的重组结构进行了分析,结果显示,除了核基因组同源结构外,MMG结构的出现频率比非MMG结构高得多。这些结果充分展示了线粒体基因组分子结构的多样性。对潜在环状和线状结构的分析进一步支持了水稻和拟南芥线粒体基因组中的多种主要结构,并可完全反映在MMG中(图2)。


2 | 植物线粒体基因组的主图模型及其包含的潜在DNA结构形式


GSAT的前景


本研究为组装和应用图形化植物线粒体基因组来评估其泛结构变异提供了一个高效和准确的研究模型,并为后续的进化和功能研究奠定了重要基础。


基因组所博士后贺文闯为论文第一作者,课题组长武志强研究员为论文通讯作者。基因组所博士后向坤莉、剑桥大学博士后陈菜金、基因组所研究生王杰也参与了该研究。本研究得到了国家自然科学基金、深圳市科学技术创新委员会、中国农业科学院青年英才项目的支持。


原文链接:https://doi.org/10.1093/bib/bbac522

TOP TOP