MENU

新闻中心

当前位置: 首页» 新闻中心» 科研进展

Cell Research|超级泛基因组助力水稻种质资源遗传变异挖掘和利用

2022-07-13 06:00:00来源:

【字体:

  

7月12日,中国农业科学院深圳农业基因组研究所与中国农业大学、南京农业大学、中国水稻研究所、中国科学院遗传与发育生物学研究所等单位合作,组装了251份高质量的水稻基因组,构建了目前植物中群体规模最大的、基因组充分注释的、稻属中最为系统的超级泛基因组。该图谱的完成将极大地促进水稻功能基因挖掘和水稻种质资源利用。相关成果发表在《细胞研究(Cell Research)》。


该研究通过地理分布来源、基因型和表型变异精心选择了具有高度代表性的202份亚洲栽培稻核心种质材料,28份普通野生稻、11份非洲栽培稻和10份短舌野生稻。对所选择的251份水稻核心种质材料进行长读长纳米孔(Nanopore)测序和Illumina短读长重测序,利用自主开发的WTDBG软件从头组装了251份高质量水稻基因组序列,并对每个基因组做了充分的注释。然后,基于序列和蛋白相似性分别构建了以非冗余序列和非冗余基因为代表的泛基因组。该研究将基于三代长读长数据鉴定到的159,491个结构变异信息整合为图形化的变异图谱(Variation graph)。这种变异图谱形式的泛基因组能够帮助研究人员利用已有的二代重测序数据获取相应水稻材料的结构变异(Structural variation,SV)。为了方便在群体水平上准确地比较等位基因在不同水稻材料中的遗传变异,研究者还利用高质量的群体基因组构建了基于基因组序列比对的泛基因组图谱,并对每个变异位点进行了基因注释和序列的整合,囊括了目前最全面的水稻基因序列的复等位信息。



图1 水稻超级泛基因组基因序列及变异.png

图1 水稻超级泛基因组基因序列及变异


研究人员利用泛基因组图谱通过整合NLRs注释信息,构建了水稻泛NLRome,确定了泛NLRs家族基因的共线性,为抗病基因功能和进化研究提供了基础,也给群体水平的复杂基因家族或者复杂的染色体区域研究提供了借鉴。研究人员利用他们构建的泛基因组序列和对应的群体表达数据,对两个已知初定位QTL进行重新分析,分别快速确定了产量相关性状的候选基因,并通过实验验证了候选基因的功能。群体水平的泛基因组序列可以帮助研究者从群体的水平上对复杂QTL定位区间序列的单倍型精准解析,大大加快功能基因挖掘的进程。


2 基于群体泛基因组、表达和表型快速挖掘产量相关基因的遗传变异



该泛基因组图谱为水稻比较基因组学和进化基因组学研究提供了重要基础。亚洲稻和非洲稻的比较基因组研究,揭示了亚洲栽培稻和非洲栽培稻重要农艺性状驯化和环境适应的遗传基础。利用泛基因组序列解析了与水淹反应相关的已知基因在5个不同水稻亚群中的单倍型分布和群体分化程度,发现非洲水稻和亚洲水稻中这些耐水淹基因可能发生了独立的变异来适应水淹环境。株型由野生稻匍匐生长转变为栽培稻直立生长是水稻驯化过程中的关键一步。研究人员利用泛基因组图谱比较了普通野生稻和短舌野生稻RPAD位点的差异,发现其在种内和种间均存在明显的分化,并且在驯化过程中,非洲栽培稻与亚洲栽培稻都在RPAD位点发生了大片段缺失,但是非洲栽培稻与亚洲栽培稻分别保留了RPAD位点两端的不同锌指基因,该结果不仅揭示了非洲栽培稻株型驯化的分子机理,也为大片段结构变异驱动作物平行驯化提供了重要的分子证据。


图3 基于群体泛基因组解析结构变异驱动的亚洲稻和非洲稻株型的平行驯化.png

图3 基于群体泛基因组解析结构变异驱动的亚洲稻和非洲稻株型的平行驯化



为了高效方便地利用这些海量的基因组数据,研究人员构建了数据库RiceSuperPIRdb(http://www.ricesuperpir.com/)。通过数据检索,可以高效地获得特定水稻品种基因组序列及基因组注释,选择任意样本基因组为参考基因组,查看与所有材料的全基因组比对结果和基因组变异。该网站对利用这些基因组信息研究水稻基因功能研究和种质资源利用具有重要的科学意义和实用价值。


中国农业科学院深圳农业基因组研究所商连光研究员、在读博士生李笑霞、博士后贺慧英、助理研究员袁巧玲、助理研究员宋艳妮、助理研究员魏昭然、在读博士生林海、中国农业大学博士后胡敏、以及基因组所已毕业博士生赵凤利为并列第一作者,钱前院士、阮珏研究员、熊国胜教授、朱作峰教授、商连光研究员为通讯作者。中国科学院遗传与发育生物学研究所李家洋院士、基因组所周永锋研究员、中国农业大学李自超教授、张洪亮教授、刘山林副教授,武汉希望组孙宗毅高级工程师等参与了该项研究工作。该工作得到了基因组所和中国水稻所超级计算平台的支持。该研究获得了国家自然科学基金、国家重点研发计划、广东省基础与应用基础研究基金,深圳市大鹏新区科技创新与产业发展专项资金的资助。

原文链接:https://www.nature.com/articles/s41422-022-00685-z



专家点评:


圣路易斯华盛顿大学 Kenneth M. Olsen教授

Cell Research同期发表了Kenneth M. Olsen教授对于该工作的点评文章(点评文章链接:https://www.nature.com/articles/s41422-022-00699-7 )。 Olsen教授认为基因组相关研究的贡献不仅取决于单个基因组的组装质量,也取决于其包含的自然变异多样性。Shang等人发布了第一个包含亚洲栽培稻和三个近缘物种在内的水稻“超级泛基因组”,该研究极大促进了我们对于水稻基因组的理解,相关种质资源及数据对基础研究有重要价值。


上海师范大学 黄学辉教授
泛基因组(Pan-genome)是指一个物种内所有基因组信息的总和。相比单一参考基因组,泛基因组信息包含了丰富的遗传多样性,可有效降低参考基因组偏差对遗传变异检测的影响。该研究团队选取了251份来自不同类群的亚洲栽培稻、普通野生稻、非洲栽培稻及短舌野生稻材料,对它们进行了长读长测序、从头组装、基因组注释和结构变异鉴定,获得了一份高质量的水稻泛基因组图谱。这套群体水平的超级泛基因组,无论是材料选择、样本大小还是组装质量都可圈可点,是水稻基因组学研究中一项里程碑式的工作。
在此基础上,该研究团队还开发了这套数据的在线网站,提供给同行们进行水稻组学资源的获取和整合,这将极大地方便科研人员充分挖掘水稻品种中的各类等位变异,精确地鉴定复杂农艺性状的关键变异位点(QTN),进一步推动水稻功能基因组学研究。此外,结合高质量的组学数据,育种家还可以充分利用这251份水稻资源,进行优异基因聚合,创制新的育种材料,实现更高水平的分子设计育种。

中国科学院遗传与发育生物学研究所 田志喜研究员
种内、种间多样性是作物改良的基础。随着研究的深入,基于单一参考基因组解析物种多样性的弊端逐渐显现,例如无法实现基因组复杂区域候选基因的精细解析等。在本文中,研究人员从稻属材料中系统性收集了251份水稻核心种质,组装了高质量基因组,在进行完整注释后构建了目前植物中群体规模最大的超级泛基因组。同时,基于高质量基因组的序列比对完成了泛基因组图谱。该图谱将群体材料每个变异位点的序列和基因注释整合,展示了目前稻属基因组序列最全面、最完整的复等位信息,为群体水平候选片段或等位基因的共线性分析及单倍型比较等研究提供新的切入点和突破口。研究人员以复杂基因家族——抗病基因NLRs为例,详细介绍了基于水稻超级泛基因组开展复等位基因研究的方法。通过提取泛基因组图谱中NLRs信息,成功构建了泛NLRome,在群体水平充分展示NLRs的共线性、重排等信息,不仅能够为NLRs进化相关研究提供了参考,也为基于泛基因组研究复杂基因家族或者染色体区域提供了思路。
最后,作者将所得数据及分析结果在网站上进行可视化,方便相关科研人员以任意研究样本为参考基因组查看与所有材料的全基因组比对结果和基因组注释,查看材料间变异信息。作为植物研究领域的顶级资源和研究成果,不仅是前沿科学挑战的新突破,同时对水稻甚至其他植物的功能研究和分子育种具有不可估量的价值。


TOP TOP