袁军辉校友带领团队成功破译超大凤丹牡丹基因组遗传密码
发布日期:2022-12-02

  唯有牡丹真国色,花开时节动京城。 

  除了文化价值以外,牡丹还有着极高的经济价值和社会价值。深入研究牡丹基因组,了解其染色体形成与维持机制,对经济和学术研究领域都具有重要意义。 

  在上海辰山植物园,中南林业科技大学91级校友袁军辉带领团队,成功破译超大凤丹牡丹基因组遗传密码及其超大染色体形成与维持的潜在分子机制,将牡丹科学研究带入了真正的基因组时代。 

  近日,上海辰山植物园研究员袁军辉校友以第一作者及主要通讯作者身份,在国际著名期刊Nature communication上发表了题为“Genomic basis of the giga-chromosomes and giga-genome of tree peony Paeonia ostii”(凤丹牡丹超大染色体及巨大基因组的遗传机制)的牡丹基因组学最新研究成果。 

  该研究成功破解了凤丹牡丹高质量染色体水平的基因组遗传密码及其超大染色体形成与维持的潜在分子机制。这是迄今世界上已经测序的陆地植物中最大染色体(1.78-2.56Gb),也是已测序双子叶植物中最大基因组(12.28Gb)之一。 

  此研究成果不仅将牡丹科学研究带入了真正的基因组时代,而且也开启了牡丹分子育种及优质特异基因鉴定和功能解析与产业利用的新纪元;是牡丹科学研究领域里程碑式的标志性成果,也是植物基因组学领域(巨大基因组和超大染色体研究)中最重要的突破性研究进展之一。   

  校友简介:袁军辉,博士,1994年毕业于中南林业科技大学林业教育专业,曾就职于甘肃林业职业技术学院(原甘肃林校)、中科院植物研究所博士后,现任上海辰山植物园研究员、硕士生导师、牡丹基因组学项目首席科学家及执行负责人。以通讯作者或第一作者(含共同)在Natrue CommunicationPlant biotechnology journalMolecular Ecology等国际著名学术期刊上先后发表牡丹研究领域引领性学术论文10多篇,合作培养博士后3名,博(硕)士研究生10多名,先后主持国家自然基金(面上)等科研课题10多项,获发明专利授权4项。主要研究方向为牡丹芍药基因组学和功能基因组学及分子育种、进化生态及群体遗传学、优异性状基因挖掘及功能鉴定及开发利用等。  

 

 

  成果介绍 

  凤丹牡丹,即凤丹,又名杨山牡丹(Paeonia ostii),是中国最主要栽培牡丹(P. suffruticosa)的最重要祖先亲本之一,是当前中国生产和栽培面积最大的牡丹类型。   

  十年艰辛探索成功破解凤牡丹基因组遗传密码     

  与其它被子植物相比,牡丹(2n=10)具有千兆级的超级巨大的染色体(10-15μm)和非常大的基因组(>12Gb);由于过度开发利用(如野外采挖)以及其自身超大染色体和巨大基因组的影响,野生的凤丹植株已经不见踪迹。 

  牡丹基因组之复杂及破解难度之大,远超研究人员预料之外。历经十年,凤丹牡丹基因组研究团队采用了逐级梯度建库策略(150\300\500\800bp2k\5\10k\20\40k文库)及二代高通量短片段测序技术(Illumia平台2.97Gb),结合三代长读长测序技术(PacBi643.76Gb)和精准染色体构象捕获技术(HiC数据2.50Tb);在测序组装分析过程中,研究团队不断进行适用于牡丹复杂基因组特点的技术创新,并及时借鉴学习基因组学领域众多前沿技术,历经数百次/种软件测试、开发及应用分析和反复优化组装,曾先后形成过5个定型组装版本和3次完整(人工辅助)注释的拟发表版本。 

  文中最终发表凤丹基因组成熟版本为12.28GbContig N50=228Kb Scaffold N50=2.43Mb),其中11.49Gb(93.5%)成功组装到5条超大染色体(1.78-2.56Gb),这也是迄今人类已经测序陆地植物中最大的染色体。此版本中共注释基因73177条,高置信基因集59768条,有54451条锚定在5条不同染色体上。

 

  逆转录转座子爆发式插入基因间区产生了牡丹超大染色体和巨大基因组    

  研究结果表明:在凤丹基因组中,约有330511条假基因和15238个基因家族。这些大量假基因的产生可能与LTR在基因组的大量扩增相关。 

  与其它具有巨大基因组的单子叶植物大多经历了全基因组加倍事件相比,凤丹基因组似乎没有经历过其谱系特定的全基因组复制;而在短时间内(约 200 万年)其基因间区的逆转录转座子(以Del为代表的LTR)爆炸性扩张是促成了其超大基因组和超大染色体的形成的可能机制。 

  通过对16种代表性植物基因组中LTR的重新注释,文中还提出了逆转录转座子Del家族相对于其它LTR亚家族在牡丹基因组中大量扩增及产生的可能机制,与其结构域的完整性(酶活性)相关。 

  深入综合分析牡丹全基因组甲基化简化测序、组蛋白甲基化测序数据与LTR数据的结果表明,虽然牡丹拥有双子叶被子植物(迄今已测序)中最大的基因组和超级巨大的染色体,但其大部分功能基因依然可以正常的表达和转录,其原因就是大量的LTR是插入在远离功能区的基因间区。 


    

  凤丹牡丹千兆染色体的进化与形成机制     

  研究团队采用被子植物12种代表性物种的系统进化分析结果,进一步明确了牡丹(芍药科)的系统位置处于核心双子叶植物基部的虎耳草目(Saxifragales),大约出现在109百万年前。4DTV进化分析表明以凤丹牡丹为代表的芍药科植物与葡萄等核心真双子叶植物可能共同经历了其祖先130百万年前的6倍化事件(γ)。 

  同时,祖先染色推断与进化分析表明,牡丹基因组是通过祖先染色体(7条基数)至少经过4次断裂和20次融合等一系列复杂进化事件后才形成的当前牡丹类群中的5条染色体基数。 

  研究表明:牡丹基因组中约有208个组蛋白编码基因(H1H2AH2BH3H4),结合重新分析已发表的大量基因组数据,我们深入讨论了牡丹超大染色体的形成和维持所涉及的可能因素。 

  本文中首次明确提出了牡丹这五种组蛋白编码基因的扩张(特别是H2A.WH3.1)可能有助于维持其超级巨大的千兆染色体的初步科学猜想,且组蛋白数目与维持植物较大染色体相关的这一机制也可能存在普遍性,进一步的深入研究和更直接的证据仍在持续进行之中。 

    

 全基因组关联分析揭示了牡丹高不饱和脂肪酸之谜     

  448个凤丹种质进行了简化基因组测序和全基因组关联分析(GWAS),并结合了种子时序发育转录组等技术,研究揭示了牡丹种子高效积累不饱和脂肪酸的重要机制,即其虽然与大多数陆地植物具有保守的脂肪酸生物合成途径,但是在通路中的每个关键节点至少有一个高表达基因在行使功能,进而保障了牡丹中ALA等的大量积累;同时,还进一步鉴定了(包括SADFAD2等)多个候选油脂合成基因,可能在其种子高水平的ALA合成中发挥重要作用。 

  研究还系统解析了陆地植物中ALA合成环节(从亚油酸LAα亚麻酸ALA)中关键去饱和酶基因FAD3FAD7/8的进化历史,首次揭示了其在被子植物早期发生过一次基因复制事件及其重要意义。 

    

  栽培牡丹雄蕊瓣化的分子机制与人工驯化对牡丹花多样的贡献        

  凤丹牡丹同时也是一种重要的观赏植物,是栽培牡丹的重要祖先亲本之一,研究发现:花发育(器官身份决定基因)A类基因AP1的异位表达和C类基因AG在部分雄蕊中的表达减少可能有助于雄蕊瓣化的形成。同时,在栽培牡丹的长期栽培驯化过程中,决定花多样性的多个花器官发育基因明显受到人工选择压力。 

  研究进一步提出了牡丹花型发育的多样性模式假说,即在祖先亲本牡丹(P. ostii)的花发育ABCE经典模型Strict ABCE Model)和栽培牡丹(P. suffruticosa)中的不严格的花发育边界消退模型Unstrict ABCE Model),结合选择分析结果,提出了牡丹花发育模式转变的进化驱动力就是栽培牡丹千百年来的人工驯化过程。 

  这一研究发现,还进一步丰富了植物花发育研究的进化模式,即人工选择可能会打破前人研究中提出的种子植物中花器官发育身份决定基因的渠道化方向性进化模式。该结果不但挖掘了栽培牡丹花多样性的多个候选基因,而且为进一步培育更优质和更高观赏价值的新优牡丹提供了理论依据和基因资源。 

   

  文章原文链接: 

  https://www.nature.com/articles/s41467-022-35063-1