主粮作物水稻、玉米、小麦均为单子叶植物,是养活人类的主要分支类群。单子叶植物又分为65个科(家族)超过6万个物种,为更好的了解单子叶植物的演化历史,需从单子叶植物祖先基因组开始,菖蒲科菖蒲属类植物单子叶植物最早的祖先。
近日,华大研究团队在Nature Communications上发表了题为The genome of Acorus deciphers insights into early monocot evolution的研究论文,破译了早期单子叶植物金钱蒲的无缺口基因组信息,填补了早期单子叶植物基因组研究的空白,确定菖蒲目为现存其他单子叶类群的姐妹群,鉴定并解析了早期单子叶植物适应水生生存环境的关键基因。该研究为了解单子叶植物的演化提供了新的数据支撑,也为了解众多作物抗水淹提供了新的思路。
图1 金钱蒲组装策略和基因组特征
本研究构建高质量的金钱蒲基因组,对于系统的了解整个单子叶类群演化具有重要意义。为了解析菖蒲属的系统位置,构建多个数据集进行系统发育分析。核基因和叶绿体基因构树结果均支持金钱蒲作为单子叶其他类群的姐妹群。对菖蒲属下各种进行转录组测序,分析属下种间关系,结果分为两大分支,一个分支包括菖蒲A. calamus 的两个变种(A. calamus var. calamus 和 A. calamus var. americanus)。另一个分支包括金钱蒲A. gramineus,石菖蒲A. tatarinowii,茴香菖蒲A. macrospadiceus和一个未确定的物种(Acorus sp. HN,该物种在形态上与其他物种不同)。目前菖蒲属下种的界定是没有定论,本研究结果支持目前被认为是菖蒲变种的石菖蒲A . tatarinowii应该为一个独立的种。将在后续的研究中,从代表每个物种的大量个体中收集样本,以阐明Acorus属内关系并进行必要的分类修订。
图2 金钱蒲系统发育分析结果
为了获得高质量的线粒体基因组,使用~20.0 Gb的ultra-long nanopore reads对线粒体基因组进行组装,得到近乎完整的全长2, 221 kb的线粒体基因组 (图3a),这是迄今为止单子叶植物内最大的线粒体基因组之一(图3 b)。为了评估金钱蒲线粒体蛋白编码基因的分化水平,对38个基因的dS和dN值进行了估算,与其他被子植物样本相比,金钱蒲具有较高的dS和dN值 (图3c)。快速的突变率也解释了之前使用线粒体数据的研究中Acorus在单基因树中的位置不一致,说明在未来涉及Acorus的系统发育研究中排除线粒体基因的必要性。
图3 线粒体基因组结构和线粒体基因dS 和dN 值
全基因组复制事件(WGD),是植物演化适应的重要驱动力,已有的研究证明除泽泻目以外的单子叶类群共同经历了一次WGD(τ)。本研究采用对重复基因同义替代分析和基因组内共线性区域进行比较验证,发现金钱蒲所在的菖蒲目并未经历τ事件,仅有一次谱系特异性WGD事件。这为了解单子叶类群祖先状态提供了良好的模型。将金钱蒲的基因组与已发表的石菖蒲基因组进行共线性分析,也得到了较好的结果(图4c)。
图4 金钱蒲全基因组加倍事件(WGD)
大多数的基因数量扩增可能是由于在WGD事件后大量的基因保留,而菖蒲目仅经历一次自身特异性WGD事件。使其基因组中未发生大规模的扩张。而在抗逆性和抗病中起重要作用的WRKY和抗病R基因在金钱蒲中发生了收缩,表明其适应水生/湿地生境,在这些生境中植物遭受的病虫害远少于陆地植物。R基因中的 TNL亚类基因在除单子叶类群之外的被子植物类群中均有鉴定到,但在单子叶植物中未被鉴定到,表明TNL可能存在于被子植物祖先中,随后在单子叶植物祖先中丢失。与维管发育相关的HD-ZIPⅢ,CLE基因家族均显示收缩。此外,研究还发现金钱蒲LHCB1家族发生了大规模扩张,该基因为编码捕光复合体的关键基因,可以增强植物在弱光环境下的光合作用。同时,与气味相关的TPS-b家族也发生扩张,众多研究结果均与金钱蒲的适应性演化相一致。这些研究结果也为了解同为单子叶植物的作物水稻等适应水生生境提供新思路。
图5 比较基因组和基因家族分析
深圳华大生命科学研究院郭兴博士、博士研究生王芳和生物信息工程师方东明为该论文共同第一作者,刘欢研究员为该论文通讯作者。中科院植物研究所郭亚龙研究员,华南国家植物园罗世孝研究员,中科院深圳仙湖植物园董姗姗博士等参与此项工作。
论文链接:https://doi.org/10.1038/s41467-023-38836-4