细胞器前沿进展|Plantorganellargenomes:muchdone,muchmoretodo!

元莘生物 2024-07-26 11:37:43

导语

质体和线粒体是唯一拥有内共生起源基因组的细胞器。近几十年来,测序技术的进步导致已发表的细胞器基因组数量激增,揭示了极为不同的进化轨迹。在这篇综述中,量化了植物细胞器基因组在植物生命树上的丰度和分布。比较了两种细胞器基因组之间的许多基因组特征,重点关注了进化轨迹、转移、转录激活因子样效应核酸酶(TALENs)、转录激活因子样效应物(TALE)介导的脱氨酶以及聚集型规律间隔短回文重复序列(CRISPR)/CRISPR相关蛋白(Cas)等技术对细胞器基因组编辑的现状,以及遗传转化。最后,提出了未来研究的建议,以了解这些不同的进化轨迹,并提出基因组编辑策略,促进功能研究,并最终改善细胞器基因组。

文献标题:Plant organellar genomes: much done, much more to do

发表期刊:Trends in Plant Science

影响因子:20.5

发表时间:2024.01.13

综述亮点ORIGINGENE

技术进步导致植物细胞器序列数量大幅增加,但样本采集仍不均匀。

大多数陆地植物线粒体基因组由于不同的结构构型和转移序列的干扰而难以准确组装。

泛细胞器基因组提供了新的进化见解,并为研究谱系分化期间基因功能变化的编辑提供了靶点。

细胞器基因组编辑技术(如线粒体靶向转录激活因子样效应核酸酶(TALENs)和双链DNA特异性胞嘧啶脱氨酶(DddA)衍生的胞嘧啶碱基编辑器)能够对开放阅读框(ORFs)和非编码区域进行功能验证。

质体转化已被用于一系列改进,例如改善光合效率和疫苗生物合成,而线粒体转化由于技术挑战而远远落后。

重点内容ORIGINGENE

1.植物细胞器基因组测序的开始得益于大规模数据的可用性。

提高作物产量以满足全球食品需求一直是植物育种领域长期关注的话题。光合作用和呼吸作为驱动植物生物量积累的关键机制,这些重要的生理过程受质体和线粒体调控。这两个细胞器具有不同的基因组DNA,即线粒体基因组和质体基因组。对这两个细胞器基因组的研究已经解答了关于它们进化和功能的重要问题;然而,对其结构动态、细胞内异质性、非编码区域以及基因组编辑潜力的深入理解仍然缺乏。电子显微镜(EM)方法揭示了植物线粒体基因组在发育阶段逐渐改变结构构型;然而,这些变化的分子动态和生物学后果尚不清楚。此外,开放阅读框(ORFs)和非编码区域占据了植物线粒体基因组的绝大部分,但大多数尚未被彻底研究,无法准确得出这些区域是否没有功能的结论。与核基因组编辑相比,细胞器基因组编辑落后,并仍面临技术瓶颈。质体转化已经取得进展,并开始与合成生物学结合应用,而线粒体转化则仍受限制。

2.完整的细胞器基因组数量迅速增加

1)细胞器基因组测序的历史

质体基因组通常长度为115至165千碱基对(kb),而植物线粒体基因组的大小差异很大,从Viscumscurruloideum的~66 kb到Larix sibirica的~12 Mb不等。尽管完整的质体基因组序列丰富,但完整的植物线粒体基因组数量相对较少。例如,在NCBI数据库中,完整的质体基因组约有近13,000个,而完整的植物线粒体基因组仅有673个,其中仅有285个物种的两种细胞器基因组都被测序。在过去的十年中,完整质体基因组序列的增加经历了三个阶段,主要是由于测序和组装方法的进步,特别是下一代测序(NGS)技术的发展。然而,植物线粒体基因组的完成进展严重滞后。植物线粒体基因组测序的主要挑战之一是短读长NGS方法的局限性,主要是由于长重复序列以及线粒体质体转移片段(MTPTs)和核线粒体转移片段(NUMTs)的存在。尽管这些转移通常可以通过与线粒体读数相比的异常读数深度来区分,但测序丰度的极端不平衡突显了完整植物线粒体基因组组装的困难。

2)细胞器基因组在植物生命树中的不均匀分布

截至2023年9月,NCBI已经发表近13,000个质体基因组,其中被子植物占据绝大多数(93.4%)。植物线粒体基因组的采样在数量和谱系上存在差异,其中大多数是被子植物(34.4%),苔藓植物(28.3%)和绿藻(20.9%)。与质体基因组不同,测序的线粒体基因组百分比与被子植物的生物多样性不匹配,这是因为准确组装的困难。目前,经济重要物种和物种丰富的谱系仍然是细胞器基因组测序的焦点,就像核基因组一样。特别是,第三代测序(TGS)技术已经产生了大量的整个基因组测序(WGS)数据,用于核基因组组装,从中可以组装植物线粒体基因组。这有助于细胞器基因组的组装,并提供更多的数据资源来解决细胞器相关的问题。开发专门用于植物线粒体基因组的组装工具也至关重要,一些特定的工具,包括但不限于半自动化基于图形的组装编辑器(SAGBAC)、GetOrganelle、Norgal、基于图形的序列组装工具(GSAT)和植物线粒体基因组组装工具(PMATii),已经被开发出来;然而,一些问题仍然没有解决,比如忽略罕见的配置、要求来自近亲的参考和排除与参考不匹配的线粒体序列。此外,组装完成后,还没有用于判断植物线粒体基因组组装的通用评估系统。

3.质体基因组与线粒体基因组之间的差异

在植物线粒体基因组的演化中经常观察到的现象是,线粒体基因组在结构上演化迅速,但在序列上演化缓慢。就同义替换率而言,核基因组的演化速度最快,质体基因组的演化速度为核基因组的一半,而植物线粒体基因组的演化速度则不到核基因组的六分之一。对于大多数植物而言,质体基因组的突变速率在一个相对较窄的范围内变化,相对同义替换率在大多数谱系中低于每个位点一次,但植物线粒体基因组的突变速率在不同谱系中可能发生显著变化(从几乎没有到每百万年每个位点十次)。然而,大规模的细胞器基因组比较报告了亲缘关系较远的植物谱系中异常的速率变化(例如在Pelargonium、Plantago和Silene中)。例如,一些Silene物种的同义替换率经历了极端的加速,导致一些同属物种之间的速率相差180倍(例如,Silene noctiflora vs. Silene latifolia)。

几乎所有的质体基因组都具有高度保守的四部分圆形结构,由一个大单拷贝(LSC)区域和一个小单拷贝(SSC)区域组成,两者之间由一对IRs分隔。然而,在体内的质体基因组由圆形、线形和多支化分子的混合形式组成;圆形仅占很小比例。在典型的质体基因组内,存在两种配置,通过IRs交换。然而,已检测到一些非典型形式,例如Pinus中IRs极端收缩的情况,Papilionideae中整个IR的丧失,Selaginellaceae某些物种中的直接重复(DRs),以及动态结构网络而非固定形式。

4.植物细胞器基因组的未来研究趋势

1)细胞器3D-泛基因组

大部分细胞器基因组在基因含量上相似,但它们的序列组成和结构在组织、发育阶段、以及物种之间和内部都存在着显著的差异,这些差异通常与适应性相关。泛细胞器基因组的研究可以从细胞质供体的角度探索作物驯化的历史,并且可以应用于作物的改良。当涉及到缺乏组蛋白或染色质结构的线粒体DNA(mtDNA)时,目前的Hi-C技术仅能作为检测结构变异的一种证据,尚不能揭示不同区域之间的空间关系。然而,最新的研究表明,2D/3D结构在细胞器基因组的转录和翻译中起着重要作用,因此,研究细胞器基因组的三维结构是了解组织、发育阶段、个体和物种之间微观进化的重要一步。

2)植物细胞器基因组中的非编码区

典型叶绿体基因组的编码区占总长度的约50%,而在植物线粒体基因组中,这一比例在10%至1%之间变化,例如S. noctiflora和L. sibirica等物种偏向于较低比例。这表明细胞器基因组中含有大量的非编码DNA(ncDNA)。植物细胞器基因组中的ncDNA主要由重复序列、细胞内转移、外源转移和未知起源的序列组成。一些研究揭示了为何这些组分被保留以及可能发挥的作用。例如,重复序列可以通过重组生成嵌合和新的开放阅读框架(ORFs),导致异常表型,如叶片网状化、杂色、生长受阻和细胞质雄性不育(CMS)。这种现象,在Silene vulgaris中以翻转的同源重组(HR)为例,可能产生新的基因,例如柑橘线粒体基因组中观察到的新的CMS基因。尽管存在广泛,但在细胞器基因组中非编码RNA(ncRNA)的功能仍然了解不足。一些ncRNA与基因表达、RNA编辑、剪接效率、转录本稳定性、翻译和核质相互作用等多种过程相关联。然而,由于预测不足,它们的功能和功能程度仍然了解不足。因此,需要更准确的预测算法和实验验证系统,特别是使用合适的编辑工具直接调查这些基因组区域。

3)细胞器基因组编辑

细胞器基因组编辑有望帮助研究人员更好地理解植物细胞功能和生物合成的遗传基础,特别是在注释不足的区域。然而,目前细胞器基因组编辑仍面临一些挑战,为了改进基因编辑技术,需要完成几个关键步骤。首先,我们需要准确而完整地获取植物线粒体基因组序列。其次,未来的研究需要探索结合位点之间间隔区域的影响。第三,我们需要收集来自关键发育阶段和组织的线粒体基因组的全面数据。此外,我们需要考虑活体三维异质性对内切酶结合位点暴露的影响。同质替代仍然是细胞器转化和基因组编辑的主要挑战之一。目前,细胞器基因组编辑仅在少数物种中进行了实验,未来应将细胞器编辑技术的应用扩展到不同的物种,以阐明不同细胞器基因的功能和分子机制。

研究总结ORIGINGENE

持续进行大量与细胞器相关的研究将有助于提高我们对植物细胞器的理解。发展线粒体基因组的分离方法和单线粒体测序技术将允许在分子内的群体水平进行调查,以及跟踪随着植物生长和发育而发生的变化。需要建立特定的组装工具和评估系统,以促进解决替代构型的准确性。长读取技术应与三维基因组学和电子显微镜结合使用,以提高解决替代构型的准确性。许多开放阅读框架(ORFs)和被忽视的非编码区域也应该更详细地研究,以了解它们在植物细胞器功能和进化中的作用。细胞器基因组编辑具有许多独特的优势。优化当前工具并开发新的特定编辑技术同样重要,以提高编辑效率,尤其是直接传递到细胞器的方法,这是在研究植物细胞器基因组时必不可少的一步。

参考文献

Wang J, Kan S, Liao X, Zhou J, Tembrock LR, Daniell H, Jin S, Wu Z. Plant organellar genomes: much done, much more to do. Trends Plant Sci. 2024 Jan 13:S1360-1385(23)00412-0. doi: 10.1016/j.tplants.2023.12.014. Epub ahead of print. PMID: 38220520.

0 阅读:0