文献分享|影响因子8.2分!中药三七线粒体全基因组揭示了多染色体构型和RNA编辑事件

元莘生物 2024-07-16 13:28:14

导语

三七(Panax notoginseng)最初由李时珍(约1518-1593年)在名为《本草纲目》的中国草药辞典中首次描述。它原产于中国西南部、缅甸和尼泊尔。从三七中分离出许多化学成分。皂苷家族中的人参皂苷Rb1是三七的主要活性成分。三七皂苷的药理作用主要是在中枢神经和心血管系统上。此外,它还具有降糖、降脂、免疫刺激、抗肿瘤和抗炎活性。过去几年,人参属(Panax)的基因组学研究发展迅速。这些研究主要集中在核基因组、叶绿体基因组以及相关DNA分子标记的开发。但是,目前尚未有三七的线粒体被报道。国际生物大分子《International Journal of Biological Macromolecules》期刊上发表了一篇三七(P. notoginseng)线粒体全基因组揭示了其多染色体构型和RNA编辑事件的文章。下面,小编即将带大家仔细研读,你们准备好了吗?

文献标题:The mitochondrial genomes of Panax notoginseng reveal recombination mediated by repeats associated with DNA replication

发表期刊:International Journal of Biological Macromolecules

影响因子:8.2

发表时间:2023.08

研究思路

主要研究结果

1. 三七线粒体基因组的组装

Illumina平台共获得41,340,844个clean reads,总长度为5.37 Gb,Nanopore平台共获得652,246个clean reads,总长度为5.35 Gb。使用GetOrganelle软件组装获得了一个unitig图,由126个contigs组成,长度在114 ~ 51,920 bp范围内,总长度为745,225 bp,平均覆盖度在70 x左右。然后,使用Bandage软件手动删除三七(P. notoginseng)叶绿体来源的unitig。得到的结果图对应于P. notoginseng线粒体DNA的分支多基因组结构。使用Unicycler软件同时利用短reads和长reads组装了线粒体基因组,获得了7个环状序列(CM1、CM2、CM3、CM4、CM5、CM6和CM7),总长度为661,779 bp。从GetOrganelle的分支unitig图中推断P. notoginseng的mtDNA包含许多构象,而Unicycler的结果表明主要构象是七个环状分子。最后,为了对P. notoginseng线粒体基因组进行说明性展示,基于Unicycler产生的七个环状序列,在unitig图中手动解决了DBS。在此过程中,发现七个环状分子中的六个(CM1, CM2, CM3, CM5, CM6和CM7)共享852 bp的序列(PNCR)。此外,CM2和CM4共享另一个2253 bp的序列(R45)。然后,将所有七个环状序列合并,得到一个“主环”。

2. 重复序列介导的同源重组

多重结构由一个“主环”和多个“亚环”通过重复介导的重组相互转换组成。为了研究分子内和分子间的重组,利用BLASTN对三七线粒体DNA的七个亚环序列进行了比较。在剔除自我比对的结果后,发现了64对高得分配对(high- score pair, HSP)序列,包括分子间和分子内HSP序列组成。将Nanopore长reads映射到与重复序列相关的构象序列上,结果显示,57个分子间和10个分子内的HSP序列可以介导重组,且存在各种重复序列的组合可以介导重组形成主环。首先,CM2和CM4可以通过由R45介导的重组形成一个环。而CM3和CM6可以通过由R56介导的重组形成一个环。通过R47介导的重组,由CM2和CM4形成的环,以及CM5可以形成一个环。继续这种模式,由CM2、CM4和CM5围成的环可以通过由R23介导的重组进一步与CM1形成一个环。同样,由CM3和CM6形成的环可以通过由R64介导的重组与CM7结合。最后,由CM2、CM4、CM5和CM1组成的环和由CM3、CM6、CM7组成的环可以通过由R63介导的重组形成主环。

3. 三七线粒体基因组特征

对三七的线粒体基因组进行了注释,获得了56个基因,包括34个线粒体蛋白编码基因(PCGs)、三个rRNA和19个tRNA基因。在这些PCGs中,一些基因具有多个外显子。四个PCGs(nad1、nad2、nad5和nad7)包含五个外显子,nad4包含四个外显子,而cox2和ccmFC则包含两个外显子。在9个伞形目植物的线粒体基因组序列中发现了被子植物线粒体基因组的可变基因。除了三七外,Sdh3在其他四个物种中均缺失。特别的是,在所有伞形科物种中都缺失了rpl2、rps2和rps11。

4. SSRs和串联重复序列

重复序列在植物线粒体基因组的演化中发挥着重要作用。SSRs(简单序列重复)由1到6个碱基对长的短序列单元组成,并呈串联排列。在三七(P. notoginseng)的线粒体基因组中鉴定出了总共169个SSRs,其中四核苷酸重复序列最为丰富,在九个伞形目物种的线粒体基因组中发现了65到404个SSRs,其中四核苷酸重复序列和六核苷酸重复序列最为丰富和稀少。SSRs的总数与这些线粒体基因组的大小呈正相关,表明重复序列的扩增可能导致线粒体基因组的增大。在四个人参属(Panax)线粒体基因组中,平均SSRs数量为154个,而在三七的线粒体基因组中发现了404个SSRs,比其他四个人参属物种线粒体基因组的总和多出两倍以上。

5. MTPTs和NUMTs的鉴定

MTPTs是可能从叶绿体转移到线粒体基因组的DNA片段。相比之下,NUMTs是可能从线粒体基因组转移到核基因组的DNA片段。在三七(P. notoginseng)线粒体基因组中发现了12个MTPTs。这些MTPTs的总大小为20,632 bp,大约占线粒体基因组总长度的3.11%,叶绿体基因组总长度的13.22%。最长的MTPT片段为4831 bp,位于线粒体基因组的323,915 bp到328,745 bp位置。它包含了六个叶绿体基因的完整编码序列,命名为psbC、psbD、trnD-GUC、trnE-UUC、trnD-GUC和trnY-GUA。与12个MTPTs相比,在线粒体基因组中发现了1835个NUMTs。尽管这些片段的起源有待确定,但这些观察结果表明了在三七中线粒体、叶绿体和核DNA之间存在广泛的交换。

6. 系统发育分析

从八个伞形科物种和两个外群物种提取了24个核心线粒体蛋白编码基因的核苷酸序列。利用ML和BI方法构建了利用上述序列的系统发育树。大多数系统发育树节点的Bootstrap支持值大于80,后验概率为1,表明由24个共同的线粒体PCGs揭示的系统发育关系具有很强的可靠性。西洋参(P. quinquefolius)的系统发育位置上存在一些不一致。在基于叶绿体序列的树中,西洋参(P. quinquefolius)与长白山人参(P. ginseng)聚类在一起。相反,在基于线粒体序列构建的树中,它与越南参(P. vietnamensis)和三七(P. notoginseng)被聚类在一起。

研究总结

三七(P. notoginseng)的完整线粒体基因组成功地利用Illumina和Nanopore测序技术组装完成。线粒体基因组呈现出多部件结构,通过64对重复序列介导的重组,在“主环”和大量“亚环”之间进行转换。在多部件结构中,有七个亚环得到了最佳支持。其中六个亚环共享一个名为PNCR的852 bp重复序列,为植物线粒体基因组中重复介导的重组模式提供了更深入的洞察。总之,该研究对三七线粒体基因组的一般特征、重复序列和MTPT的特征,RNA编辑位点的预测以及系统发育分析将为理解人参物种的进化奠定基础。

参考文献

Yang H, Ni Y, Zhang X, Li J, Chen H, Liu C. The mitochondrial genomes of Panax notoginseng reveal recombination mediated by repeats associated with DNA replication. Int J Biol Macromol. 2023 Dec 1;252:126359. doi: 10.1016/j.ijbiomac.2023.126359. Epub 2023 Aug 22. PMID: 37619687.

0 阅读:1