文献分享|影响因子8.2分!中药当归首个完整线粒体基因组的组装与比较分析

元莘生物 2024-08-14 10:08:27

独活是当归家族的一员,被广泛用于治疗风湿痛等疾病。近年来的药理研究表明,它具有多种生物活性,包括抗肿瘤、消炎和镇痛等特性。然而,当归物种的 mtDNA 仍相对缺乏研究。为了填补这一空白,有学者对当归(A. biserrata)的线粒体基因组进行了测序和组装,以揭示其遗传机制和进化途径。近日,关于该研究的成果发表在了国际生物大分子《International Journal of Biological Macromolecules》期刊上。下面小编即将带大家仔细研读这篇文章,你们准备好了吗?

文献标题:Assembly and comparative analysis of the first complete mitochondrial genome of a traditional Chinese medicineAngelica biserrata(Shan et Yuan) Yuan et Shan

发表期刊:International Journal of Biological Macromolecules

影响因子:8.2

发表时间:2024.02

研究思路

研究结果

1. 当归线粒体基因组的多分支构想

利用 Nanopore 数据对当归(A. biserrata)的整个线粒体基因组(不包括重复区)进行了测序。当归的线粒体基因组结构复杂,具有多分支构象。它由六个环状的contigs组成,基因组的总大小为 228,775 bp,GC 含量为 44.76%。除去来自核基因组和叶绿体基因组的节点后,确定了 50 个节点,每个节点都标有不同的编号。这些节点通过线条相互连接,并对重叠区域进行了适当的排列。红色节点表示预测的重复区域,绿色节点表示从叶绿体基因组整合到线粒体基因组的同源片段。对当归线粒体基因组进行了进一步注释,发现共有 35 个不同的蛋白质编码基因、16 个 tRNA 基因和 3 个 rRNA 基因。在 35 个蛋白编码基因中,24 个被认为是核心基因,11 个是非核心基因。这 24 个核心基因包括 5 个 ATP 合成酶基因、9 个 NADH 脱氢酶基因、4 个泛醌细胞色素 c 还原酶基因、三个细胞色素 c 氧化酶基因、一个转运膜蛋白、成熟酶和一个细胞色素 c 生物发生基因。非核心基因包括三个核糖体大亚基、七个核糖体小亚基以及一个琥珀酸脱氢酶基因。

2. 当归线粒体与其他五种伞形目物种的比较

为了进一步探究当归线粒体基因组的进化特征,将其与其他5个伞形目物种(细叶旱芹、北柴胡、新疆阿魏、人参和防风)进行了比较。这六种伞形目植物线粒体基因组编码区的 GC 含量从 44.55 % 到 45.44 % 不等。值得注意的是,这6种伞形目植物的线粒体基因组中GC含量基本一致,但基因数量差异较大。人参的线粒体基因数量最多(58个),而新疆阿魏的线粒体基因组基因数量较少(27个)。在6个物种中鉴定了11个共同基因(atp4、ccmB、ccmFC、ccmFN、cox3、matR、nad3、nad7、nad9、rps12、rps7),并利用它们构建了系统发育树。有趣的是,当归和防风之间进化关系较近。分析 6 种伞形目物种中 11 个共有基因的突变位点,构建了单倍型网络,人参表现出最典型的单倍型组成,而当归、细叶旱芹、北柴胡、新疆阿魏和防风在这11个基因中具有相同的变异。

3. 相对同义密码子使用率分析

在当归完整的线粒体基因组中,共发现了 10,261 个编码蛋白质基因的密码子。当归的线粒体 DNA 编码所有 20 种氨基酸,共 61 种不同类型的氨基酸密码子,频率最高的密码子是 UUU。在 20 种氨基酸中,亮氨酸的密码子数量最多,有 1072 个密码子(占总数的 10.44%),其次是丝氨酸,有 943 个密码子(占总数的 9.19%),而半胱氨酸的密码子数量最少,只有 146 个(占总数的 1.42%)。除了 AUG(蛋氨酸)和 UGG(色氨酸)之外,大多数氨基酸的密码子使用模式都表现出偏向性。

4. 重复片段和 RNA 编辑事件预测

在当归线粒体的6 个contigs中共鉴定出 43 个简单序列重复序列(SSR),它们分布在不同的染色体上。这些 SSR 在染色体上的分布情况如下:1 号染色体上有 10 个 SSR,2 号染色体上有 14 个 SSR,3 号染色体上有 8 个 SSR,4 号染色体上有 4 个 SSR,5 号染色体上有 5 个 SSR,6 号染色体上有 2 个 SSR。在分析 1 号染色体和 2 号染色体上的 SSR 时发现,50% 的 SSR 由单体和二聚体重复序列组成,3 号染色体和 4 号染色体上分别有 37.5% 和 75% 的 SSR 由单体和二聚体重复序列组成。此外,4 号染色体上 60% 的 SSR 由四个单位的重复序列组成。且6个contigs中含有大量的串联重复序列和96个分散重复序列,包括回文重复,正向重复和反向重复,最长的回文和正向重复序列分别为454bp和74bp,最短的回文和正向重复序列分别为36bp和34bp。

检测当归线粒体基因组中 35 个不同的蛋白编码基因(PCGs)的 RNA 编辑位点,以深入了解线粒体基因组内的基因表达。在编辑位点共发现了 474 个 RNA 编辑事件,主要涉及核苷酸 C 到 T(U)的转换。值得注意的是,在所有线粒体基因中,ccmFN 基因的 RNA 编辑次数最多,共发现 39 个 RNA 编辑位点。mttB 基因有 35 个 RNA 编辑位点。此外,rpl10、rps13 和 sdh4 基因各有一个 RNA 编辑位点。这些 RNA 编辑事件导致了氨基酸的变化,且大多涉及疏水氨基酸的转换,这有助于提高蛋白质的稳定性。

5. 细胞内基因从叶绿体转移到线粒体

在高等植物的进化过程中,细胞内遗传物质的转移是线粒体基因组中常见的现象。但值得注意的是,这些源自叶绿体细胞器的序列片段的保存率相对较低。因此,对当归中从叶绿体到线粒体细胞器的序列迁移进行了分析。通过序列相似性分析,发现了叶绿体基因组和线粒体基因组之间共有 13 个同源片段,比对长度从 55 到 4349 bp 不等。这些片段中的错配数目从 0 到 46 不等。这些同源片段的总长度为 7914 bp,约占当归线粒体 DNA 的 3.46%。我们将这些片段称为 MTPT,它们代表了从叶绿体到线粒体细胞器的序列迁移。在这 13 个同源片段中,MTPT 13 是最大的,长度为 4349 bp。对这些同源序列进行了注释,并确定了6个完整的基因,其中包括1个蛋白质编码基因(petD)和5个 tRNA 基因(trnD-GUC、trnH-GUG、trnI-CAU、trnN-GUU 和 trnW-CCA)。值得注意的是,当归叶绿体基因组中的 petD 基因为细胞色素 b/f 复合物的亚基做出了贡献,而5个 tRNA 基因可能已经丢失或在叶绿体基因组中发生了假基因变化。

6. 当归和其他六个伞形目物种的共线性分析

使用 BLASTN 程序比较了当归和其他伞形目植物的同源基因及其序列排列顺序。确定了长度超过 500 bp 的保守共线性区块进行分析。为了更好地说明比对结果,还保留了长度超过 0.5 kb 的比对区块。结果表明,当归和其他6个伞形目物种有许多同源共线性区块,尽管这些区块的长度相对较短。值得注意的是,在当归和防风的同源共线区块中发现了 49 个保守基因,同一性超过 99%。此外,一些序列为当归线粒体所独有。线粒体基因组之间的排列顺序也不一致。有 7 个物种经历了多次基因重排,导致共线区块变短。这表明,虽然这 7 个 伞形目物种的有丝分裂基因组在排列顺序上表现出高度的保守性,但它们也经历了频繁的基因重组。

7. 基于PCGs的系统发育树构建

我们根据被子植物中四个不同目(伞形目、川续断目、菊目和茄目)共 27 个物种的 19 个保守 PCGs 的 DNA 构建了一棵最大似然树。基于线粒体 DNA 的系统发生的总体结构与被子植物系统发生(Angiosperm Phylogeny Group,APG)的最新分类一致。系统发育研究结果表明,当归属于伞形目目,代表了一个相对较新的分化。此外,还发现了当归和防风关系密切,这一结果与之前的一项研究结果一致。

研究总结

该研究成功地测定了当归的线粒体基因组,揭示了基因组中独特的多分支构象。当归的线粒体基因组中GC含量通常与其他五个伞形目物种相似,Ka/Ks比值表明atp4和matR基因受到正选择的影响。当归线粒体基因组和叶绿体基因组细胞间基因转移和共线性的存在反映了基因重排和重组。RNA编辑事件表明,大多数亲水性氨基酸转变为疏水性氨基酸,从而提高了蛋白质结构的稳定性。系统发育树结构对当归在伞形目中的分类地位做出了解释,并显示了当归与防风之间密切的关系。总之,细胞器基因组信息可以阐明植物之间的系统发育关系,并可用于分子标记和遗传进化研究的开发。

0 阅读:0