基因编辑新突破!Cell|AI算法解锁精神疾病遗传密码,精准定位“书中的错乱章节”

新浪财经 2024-10-25 20:25:19

转自:生物谷

想象一下,人类基因组就像一本庞大的说明书,里面包含了30亿个碱基对。这不仅仅是一份关于如何构建人体的指南,它还记录了疾病的发生以及我们的进化历程。这些碱基对就像是书中的字母,有时候它们会跳来跳去,换换位置——这就是所谓的重排。

有时,这种重排很简单,就像是两个字母互换了位子;但有时候,事情就变得复杂多了,比如一整段话被倒置过来,或者干脆有几行字消失了。现在我们有了读这本书的高科技工具,叫做全基因组测序(WholeGenomeSequencing,WGS),它可以很好地找到那些简单的错误,但是面对复杂的结构变异(structuralvariant,SV)时,就有点儿力不从心了。

不过别担心,斯坦福大学医学院的一群科学家们带来了好消息!他们开发了一种新方法,利用人工智能来识别WGS数据中的复杂SV。相关研究结果于2024年9月30日在线发表在Cell期刊上,论文标题为“Detectionandanalysisofcomplexstructuralvariationinhumangenomesacrosspopulationsandinbrainsofdonorswithpsychiatricdisorders”。

研究人员通过分析来自全球4000多个个体的基因组,创建了一个复杂SV的目录,并发现这类变异通常出现在大脑相关基因中,而且与精神分裂症和躁郁症等精神疾病的基因表达方式有关。

斯坦福大学的AlexanderUrban博士说:“这是一项突破性的进展,意味着我们在理解精神疾病遗传基础方面迈出了重要一步。”他比喻说,如果只寻找简单的变异,就好比校稿时只找错别字,而忽略了整个句子或段落的混乱。新的算法,名为ARC-SV(自动重建复杂结构变异算法),可以捕捉到各种DNA重排,准确率高达95%。这个算法就像是一个超级编辑,能够在送印前找出所有问题,包括重复、缺失或顺序错乱的部分。

广角下的基因组

到目前为止,我们发现的人类基因组中的大部分变异都是相对简单的。然而,新算法揭示了一个惊人的事实:每个基因组中还藏有80到100个复杂的结构变异。

Urban博士用一个生动的比喻来说明这个问题:“如果把基因组比作一本书,那么寻找简单的变异就像是在书中查找错别字。但这样可能会忽略那些句子混乱、重复或者顺序错误的情况——甚至可能错过整整半章的内容。”这些问题都需要在校对时被找出来。

这个名为复杂结构变异自动重建算法(ARC-SV)的新工具能够以95%的准确率捕捉各种DNA重排。它利用了人工智能技术,并通过分析数十个不同祖先背景下的完整人类基因组(即泛基因组)进行了训练。借助这一强大的算法,研究团队发现了超过8000种不同的复杂结构变异,这些变异的长度从200到100000个碱基对不等。许多这样的变异位于与大脑发育和功能密切相关的基因区域。

遗传学与精神疾病

研究人员进一步探讨了这些复杂变异是否与精神疾病有关。他们特别关注了两种常见的精神疾病:精神分裂症和躁郁症。

虽然全基因组关联研究(GWAS)已经确定了许多与这些疾病风险相关联的基因位置,但它们提供的信息还不够具体,不足以明确地解释遗传风险或指导实际行动。

Urban博士指出,GWAS的结果就像告诉你书中有几页有问题,但却没有说清楚问题是什么或涉及到哪些单词。相比之下,了解复杂结构变异的具体情况,就好比用黄色荧光笔直接标出问题所在的句子,精准指出哪些单词是乱码或重复的。

为了验证ARC-SV算法的效果,研究者们结合了来自健康人以及患有精神分裂症或躁郁症患者的上百份脑组织样本的全基因组序列和基因表达数据。结果显示,很多复杂结构变异都位于之前由GWAS确定的风险区域附近,而且它们确实影响了周围基因的表达方式。这表明这些变异可能是导致疾病的潜在因素之一。

论文共同通讯作者BoZhou博士说,“对复杂结构变异的识别和研究将使我们对DNA的变化方式有更多的了解,并将为探索疾病发生机制及其治疗提供了宝贵的线索。”

参考资料:

BoZhouetal.Detectionandanalysisofcomplexstructuralvariationinhumangenomesacrosspopulationsandinbrainsofdonorswithpsychiatricdisorders.Cell,2024,doi:10.1016/j.cell.2024.09.014.

(转自:生物谷)

0 阅读:2