多组学数据库|黄瓜多组学集成数据库

元莘生物 2024-07-22 13:19:49

黄瓜(Cucumis sativus L.)是一种重要的蔬菜作物,是葫芦科植物遗传学和基因组学研究的重要模型,特别是在植物性别决定和维管发育研究中。作为蔬菜作物中第一个被测序的基因组,黄瓜参考基因组已成为比较基因组学和遗传学研究的重要遗传资源。此前,使用PacBio长读数据生成的最新黄瓜品种中国长黄瓜参考基因组(CLv3.0)是不完整的,这种低组装完整性(约62%)主要是由于黄瓜中异染色质卫星序列和核糖体DNA序列的比例高达约30%,而其他物种如拟南芥、水稻、玉米和西瓜的比例低于5%。因此,基于测序技术的进步,组装接近完整的黄瓜参考基因组,促进黄瓜遗传资源研究,构建黄瓜多组学数据库迫在眉睫。近日,《Molecular Plant》期刊上发表了一篇名为“A near-complete cucumber reference genome assembly and Cucumber-DB, a multi-omics database”的文章,公布了黄瓜第一个近完整参考基因组(CLv4.0),并整合泛基因组、群体变异组、转录组以及核心种质材料信息,建立了第一个黄瓜多组学综合数据库Cucumber-DB(http://www.cucumberdb.com/),可为黄瓜功能基因组学和分子育种研究提供全面的共享平台。

文献标题:A near-complete cucumber reference genome assembly and Cucumber-DB, a multi-omics database

发表期刊:Molecular Plant

影响因子:17.1

发表时间:2024.01.20

数据库访问地址:http://www.cucumberdb.com/

数据库概览

Cucumber-DB数据库内容及功能

Cucumber-DB是一个多组学数据库,集成了广泛的基因组学和转录组学数据。该综合数据库包括三个主要数据集和工具:

(1)黄瓜基因组组装和注释:除CLv4.0组装外,Cucumber- db还提供了11个具有代表性的黄瓜基因组组装,包括3个野生物种和8个栽培品种。这些数据集提供了基因组序列、基因结构和功能注释,并且可以通过JBrowse浏览器访问,以便于可视化。

(2)黄瓜变异:以CLv4.0基因组为参照,从115份核心种质的公开重测序数据中鉴定出863万个SNP和180万个InDels。此外,通过将11个代表性基因组与CLv4.0基因组比对,我们检测到13,551个SV。这些变异可以查询和显示用户定义的目的,帮助开发新的标记遗传精细定位。该数据库还确定了在黄瓜驯化和分化过程中选择的重要基因组区域进行系统发育分析。

(3)黄瓜转录组:利用CsRTD1和广泛的ssRNA-seq数据,建立了全面的基因表达图谱。此外,该数据库还包括一个用户友好的eFP查看器来显示空间和应激反应基因表达模式,这有助于缩小候选基因的位置克隆。

总之,Cucumber-DB是一个开放获取的多组学数据库,专为黄瓜研究设计。该平台精心构建,旨在通过无缝整合多种组学数据集来促进和加速正向遗传学和反向遗传学的研究。此外,它还包含一整套分析工具,以帮助科学界识别功能基因,从而改进黄瓜品种。为了确保平台的有效性,Cucumber-DB将定期更新,以纳入新发布的组学数据。

参考文献

Guan J, Miao H, Zhang Z, Dong S, Zhou Q, Liu X, Beckles DM, Gu X, Huang S, Zhang S. A near-complete cucumber reference genome assembly and Cucumber-DB, a multi-omics database. Mol Plant. 2024 Jun 20:S1674-2052(24)00192-8.doi:10.1016/j.molp.2024.06.012. Epub ahead of print. PMID: 38907525.

0 阅读:3