报告解读|转录组+代谢组联合分析(2)-相关性分析和多元统计模型

元莘生物 2024-08-13 09:55:10

小伙伴们,大家好!在上期的内容中,我们为大家展示了转录组+代谢组联合分析中的PCA的比较分析和KEGG关联分析环节。今天,让我们来看看转录组+代谢组联合分析报告中的另一关键部分——相关性分析和多元统计模型吧~

一、 差异基因和差异代谢物的相关性分析

注:相关性分析要求生物学重复数量和样本来源一致!建议生物学重复 N≥6,样本数越多相关性越准确。

1. 相关性分析层次聚类热图

图1 差异基因与差异代谢物 Spearman 相关性分析层次聚类热图

注:层次聚类热图中每一行表示一个有KEGG ID的差异基因,每一列表示一种有KEGG ID的差异代谢物。左侧树杈表示对有KEGG ID差异基因进行聚类的结果,上侧树杈表示对有KEGG ID差异代谢物进行聚类分析的结果。聚类出现在同一个 cluster 的显著性差异代谢物或者差异的基因具有相似的表达模式。相关系数 r 以颜色来表示。r>0 表示正相关,以红色来表示,r<0 表示负相关,以蓝色来表示,颜色越深表示相关性越强。

二、转录组和代谢组的O2PLS分析

O2PLS(Two-way Orthogonal Partial Least Squares)考虑了两个数据集,并在联合、特定和残差部分中分解。首先将差异基因和差异代谢物进行log2处理和标准化。然后通过交叉验证选取最适组分数量进行O2PLS建模分析。最后获取建模之后的两个组学的载荷值,绝对值越大说明关联性越大。以散点图的形式进行展示。

通过O2PLS分析可以寻找出两个组学比较相关联的差异基因和差异代谢物,为之后的研究提供新的思路。1. O2PLS转录组载荷图

图2   O2PLS转录组载荷图

注:图形中横坐标表示第一关联分量,纵坐标表示第二关联分量。最外圈的表示关联性越强。对此颜色标注了两个分量绝对值之和的前50个基因。

2.O2PLS代谢组载荷图

图3 O2PLS代谢组载荷图

注:图形中横坐标表示第一关联分量,纵坐标表示第二关联分量。最外圈的表示关联性越强。对此颜色标注了两个分量绝对值之和的前50个基因。

3.两组学O2PLS前50载荷图

通过载荷图判断不同数据组中权重和稳定性都比较高的变量,表明这些变量的变化对另一组学的扰动更加剧烈。

图4 两组学O2PLS前50载荷图

注:图形中横坐标表示第一关联分量,纵坐标表示第二关联分量。最外圈的表示关联性越强。对此颜色标注了两个不同组学前50的数据,蓝绿色表示转录组学,粉色表示代谢组学。每个点到原点的距离意味着该变量对模型的贡献权重,距离越远,则代表该变量对模型的贡献权重越大;颜色表示变量贡献的稳定度,颜色越靠近两端,表示变量的贡献度越稳定。

0 阅读:0