哈佛大学——差异表达分析(十四)Time course analysis

  • Post author:
  • Post category:其他




学习目标

用DESeq2讨论时程分析(time course analyses)



用LRT进行时程分析

尽管基因表达的静态测量很流行,但生物过程的时程捕获对于反映它们的动态本质是至关重要的,特别是当模式很复杂,而不是简单的上升或下降时。在处理这类数据时,**似然比检验(LRT)**特别有用。我们可以使用LRT来探究一系列时间点之间是否存在显著差异,并进一步评估在不同样本类别之间观察到的差异。

例如,假设我们有一个实验,观察随着时间的推移,对两种不同基因型的小鼠的治疗效果。我们可以为我们的“完整模型”使用一个设计公式,该公式将包括我们数据中主要的变异来源:

genotype

,

treatment

,

time

和我们主要感兴趣的条件,也就是随着时间的推移处理效果的差异(

treatment:time

)。


注意

:这只是我们假设实验的示例代码。

您不需要运行此代码

full_model <- ~ genotype + treatment + time + treatment:time

为了进行LRT检测,我们还需要提供一个简化模型,即完整模型下没有

treatment:time

:

reduced_model <- ~ genotype + treatment + time

然后,我们可以使用以下代码运行LRT:

dds <- DESeqDataSetFromMatrix(countData = raw_counts, colData = metadata, design = ~ genotype + treatment + time + treatment:time)

dds_lrt_time <- DESeq(dds, test="LRT", reduced = ~ genotype + treatment + time)

为了了解哪种基因表达模式会被识别为差异表达,我们在下面举几个例子。在下面的图中,x轴是基因表达,y轴是时间。在这个数据集中,每个时间点有两个样本,一个经过了某种处理(红色),另一个没有经过某种处理(蓝色)。

在这张图中,我们描述了

不会被识别为差异表达的基因类型

。在这里,我们观察到GeneX在时间点之间的表达存在差异,但在处理组之间的表达模式没有差异。

在这里插入图片描述

我们期

待LRT返回的基因表达模式

类型是那些随着时间的推移表现出治疗效果不同的基因。在下面的例子中,GeneX在两个处理组中显示了不同的表达模式。

在这里插入图片描述

继续我们的示例数据集,在运行LRT之后,我们可以使用

padj

< 0.05的阈值来确定重要基因集。下一步是根据相同的表达模式对这些基因进行分组,我们可以使用

degPatterns()

来完成这项工作。在这里,你会注意到我们使用了

col

参数,因为我们有两组,我们在互相比较。

clusters <- degPatterns(cluster_rlog, metadata = meta, time="time", col="treatment")

根据数据中存在的共享表达谱类型,然后可以提取与感兴趣的模式相关的基因组别,并继续对每个感兴趣的基因组进行功能分析。



版权声明:本文为weixin_46585008原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。