问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

DEG聚类分析热图怎么看?

发布网友 发布时间:2022-04-25 07:12

我来回答

2个回答

热心网友 时间:2023-11-06 01:56

对于一般的统计分析,基于傻瓜式操作的SPSS(PASW)软件已经足够,但在涉及个性化要求很高的复杂数据处理时,SPSS就开始显得力不从心,这时必须依赖功能更为强大的SAS等软件。以前在自己的科研过程中分析数据多用SPSS、SAS等。在统计遗传和基因组学领域,SAS可以处理很多问题,但与此同时,SAS实现复杂问题过于麻烦,很多问题SAS也不是首选。后来开始运用R环境中的各种免费统计包,特别是Bioconctor的系列分析包,我发觉非常适合生命科学领域的研究者。R有很多优点:

(1)免费,不需要去寻找破解版,不用担心版权问题,使用非常方便;

(2)功能非常强大,单个包的功能比较有限,但多个包组合起来使用则功能无比强大,远胜于SPSS、SAS等;

(3)源代码开放,稍作修改后就能满足个性化的复杂统计分析,满足个性化需求是R的最大特点之一;

(4)程序阅读容易,再加上参考学习资料很多,上手比较容易,提高也不是很难,根据个人经验,要比SAS高级阶段的进阶容易许多;

(5)国际同行高度认同R,我发现很多专用软件都开发了软件的R版,今后R将是数据分析的主流发展方向。

R软件的安装、基本使用等初级教程就不谈了,随便在官方网站找个学习资料就搞定了。“R系列”专辑拟推出中级、高级分析教程。今天推出基因表达谱芯片的聚类分析专题。

本专题示例芯片数据来自GEO数据库中检索号为GSE11787的Affymetrix芯片的CEL文件,共6个CEL文件,3个正常对照组,3个HPS刺激组,为免疫器官脾脏的表达数据。

(一)原始数据的读入、RNA降解评估和标准化

> pd <-read.AnnotatedDataFrame("Target.txt",header=TRUE,row.names=1,as.is=TRUE)
>rawAffyData <- ReadAffy(filenames=pData(pd)$FileName, phenoData=pd)
> summary(exprs(rawAffyData))
> deg <- AffyRNAdeg(rawAffyData)
> plotAffyRNAdeg(deg,col=c(1,2,3,4,5,6))



> eset <-rma(rawAffyData)
> summary(exprs(eset))



> op <-par(mfrow=c(1,2))
>cols <- brewer.pal(6, "Set3")
>boxplot(rawAffyData,col=cols,names=1:6, main ="unnormalized.data")
>boxplot(data.frame(exprs(eset)) ,names=1:6, main ="normalization.data", col="blue", border="brown")
>par(op)



(二)聚类分析

原始数据读入,经AffyBatch目标转成ExpressionSet目标后,为提高后续分析(如差异表达基因的检测)的统计功效,往往需要进一步经过Detection CallFilter和IQR filter等过滤(“基因芯片数据的特异性过滤与非特异性过滤”将在另一专题里专门讨论)。

需要说明的是,常规做法是先筛选出差异表达基因,然后只用差异表达基因进行聚类分析(本示例直接用了过滤后的数据集,聚类图的效果稍差一点)。

(1)样本聚类

>dd <-dist2(log2(exprs(eset2)))
>diag(dd) <- 0
>dd.row <- as.dendrogram(hclust(as.dist(dd)))
>row.ord <- order.dendrogram(dd.row)
>library("latticeExtra")
>legend <- list(top = list(fun = dendrogramGrob,
args = list(x = dd.row, side = "top")))
>lp <- levelplot(dd[row.ord, row.ord],
scales = list(x = list(rot = 90)),
xlab = "", ylab = "", legend = legend)
>plot(lp)



(2)二维聚类

>source("http://faculty.ucr.e/~tgirke/Documents/R_BioCond/My_R_Scripts/my.colorFct.R")
>mydata<-exprs(eset2)
>mydatascale <- t(scale(t(mydata)))
>hr <- hclust(as.dist(1-cor(t(mydatascale), method="pearson")),method="complete")

>hc <-hclust(as.dist(1-cor(mydatascale, method="spearman")),method="complete")
>heatmap.2(mydata,Rowv=as.dendrogram(hr), Colv=as.dendrogram(hc), col=redgreen(75),scale="row", ColSideColors=heat.colors(length(hclabels)),RowSideColors=heat.colors(length(hr labels)), trace="none", key=T)



上述聚类图一般和论文里的聚类图有点不同,聚类的模式不太直观,你也可以用下面的语句进行更直观的作图:

>mycl <-cutree(hr, h=max(hr$height)/1.5);

>mycolhc<- sample(rainbow(256)); mycolhc <- mycolhc[as.vector(mycl)]
>myc2 <- cutree(hc, h=max(hc$height)/1.5); mycolhr <-sample(rainbow(256)); mycolhr <- mycolhr[as.vector(myc2)]
>heatmap(mydatascale, Rowv=as.dendrogram(hr), Colv=as.dendrogram(hc),col=my.colorFct(), scale="row", ColSideColors=mycolhr,RowSideColors=mycolhc)



(3)MantelCorrs聚类程序

>kmeans.result<- GetClusters(eset2, 500, 100)
>x=exprs(eset2)
>DistMatrices.result <- DistMatrices(x, kmeans.resultclusters)>MantelCorrs.result<−MantelCorrs(DistMatrices.result Dfull,DistMatrices.resultDsubsets)>permuted.pval<−PermutationTest(DistMatrices.result Dfull, DistMatrices.resultDsubsets,100,16,0.05)>ClusterLists<−ClusterList(permuted.pval,kmeans.result cluster.sizes,MantelCorrs.result)
>ClusterGenes <- ClusterGeneList(kmeans.resultclusters,ClusterLists SignificantClusters,eset2)
>h=hclust(dist(MantelCorrs.result))
>plot(h)

热心网友 时间:2023-11-06 01:56

聚类分析(本示例直接用了过滤后的数据集,聚类图的效果稍差一点)。(1)样本聚类 >dd <-dist2(log2(exprs(eset2)))>diag(dd) <- 0 >dd....

热心网友 时间:2023-11-06 01:56

对于一般的统计分析,基于傻瓜式操作的SPSS(PASW)软件已经足够,但在涉及个性化要求很高的复杂数据处理时,SPSS就开始显得力不从心,这时必须依赖功能更为强大的SAS等软件。以前在自己的科研过程中分析数据多用SPSS、SAS等。在统计遗传和基因组学领域,SAS可以处理很多问题,但与此同时,SAS实现复杂问题过于麻烦,很多问题SAS也不是首选。后来开始运用R环境中的各种免费统计包,特别是Bioconctor的系列分析包,我发觉非常适合生命科学领域的研究者。R有很多优点:

(1)免费,不需要去寻找破解版,不用担心版权问题,使用非常方便;

(2)功能非常强大,单个包的功能比较有限,但多个包组合起来使用则功能无比强大,远胜于SPSS、SAS等;

(3)源代码开放,稍作修改后就能满足个性化的复杂统计分析,满足个性化需求是R的最大特点之一;

(4)程序阅读容易,再加上参考学习资料很多,上手比较容易,提高也不是很难,根据个人经验,要比SAS高级阶段的进阶容易许多;

(5)国际同行高度认同R,我发现很多专用软件都开发了软件的R版,今后R将是数据分析的主流发展方向。

R软件的安装、基本使用等初级教程就不谈了,随便在官方网站找个学习资料就搞定了。“R系列”专辑拟推出中级、高级分析教程。今天推出基因表达谱芯片的聚类分析专题。

本专题示例芯片数据来自GEO数据库中检索号为GSE11787的Affymetrix芯片的CEL文件,共6个CEL文件,3个正常对照组,3个HPS刺激组,为免疫器官脾脏的表达数据。

(一)原始数据的读入、RNA降解评估和标准化

> pd <-read.AnnotatedDataFrame("Target.txt",header=TRUE,row.names=1,as.is=TRUE)
>rawAffyData <- ReadAffy(filenames=pData(pd)$FileName, phenoData=pd)
> summary(exprs(rawAffyData))
> deg <- AffyRNAdeg(rawAffyData)
> plotAffyRNAdeg(deg,col=c(1,2,3,4,5,6))



> eset <-rma(rawAffyData)
> summary(exprs(eset))



> op <-par(mfrow=c(1,2))
>cols <- brewer.pal(6, "Set3")
>boxplot(rawAffyData,col=cols,names=1:6, main ="unnormalized.data")
>boxplot(data.frame(exprs(eset)) ,names=1:6, main ="normalization.data", col="blue", border="brown")
>par(op)



(二)聚类分析

原始数据读入,经AffyBatch目标转成ExpressionSet目标后,为提高后续分析(如差异表达基因的检测)的统计功效,往往需要进一步经过Detection CallFilter和IQR filter等过滤(“基因芯片数据的特异性过滤与非特异性过滤”将在另一专题里专门讨论)。

需要说明的是,常规做法是先筛选出差异表达基因,然后只用差异表达基因进行聚类分析(本示例直接用了过滤后的数据集,聚类图的效果稍差一点)。

(1)样本聚类

>dd <-dist2(log2(exprs(eset2)))
>diag(dd) <- 0
>dd.row <- as.dendrogram(hclust(as.dist(dd)))
>row.ord <- order.dendrogram(dd.row)
>library("latticeExtra")
>legend <- list(top = list(fun = dendrogramGrob,
args = list(x = dd.row, side = "top")))
>lp <- levelplot(dd[row.ord, row.ord],
scales = list(x = list(rot = 90)),
xlab = "", ylab = "", legend = legend)
>plot(lp)



(2)二维聚类

>source("http://faculty.ucr.e/~tgirke/Documents/R_BioCond/My_R_Scripts/my.colorFct.R")
>mydata<-exprs(eset2)
>mydatascale <- t(scale(t(mydata)))
>hr <- hclust(as.dist(1-cor(t(mydatascale), method="pearson")),method="complete")

>hc <-hclust(as.dist(1-cor(mydatascale, method="spearman")),method="complete")
>heatmap.2(mydata,Rowv=as.dendrogram(hr), Colv=as.dendrogram(hc), col=redgreen(75),scale="row", ColSideColors=heat.colors(length(hclabels)),RowSideColors=heat.colors(length(hr labels)), trace="none", key=T)



上述聚类图一般和论文里的聚类图有点不同,聚类的模式不太直观,你也可以用下面的语句进行更直观的作图:

>mycl <-cutree(hr, h=max(hr$height)/1.5);

>mycolhc<- sample(rainbow(256)); mycolhc <- mycolhc[as.vector(mycl)]
>myc2 <- cutree(hc, h=max(hc$height)/1.5); mycolhr <-sample(rainbow(256)); mycolhr <- mycolhr[as.vector(myc2)]
>heatmap(mydatascale, Rowv=as.dendrogram(hr), Colv=as.dendrogram(hc),col=my.colorFct(), scale="row", ColSideColors=mycolhr,RowSideColors=mycolhc)



(3)MantelCorrs聚类程序

>kmeans.result<- GetClusters(eset2, 500, 100)
>x=exprs(eset2)
>DistMatrices.result <- DistMatrices(x, kmeans.resultclusters)>MantelCorrs.result<−MantelCorrs(DistMatrices.result Dfull,DistMatrices.resultDsubsets)>permuted.pval<−PermutationTest(DistMatrices.result Dfull, DistMatrices.resultDsubsets,100,16,0.05)>ClusterLists<−ClusterList(permuted.pval,kmeans.result cluster.sizes,MantelCorrs.result)
>ClusterGenes <- ClusterGeneList(kmeans.resultclusters,ClusterLists SignificantClusters,eset2)
>h=hclust(dist(MantelCorrs.result))
>plot(h)

热心网友 时间:2023-11-06 01:56

聚类分析(本示例直接用了过滤后的数据集,聚类图的效果稍差一点)。(1)样本聚类 >dd <-dist2(log2(exprs(eset2)))>diag(dd) <- 0 >dd....
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
蓝靛果忍冬地理分布 盆栽种植蓝靛果注意事项 中国藏书印欣赏 藏书印一般刻什么字 ...具备拆迁资格的,开发商签订的拆迁安置房,补偿协议有效吗? 网络工程师要考哪些科目 初级网络工程师考什么 我24岁了还能长高吗,我现在看来是个娃娃脸,好多人都以为我在读高中... 在TP-LINK 54M的路由器上的复位键按了10秒 有wifi 电脑没有无线网卡 怎么让电脑通过数据线连接手机上网 worldscale rate html怎么写支付宝的种树效果 transform:rotate(180deg)JQ中的语法 百度推广的广审表是什么? 抖音小店开通FEED流账户首先充值一万吗是骗子吗? 产品的feed流是什么意思,na端是什么意思?? 如何判断一个抖音直播间有没有投feed流? 怎么解决feed流 效率低下的问题 武汉农村商业银行的客服电话为什么没有人工服务? 抖音feed流对粉丝量要求 feed流第三方归因 百度推广客户端里包含百度贴吧feed流的推广设置么? 96555是什么银行? 汉口银行家庭电话怎么填 95579是汉口银行吗 请问,为什么我的手机会出现一个提示,软件无响应,是否将其关闭,是什么意思?到底哪出了问题呀? 十一中国银行上班么?谢谢 中国邮政储蓄银行2014国庆放假安排 2014年国庆节银行放假通知,银行2014国庆节有放假吗 辽宁省开原市八宝镇河北村4组高波的残疾人保险还有吗 js点击时间间隔 用js怎么获取css3里的rotate Excel ABC列利用公式自动填充DEG列值(跳过A列空单元格)? 如何自动根据百分比生成圆 css3 js js怎么获取当前元素旋转了多少deg jQuery怎么递增 twsx3耳机如何调音量? 漫步者X3plus和TWS2哪个好 奶粉可以自制酸奶么?因为看人家都是用纯牛奶做的 怎么去除杯子里面的污垢,简单有效, 制作酸奶蛋糕没有醋也没有柠檬汁怎么办? 配方奶粉做酸奶用酸奶机怎么做? 如果做酸奶蛋糕时,家里没有醋也没有柠檬汁,可以不加吗? 自制酸奶蛋糕的做法,怎么做,如何做,图解详细步骤– 杯子水垢怎么去除? 无油酸奶蛋糕怎么做? 酸奶蛋糕的制作方法 孔明灯是什么灯? 孔明灯为什么能飞上天,和普通的灯笼相比有什么不同? 银行回收五分钱硬币吗