蛋白质组学

【R方差分析】蛋白质表达量多组比较

初始数据类似:
image.png
蛋白质组数据虽不是严格的正态分布,但目前最常用的检验方法还是T检验(两组比较)和方差分析(多组比较)。这个话题值得深究,这里不展开。

主要是求多个蛋白的Pvalue值或FDR,用于差异筛选。

Pvalue <- c()
type<-factor(c(rep("S01CC",3),rep("S11SC",3),rep("S12CC",3),rep("S12SC",3)))

for(i in 1:nrow(exp)){
  if(sum(exp[i,1:3])==0 && sum(exp[i,4:6])==0 && sum(exp[i,7:9])==0 && sum(exp[i,9:12])==0){
    Pvalue[i] <- "NA"
  }else{
    y=aov(as.numeric(exp[i,1:12]) ~ type)
    Pvalue[i]<-summary(y)[[1]][,5][1]
    # Pvalue[i]<-summary(y)[[1]][,"Pr(>F)"][1]
  }
}

FDR=p.adjust(Pvalue, "BH")
out<-cbind(exp,Pvalue,FDR)             
write.csv(out,"anova_out.csv",row.names = T)
(0)

热评文章

发表评论