如何优雅的使用R语言下载GEO数据库表达矩阵

如何优雅的使用R语言下载GEO数据库表达矩阵

phil 0 2024-12-05

背景

GEO数据库很多表达矩阵需要我们下载平台的探针注释文件,再得出基因表达矩阵。

如何优雅的使用R语言快捷的下载出来呢?

国外友人开发了geneExpressionFromGEO包。

使用方法

library(geneExpressionFromGEO)
library(limma)
library(GEOquery)

GSE="GSE3268"
af <- getGeneExpressionFromGEO(GSE,retrieveGeneSymbols=T,verbose=T)
af=t(af)
colnames(af)=af[nrow(af),]
af=t(af)
af=avereps(af)
af=af[,-ncol(af)]
afmt=rbind(ID=colnames(af),af)
write.table(afmt,file="matrix.txt",sep="\t",quote=F,col.names = F)

将以上的GSE3268替换为你需要的gse数据集号,就可以直接下载出来了。

后记

不过值得注意的是该R包仅适用于

Platforms available: GPL11532, GPL23126, GPL6244, GPL8300, GPL80, GPL96, GPL570, GPL571, GPL20115, GPL1293, GPL6102, GPL6104, GPL6883, GPL6884, GPL13497, GPL14550, GPL17077, GPL6480

等特定的平台,期待该包后续的升级更新了。