生物信息学

GEO便捷转换器使用教程,帮你轻松处理GEO平台数据

GEO数据库中主要是四种文件格式,包括RAW.tar、Series Matrix File、MINiML formmatted family file和SOFT formmatted family file四种形式,如下图

attachments-2018-07-opSZXB4v5b46c963be75f.png

其中RAW.tar是原始未经过任何处理数据、Series Matrix File是已经标准化好的矩阵文件,GEO便捷转换器主要处理MINiML formmatted family file文件。

首先,打开GEO便捷转换器,会弹出如下一个界面

attachments-2018-07-HJx5SDUQ5b46cb32da7df.png

接下来,选择文件,这里选择之前下载好的文件,如果已经解压出来需要导入.xml文件

attachments-2018-07-froUDFso5b46eb063f530.png

导入工具中,如下图所示

attachments-2018-07-DvVRVMWQ5b46ebcc986c6.png

1:输入MINiML formmatted family file;

2:MINiML formmatted family file数据部分展示;

3:选择基因命名类型,通常选择symbol;

attachments-2018-07-Scf3Y29h5b46ec97ac385.png

4:数据转换类型,选择normalized;

attachments-2018-07-TXzL1ifM5b46ecbd9b5a4.png

5:多个探针对应同一基因时处理方法,这个根据数据要求进行选择,通常中位数;

attachments-2018-07-2VubvV145b46ed35387d3.png

6:数据集里面包含的一些临床等信息;

7:表达矩阵数据。

按照上述参数设定好后,点击导出样本信息和数据矩阵,在输入数据的目录下面会生成一个文件夹如

attachments-2018-07-mP6DAHuJ5b46ee7f635f7.png点击进入后会出现很多文件,找到MergeExpro_*.txt开头的文件就OK了,这个就是我们提取好的表达矩阵数据,同样还有一个SampleInfo_*.txt即是对应的样本信息文件。

attachments-2018-07-fPnakaHH5b46f0d583fd0.png

(0)

热评文章

评论:

1 条评论,访客:1 条,博主:0 条
  1. mjl
    mjl发布于: 

    GEO芯片数据转换器在哪里下载啊

发表评论