生信分析、meta分析、数据挖掘
TCGA、GEO、SEER、Oncomine

说起基因富集:它比DAVID更新更快,更傻瓜

比如你拿临床样本做了不同的处理,然后想测序下发现差异表达的基因,比如你从GEO等公共数据库里下载了差异基因,想整点思路,但往往一下子变化都是几百几千个基因,反而不知道怎么入手研究了。这时候我们可以去想这些差异表达的基因会聚集在哪些通路,以提示我们进一步研究方向。


发展到现在,许多基因的功能已经被注释出来,包括基因产物的亚细胞定位、参与的生化途径、与某类疾病的相关性等等。这时候,我们只要去统计,差异基因的哪一些功能总是被注释出来,就可以发现表达量差异和生物学意义之间的关系了。


过去,经典的功能注释及功能聚类分析用的是由NIH支持开发的DAVID网站, 不过呢……今时今日就不推荐用了。理由?在基因组学日新月异的时代,你看看他们的更新频率……NTMZDW……


这里我要安利另外一个时下流行的网站Metascape!

光看这界面,就比DAVID清爽许多。一上来就告诉你把差异基因列表贴进去,然后选是哪个物种,然后再提交就基本完事大吉,坐等收图了。


Metascape的最大优势是颜值高(大雾——)数据库更新勤快,有专门的团队在维护,同时可以自己清楚地选定到底要拿哪个数据库比如GO、KEGG或者Reactome等的东西去做分析,或者任意多个混起来都可以。然后做出来的图颜值确实高啊,直接就是满足发表质量的PDF或者SVG。比如下面就是我拿自己的数据整出来的,数据库选的是GSEA(Hallmark gene sets)。


由于使用起来实在太简单,如果一开始不知道几个选项卡中的Annotation、Membership和Enrichment是什么意思,就去网页右上角点击下载一个short guide看一眼就知道了。不过可以直接告诉大家的是,像上面我专门挑GSEA作为唯一注释数据库的方法,就是去Enrichment里面点Hallmark gene sets。


同时,metascape团队还开发了excel插件,完全摸清了小白用户的心理。


本文参考于知乎, 作者:吴思涵,可点击阅读原文

END

科学自由共享

投稿请扔至:freescience@zju.edu.cn

未经许可 不得转载

长按二维码关注

赞(0) 打赏
未经允许不得转载:医学SCI科研之家 » 说起基因富集:它比DAVID更新更快,更傻瓜
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

meta分析、生信分析

meta、生信交流群综合科研交流群