生信分析、meta分析、数据挖掘
TCGA、GEO、SEER、Oncomine

基因富集工具总共有几个?

会不会还有小伙伴问什么是基因富集啊?以前不知道没关系,你只要知道对科研很重要就好了,具体也可以看前几天推了一篇说起基因富集:它比DAVID更新更快,更傻瓜

但小编白痴地以为只有几个软件可以用来做富集分析。然鹅,不搜不知道,一搜吓一跳,截至2009年,富集分析工具就已经有68个了。口说无凭,上证据↓↓

Huang, D.W., B.T. Sherman and R.A. Lempicki, Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Res, 2009. 37(1): p. 1-13.

微信后台回复“富集”,原文发给你哦)


一、摘要

    曾经的基因功能研究,往往都是一两个基因,研究模式较为简单。随着测序技术的发展,各种组学的突飞猛进,目前已知的功能基因数量很多。因此富集分析工具也越来越多,在本研究时已有68个生信富集分析的工具

    富集分析软件根据基础算法大致可以分为三类:singular enrichment analysis (如:SEA),gene set enrichment analysis (如:GSEA),和 modular enrichment analysis (如:MEA)。

    由于工具较多,对于研究者来说对理解每个软件的算法和优缺点比较困难,因此本文在于帮助研究者根据需求选择富集分析工具。


二、背景介绍

 


    高通量测序时代,使得整体研究分析全基因组的基因成为可能,如此一来,就会产生大量感兴趣的基因。从感兴趣的基因组中筛选有意义的基因也成为一件十分富有挑战的事情。

    好在有GO数据库和其他一些富集分析软件的出现,从2002年到2003年间DAVID、EASE等软件出现、2005年14个类似的软件出现,到现在大约一共有68个富集分析的软件。

    目前对于研究者而言因为富集分析没有统一的方法、也没有黄金标准,因此存在以下几点问题。

  1. 对已有的工具选择越来越难

  2. 理解和比较各个软件的算法越来越难

  3. 由于软件太多,好的软件和算法容易被忽略

  4. 容易导致重复性工作

  5. 找到最合适的工具太难

三、公开的富集分析工具



富集分析主要包括三部分:数据注释、数据挖掘和结果展示。

传统的富集分析主要依赖于经典统计学方法,例如卡方检验、Fisher检验、二项检验、超几何检验等。

 
根据其基础算法主要可以分为三类:singular enrichment analysis (如:SEA),gene set enrichment analysis (如:GSEA),和 modular enrichment analysis (如:MEA)。

SEA:主要特点在于需要用户提前制定感兴趣的基因集,DAVID、GoStat等。

GSEA:不需要提前制定感兴趣的基因集,主要用于转录组数据,根据实验组和对照组计算差异来得到感兴趣的基因。

MEA:核心仍然是SEA的原理,但会将基因和基因的关系考虑进入富集分析p值的计算。

 

四、目前仍存在的问题和挑战


1. Realistically positioning the role of enrichment P-values in he current data-mining environment

2. Understanding the limitation of multiple testing correction on enrichment P-values

3. Cross-comparing enrichment analysis results derived from multiple gene lists

4.Setting up the ‘right’ gene reference background

5.Extending backend annotation databases

6.Efficiently mapping users’ input gene identifiers to the available annotation

7.Enhancing the exploratory capability and graphical Presentation

8.Evaluating the analytic capability of new enrichment tools

9.Choosing the most appropriate enrichment tools from the various choices


今天就分享这么多,希望大家能够有所收获。


更多生信知识,可以点击左下方“阅读原文”到生信人论坛和大家一起讨论成长

生信人


生信人成立于2014年,由老祝,鑫仔,helen等组建,他们都来自同一个学校:哈尔滨医科大学,更来自同一个寝室,他们是国内最早一批专攻生物信息学专业的学生,他们希望能最大限度降低跨专业的生信学习门槛,开发一系列零编程的可视化软件,助力医学科研

也许你还想看↓↓

科学自由共享

投稿请扔至:freescience@zju.edu.cn

未经许可 不得转载

长按二维码关注

赞(0) 打赏
未经允许不得转载:医学SCI科研之家 » 基因富集工具总共有几个?
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

meta分析、生信分析

meta、生信交流群综合科研交流群