生信分析、meta分析、数据挖掘
TCGA、GEO、SEER、Oncomine

转录组专题-融合基因

什么是融合基因融合基因的产生及检测融合基因在医学诊断及疾病治疗上的应用融合基因的生信检测

1960年,在研究一个慢性髓细胞性白血病CML病人的癌细胞时,Nowell和David Hungerford发现了一种比正常染色体小的染色体,此病理染色体在95%的患有CML的病人体内都存在,具有很重要的病理诊断意义。由于其首先在美国费城(philadelphia)发现,此病变染色体被命名为ph染色体(费城染色体)。

左侧为正常的9号、22号染色体;右侧为变异的9号染色体、22号染色体(费城染色体)

ph染色体应该是人类结缘融合基因的开始,ph染色体是由于9号和22号染色体的两个片段相互重排拼接后的变异22号染色体,大多数情况下,其上会有一个在诊断和治疗CML都很有意义的融合基因BCR-ABL。

临床上存在Ph1和bcr/abl均阴性的CML(称为非典型CML),比例不高。

也存在Ph1+但是bcr/abl-的CML,不过其病理特征同经典的Ph1+、bcr/abl+相似度很高。

什么是融合基因

顾名思义,融合基因就是两个基因“融合”在一起。正常情况下,两个基因相隔很远互不干扰,但是由于病理的染色体重排,导致相隔很远甚至是不在同一条染色体的基因组合在一起。

这种病理组合会造成基因失调和生成“嵌合体蛋白”,从而易引发癌症。

小箭头是染色体断裂位点,中间的是融合基因,上下的是原始基因。

左图-基因失调:Gene B的编码区被置于Gene A的启动子之后,有可能会提高表达量或降低表达量;右图-融合蛋白:Gene A和Gene B的编码区融合,产生病理的融合蛋白

融合基因的产生及检测

融合基因的产生

融合基因是由染色体重排而产生的,包括染色体的易位,插入,颠倒,缺失。

小箭头是染色体断裂位点。

融合基因的检测

  • 显微镜染色观察:观察染色体的形态变化,ph染色体就是通过显微镜染色观察发现的;

  • 染色体核型:当染色体带型技术问世后,可以研究大部分染色体重排了,只有少数染色体间相同带型的置换无法鉴定;

  • 荧光原位杂交:对已知的染色体重排设计探针,所以无法发现新的染色体重排;

  • 高通量测序的方法:相比较传统的方法,采用高通量测序研究融合基因的文章数量已经呈爆炸式增长。

融合基因在医学诊断及疾病治疗上的应用

融合基因由于会造成基因失调或表达异常蛋白,从而导致癌症的发生,因此在很多癌症诊断上有重要意义。

除了BCR-AML融合基因用于诊断CML外,血液病中常见的需要检测的融合基因有AML1-ETO;BCR-ABL(亚型:ela2、b2a2、b3a2);CBFb-MYH11(亚型:A-J型);E2A-PBX1(亚型:1、1a);MLL-AF4(亚型:MLLex8-11   AF4ex4-7);PML-RARα(亚型:S、L 、V 型);SIL-TAL1(亚型:Ⅰ、Ⅱ、Ⅲ型);TEL-AML1 (亚型:ex5-ex2、ex5-ex3)等等。

而在肺癌中,也已发现ALK、ROS1、RET等基因会与其他基因发生融合。如EML4-ALK融合基因用于分型肺癌,此种肺癌主要是肺腺癌,约占肺癌3%-7%,不吸烟的患者占多数。

BCR-AML融合基因会产生一种病理的酪氨酸激酶,从而引起细胞增殖、黏附和生存性质的变化,导致肿瘤的发生,因此就出现了以专一性抑制BCR-AML酪氨酸激酶的小分子药物,即STI-571(伊马替尼,格列卫),伊马替尼不杀伤bcr-abl- 细胞,只杀伤bcr-abl+ 细胞。

目前“白血病”的治愈率最高的治疗方法还是造血干细胞移植,以脐带血造血干细胞移植为例,其治愈率在70%,复发率小于20%,移植相关致死率小于6%。

2011年FDA批准克唑替尼,可以用于晚期的、有ALK融合基因突变的肺癌的治疗。2014年FDA批准色瑞替尼可以用于克唑替尼治疗无效、或者不能耐受克唑替尼的,并且有ALK融合基因突变的,非小细胞肺癌病人。一项对非小细胞肺癌患者的研究表明:ALK基因融合阳性患者使用克唑替尼的治疗效果优于化疗。

融合基因的生信检测

融合基因的检测可以从DNA-seq数据检测,也可以使用RNA-seq数据检测,当然严格意义来讲,使用DNA-seq数据检测的才是标准的融合基因。

融合基因的检测可以使用STAR-Fusion来做(参考资料1,6)。

STAR-Fusion检测融合基因的方法

STAR-Fusion做融合基因检测有两个方法,根据检测的流程可以称之为经典方法快速方法

  • 经典方法:先使用STAR将reads比对到参考基因组,筛选出split和discordant的reads,作为候选的融合基因序列。然后使用STAR-Fusion将候选融合基因序列与参考基因序列进行比对,根据overlaps预测出融合基因,并将序列相似的融合基因及混乱融合基因过滤,输出最终的融合基因文件。

  • 快速方法:在STAR提供的FTP站点上下载genome resource lib,然后直接使用STAR-Fusion将测序的fastq文件作比对处理,得出最终的融合基因文件。

推荐使用快速方法,因为经典方法中的第一步(使用STAR比对)非常需求计算机性能,而且很耗时。使用STAR比对人全基因组需要>30G的RAM。

如何使用快速方法进行融合基因预测检测

  1. 下载genome resource lib

    打开https://data.broadinstitute.org/Trinity/CTAT_RESOURCE_LIB/,如图。

    这里人的lib有两个版本:GRCh37和GRCh38,每个版本也有两个文件。

    如果下载1.2G大小的source data,就需要先做一步准备工作:

    如果下载的是26G完整版库文件,解压即可使用。

  2. 检测融合基因

    如果是双端测序数据,就使用如下命令:

    其中,

    –genome_lib_dir后接第一步下载解压的库文件目录,或者是自己生成的库文件目录;

    –left_fq与–right_fq: 后接测序数据,如果是单端测序就只是用–left_fq参数;

    –output_dir: 后接融合基因预测数据输出目录

做完这两步,就会输出所有的融合基因列表,如图(部分):

参考资料

  1. 我是如何学习Gene Fusion分析的 http://www.bio-info-trainee.com/2812.html

  2. 如何分析癌症中的融合基因?(基迪奥生物)

  3. 一文读懂:融合基因到底是什么鬼(陆道培医学团队)

  4. 两个基因结合的新生儿——融合基因(美吉医学检验)

  5. bcr/abl融合基因(格瑞斯基因检测)

  6. STAR-Fusion官方说明文档 https://github.com/STAR-Fusion/STAR-Fusion/wiki


还有更多文章,请移步公众号阅读

如果你生信基本技能已经入门,需要提高自己,请关注上面的生信技能树,看我们是如何完善生信技能,成为一个生信全栈工程师。

如果你是初学者,请关注下面的生信菜鸟团,了解生信基础名词,概念,扎实的打好基础,争取早日入门。


赞(0) 打赏
未经允许不得转载:医学SCI科研之家 » 转录组专题-融合基因
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

meta分析、生信分析

meta、生信交流群综合科研交流群