SCI医学科研助手
生信分析-Meta分析-基础实验

零代码TCGA数据库下载第三期:cBioPortal网页

点击蓝字关注我们

一入江湖终不悔,奈何高人这么多。各位科研芝士的朋友,大家好,又见面了,今天我们继续分享关于TCGA数据下载的专题,前面我们分别介绍了基于TCGA官网下载RNAseq数据,基于UCSC-XENA下载TCGA的RNAseq数据。

这次我们继续给大家推荐轻轻点击鼠标下载TCGA的网页版工具—-cBioportal工具这是一个专业分析TCGA数据的网站,相信很多肿瘤研究方向的老师同学都不陌生。网站在TCGA数据可视化中做的很不错,可以直观的看到数据以图和表的方式呈现,帮助大家更好使用TCGA这个资源丰富的数据库

我们之前写过一篇懒人如何分析TCGA数据之cBioportal网站,内容侧重于分析基因的预后生存,突变,拷贝数变异等信息,这篇推文侧重于如何通过cBioportal下载TCGA的RNAseq数据及临床信息

下面我们就进入正题,网站主页是这样的:                      


1

cBioportal网址

http://www.cbioportal.org/index.do

最新的cBioportal进行了更新,增加了一个Quick Search按钮,可以快速的进行数据检索,那我们先看看该数据库的使用。

2

先点击Query,进入该界面,接着点击2处的数据来源



3

点击TCGA provisional,进入TCGA数据站,会出现下面的界面。


可以看到一共有32个TCGA数据集,我们点击第一个肾上腺皮质癌,点击进去, 点击view summary

便会出现下面的界面

可以看到主要是包括了CNV的信息和Matution信息,Mutation 按照突变频率进行了排序,可以看到在肾上腺皮质癌中ZFPM1突变频率最高,CNV主要涵盖了两类分别是del和amp。当然还有一些生存曲线的图形。

4

点击Clinical Data 进入该疾病的临床数据存储站,出现下面的界面,点击下载按钮,便可以下载该数据。

可以看到在右侧的Active Data Hubs 包括了很多,不仅涵盖了TCGA还包括ICGA,Pan-Cancer Atlas Hub等数据节点。因为我们是研究TCGA,我们只需要选中TCGA就可以了。

5

前面说了这麽多,还是没有讲到TCGA的RNAseq数据的下载,那我们来看一下怎么下载,首先我们点击data sets,进入下面的界面。


6

接着我们找到Adrenocortical Carcinoma (TCGA, Provisional),进行数据下载

下载之后的数据如下,是一个压缩包,我们继续解压,发现包含的数据,很多,真的是一次下载多次使用。

RNAseq的数据类型有两种,选择一种即可。我们发现我们下载的数据不仅包括了RNAseq数据还包括其他各种数据,比如突变数据,450K甲基化数据等,几乎就是把一种疾病的所有类型数据全部给下载了。

7

除此之外,我们还可以下载关键通路上的基因的表达信息,一顿操作猛如虎,如下1-7个步骤,可以下载AR信号通路上的10个基因的表达信息, 选中Transpose data matrix, 便可以使得下载的数据为表达矩阵的格式:



结果文件如下, 行是样本名,列是基因名:


8

 仔细观察cBioproal,还提供了R包,来调用数据

OK,今天的教程主要是带大家体验TCGA的第三种非编程数据下载方式,下期我们继续推出TCGA的第四种方式下载,今天的数据下载先讲到这,下期再见。


关注公众号,后台回复“生信资源”获取200G生信资源包


End


往期推文


文献精读

文献精读-成神经管细胞瘤亚型的全基因组landscape

小样本多组学分析怎么发12分的Nature子刊?

发Science需要多大样本量?12例结直肠癌就够了

骚操作,为你写诗竟然可以发23分顶级牛刊!

Cell重磅:穿越茫茫的黑夜,给你一双透视的大眼

零代码也能发3分的SCI?请收下这个套路

TCGA数据库挖掘

零代码下载TCGA数据库第一期

零代码下载TCGA数据库第二期:UCSC-XENA工具

GEO数据挖掘系列

手把手教你GEO数据库表达谱差异基因分析(上):R版

手把手教你GEO数据库表达谱差异基因分析(下):GEO2R

R语言实例操作分析GEO数据库甲基化芯片

生信神器系列

确认过眼神,TCGA甲基化分析工具再也没有更NB的了!

【神器分享】自从用了这个神器,大规模RNA-seq数据挖掘我也可以

一个逆天的small RNA-seq数据挖掘神器 

最全网页版生存分析工具,你掌握了几种?

懒人如何分析TCGA数据之cBioportal网站

DAVID&Metascape:专注于基因功能注释和富集通路分析的网站

零代码如何画高逼格热图?

GEPIA:点点鼠标分析TCGA数据-超高自由度

R统计分析与绘图系列

浅谈一款进阶软件R的实际运用

R语言系列第三期:②R语言多组汇总及图形展示

R语言系列第三期:①R语言单组汇总及图形展示

R语言系列第二期(番外篇):R先生教你统计概率与分布

R语言系列第二期:①R变量、脚本、作图等模块介绍

R语言系列第二期:②R编程、函数、数据输入等功能

R语言系列第一期(番外篇 ):R的6种对象—向量、矩阵、数组、因子、列表、数据框

R语言系列第一期:R语言背景、下载安装及功能介绍



后台回复“入群”,百味科研交流群等你加入

       

多点好看,少点脱发

 收藏 (0) 打赏

您可以选择一种方式赞助本站

支付宝扫一扫赞助

微信钱包扫描赞助

未经允许不得转载:医学SCI科研之家 » 零代码TCGA数据库下载第三期:cBioPortal网页

评论 抢沙发

  • QQ号
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

学习、交流、分享

生信分析交流群综合科研交流群

登录

忘记密码 ?

切换登录

注册