TCGA数据下载及处理

筛选数据,加入cart

从cart中下载需要的文件

image.png

红框中为需要下载的文件。
我选择了使用linux client和gdc_manifest.txt下载的方式。client可以从这里下载https://gdc.cancer.gov/access-data/gdc-data-transfer-tool到服务器上。

文件处理

从metadata.cart.2022-09-22.json文件可以得知文件与id的对应关系,从而得到entity_submitter_id,之后取前三节(-分割)。


metadata.cart.json

与clinical.cases_selection.2022-09-22/clinical.tsv文件中的case_submitter_id对应,可以提取临床信息,常见的比如age, stage等。


clinical.tsv
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容