TCGA
#
Find similar titles
- (rev. 9)
- Hyungyong Kim
Structured data
The Cancer Genome Atlas (TCGA)는 Cancer에 관한 유전변이 데이터를 통합 축적하고, 생물정보 분석하고자 하는 목적으로 2005년부터 시작된 프로젝트로, 미국 NCI(National Cancer Institute)와 NHGRI(National Human Genome Research Institute)에서 운영 관리하고 있다. (http://en.wikipedia.org/wiki/The_Cancer_Genome_Atlas)
주로 관리하는 유전변이 데이터는 다음과 같다.
- Gene Expression profile
- SNP genotyping
- CNV
- DNA methylation
- microRNA profiling
- Exome sequencing
이곳 데이터는 특정 조건에 맞도록 공유되는데, TCGA Data Portal 혹은 Cancer Genomics Hub (CGHub)이라는 별도의 서비스를 통해 접근할 수 있다. 또한 특별한 분석을 거친 후, 분석 결과를 체계화하여 또 다른 별도의 사이트에서도 서비스된다. cBioPortal 서비스가 대표적이다.
TCGA Research Network에는 다음과 같은 예하 컴포넌트들이 존재한다.
- Biospecimen Core Resource (BCR): 샘플 조직들을 카테고리화하고, QC하고, 환자정보와 함께 저장 관리한다.
- Genome Characterization Centers (GCCs): 암 유발 유전변이를 직접 분석한다.
- Genome Sequencing Centers (GSCs): High-throughput 유전체 서열결정을 수행한다.
- Proteome Characterization Centers (PCCs): NCI의 Clinical Proteomic Tumor Analysis Consortium으로 TCGA 샘플에 대한 단백체적 확인을 수행한다.
- Data Coordinating Center (DCC): TCGA Data Portal을 관리한다. 연구 커뮤니티에서 효과적으로 사용할 수 있도록 데이터를 저장 관리 공유한다.
- Cancer Genomics Hub (CGHub): 서열데이터를 특정 보안 저장소에서 관리하고, 공유한다.
- Genome Data Analysis Centers (GDACs): 수천 샘플을 통합 분석한다.
Table of Contents
TCGA Data Portal #
TCGA Data Portal은 연구자들에게 암 유전체 데이터를 검색하고, 다운로드하고, 분석할 수 있는 플랫폼을 제공한다. (lower level 서열 데이터는 제공하지 않는다. CGHub를 이용해야 한다.) 처음 페이지에 전체 34 암종에 대한 데이터 현황을 표시한다. ( 현재, Breast cancer (Breast invasive carcinoma)의 경우 1,098개의 케이스 샘플이 관리되고 있다.)
암종 데이터를 선택하면, "Data Matrix Dataset" 화면을 통해, 각 샘플별로 접근 이용 가능한 데이터가 테이블 형식으로 제공된다. 적절하게 선택하고 "Build Archive"를 선택함으로써, 자료를 다운로드 받을 수 있다.
TCGA Biospecimen ID 체계 #
from Understanding TCGA Biospecimen IDs
"TCGA-02-0001-01"
- Project: TCGA
- TSS (Tissue source site code and disease type): 02 - GBM
- Participant
- Sample: Code for sample type. 01-09 (tumor), 10-19 (normal)
Breast cancer data in TCGA #
TCGA 데이터 가운데 유방암(Breast cancer) 데이터는 다음 링크와 논문을 통해 종합적으로 제공된다.
- Brast cancer raw data via TCGA data portal
- Comprehensive molecular portraits of human breast tumours
- Data analysis and visualization in cBioPortal
데이터 구성
- WES 507 patients (total 1012 BAM file)
- 1 tumor/blood/adjacent normal/metastatic
- 110 tumor/blood/adjacent normal
- 2 tumor/blood/metastatic
- 36 tumor/adjacent normal
- 429 tumor/blood
참고 논문 #
- TCGA Research Network Publications: TCGA 출판논문 모음
- TCGA Workflow: Analyze cancer genomics and epigenomics data using Bioconductor packages F1000Research : Bioconductor를 이용하여 TCGA, ENCODE 데이터 분석하기
참고정보 #
- Top 5 tools for TCGA data analysis
- GDC
- cBioPortal
- Xena Browser
- MEXPRESS
- TCGA2STAT: R 라이브러리
- TCGA Wiki: Confluence로 구축된 Wiki
Incoming Links #
Related Datasets (Dataset 0) #
Related People (Person 1) #
Related Articles (Article 2) #
- Cancer genomics
- Cancer immunotherapy
- Characterizing genomic alterations in cancer by complementary functional associations
- Cloud computing
- Drug response
- Identification of Biomarkers for Breast Cancer Using Databases
- Machine learning for Genomics
- microRNA
- 암 맞춤의학과 생물정보학
Related Education Events (EducationEvent 3) #
Related Medical Conditions (MedicalCondition 4) #
Related Web Pages (WebPage 5) #
Related Medical Scholarly Articles (MedicalScholarlyArticle 6) #
- BCL11A is a triple-negative breast cancer gene with critical functions in stem and progenitor cells
- Comprehensive functional analysis of the tousled-like kinase 2 frequently amplified in aggressive luminal breast cancers
- Gene-based comparative analysis of tools for estimating copy number alterations using whole-exome sequencing data
- Genetic alterations of histone lysine methyltransferases and their significance in breast cancer
- Genetic alterations of triple negative breast cancer by targeted next-generation sequencing and correlation with tumor morphology
- Identification of druggable cancer driver genes amplified across TCGA datasets
- Next-Generation Sequencing of Circulating Tumor DNA for Early Cancer Detection
- VarScan 2: Somatic mutation and copy number alteration discovery in cancer by exome sequencing
Related Codes (Code 7) #
Related Web Applications (WebApplication 8) #
Suggested Pages #
- 0.262 Syndecan-2
- 0.108 siRNA
- 0.059 Identification of gene-drug interactions that impact patient survival in TCGA
- 0.056 Genomics of Drug Sensitivity in Cancer
- 0.045 Systematic comparison of phenome-wide association study of electronic medical record data and genome-wide association study data
- 0.041 Microbiome
- 0.037 Meerkat
- 0.030 단맛만좋아요
- 0.025 Comparative analysis of algorithms for identifying amplifications and deletions in array CGH data
- 0.025 Evaluation of somatic copy number estimation tools for whole-exome sequencing data
- More suggestions...