Cancer genomics Data analysis and Cancer genome knowledge base - 김형용 학위논문 준비 자료 모음
논문 국문 제목 (예정): 암 유전체 대용량 데이터 분석을 위한 방법과 지식베이스 구축
Table of Contents
논문준비 #
전체 논문은 4개의 파트로 이루어짐.
WES 데이터로 CNA 탐색 (SNP6.0과 비교) #
CNV calling from NGS data 방법 연구 - TCGA 유방암 419 사례 WES 데이터로 7개의 도구 CNA 탐지 결과를 Genome-Wide Human SNP Array 6.0과 비교함 - Oncotarget에 투고. 리비전중.
WGS 데이터로 Genome rearrangement, Gene fusion 탐색 (RNA-seq과 비교) #
암패널 NGS 데이터 혹은 WES도 가능하지 않을까?
관련 자료 #
- Question: Gene Fusion Detection: Rna-Seq Data: 관련 프로그램 총망라 - RNA-seq 기반도 있고, WGS 기반도 있음
관련 프로그램들 #
RNA-seq 기반
- JAFFA (Genome Medicine, 2015)
- FusionQ (BMC Bioinformatics 2013)
- SOAPFuse (2013)
- nFuse (2012)
- TopHat-Fusion (2011)
WGS 기반
- BreakDancer (SV 탐지 중심)
- CREST (SV 탐지 중심)
둘다
- INTEGRATE (Genome Research, 2015)
- Comrad
- FusionMap
관련 논문 #
- Comparative assessment of methods for the fusion transcripts detection from RNA-Seq data Scientific Reports : 12개의 RNA-seq 기반 탐지 도구 평가
- Fusion Gene 검출 알고리즘 성능 향상 비교 분석 한국통신학회 : FusionMap, MapSplice, TopHat-Fusion 성능을 비교함. 성능비교시 기존논문에서 사용한 시뮬레이션 음성, 양성 데이터가 있음.
- Whole-exome sequencing identifies a recurrent NAB2-STAT6 fusion in solitary fibrous tumors Nature Genetics : WES데이터에서 탐지
- Application of next generation sequencing to human gene fusion detection: computational tools, features and perspectives Briefings in Bioinformatics : 일반 개요 설명
데이터셋 탐색 #
- 위 SR 논문에서 사용한 RNA-seq 데이터 - SRR1657556, SRR1657557, SRR1657558, SRR1657559, SRR1657560, and SRR1657561
유전자 변이, 발현, 예후분석 기반 암 유전자 스크리닝 #
유전자 발현과 예후 데이터 셋으로 부터 암종별, 서브타입별 타겟 유전자 발굴하기, 후성유전관련 타겟 유전자 탐색 - 핵심은 서브타입별 유의한 타겟 유전자 발굴
관련 방법 #
관련 논문 #
in silico 암 표적 유전자 스크리닝 (biomarker discovery)
- Identification of Biomarkers for Breast Cancer Using Databases Journal of Cancer Prevention : 데이터베이스를 활용하여 유방암 biomarker 찾기 전반적 리뷰
- Comprehensive functional analysis of the tousled-like kinase 2 frequently amplified in aggressive luminal breast cancers Nature Communications : ConSig 방법을 통해 암 유전자 스크리닝하여 TLK2 유전자 확인
- Leveraging big data to transform target selection and drug discovery Clinical Pharmacology & Therapeutics 2016-02-176: 표적 선발과 Drug discovery를 위하여 바이오 Big data를 활용하는 방법 리뷰
- Identification of a multi-cancer gene expression biomarker for cancer clinical outcomes using a network-based algorithm Scientific Report : 12개 암종에서 생존에 영향을 미치는 공통의 biomarker를 NCA라는 알고리즘을 통해 확인함
- Network-based survival-associated module biomarker and its crosstalk with cell death genes in ovarian cancer Scientific Report
- Genetic alterations of histone lysine methyltransferases and their significance in breast cancer Oncotarget : TCGA 등 데이터셋에서 다양한 Histone methyltransferase에 대한 유방암 예후 Survival analysis 후, 타겟 유전자 발굴
- Identification of druggable cancer driver genes amplified across TCGA datasets PLOS One : TCGA 데이터셋에서 amplified 된 유전자 목록으로 부터, Cancer gene index, Gene expression correlation 등을 통해 타겟 유전자 발굴
- An integrative approach to reveal driver gene fusions from paired-end sequencing data in cancer Nature Biotechnology : ConSig 방법이 처음 소개된 논문
기존 분석 프로그램
- BCIP: a gene-centered platform for identifying potential regulatory genes in breast cancer Scientific Report : BCIP라는 Breast cancer 유전자 통합 분석 플랫폼을 만듬 - TCGA, GEO 등 주요 데이터셋에서 유전자의 Gene expression, CNA, Survival analysis, KEGG pathway, Biological network 분석 결과를 제공함. 특정 서브타입별로 분석하기 용이하게 되어 있음
- MEXPRESS: visualizing expression, DNA methylation and clinical TCGA data BMC Genomics : TCGA 데이터 종합 가시화 프로그램 MEXPRESS 논문 - 임상정보와 유전체 변이 정보를 효과적으로 통합 가시화 - MLPH의 DNA methylation status가 subtype에 따라 구분되고, Gene expression과 관련된다는 사실을 밝힘
- HyperModules: identifying clinically and phenotypically significant network modules with disease mutations for biomarker discovery Bioinformatics
- SurvExpress: An Online Biomarker Validation Tool and Database for Cancer Gene Expression Data Using Survival Analysis PLOS ONE : 생존분석으로 biomarker validation하는 프로그램 SurvExpress 논문 - 유전자 목록을 입력하면 통합 생존분석 결과 제공
- PROGgene: gene expression based survival analysis web application for multiple cancers Journal of Clinical Bioinformatics : 유전자 발현 기반 생존 분석
- Integrative analysis of complex cancer genomics and clinical profiles using the cBioPortal Science Signaling : cBioPortal 논문 - 특정 암 데이터셋에 대해 유전자 목록을 입력하여 변이, 발현, 네트워크 분석과 기본적인 생존 분석
- PrognoScan: a new database for meta-analysis of the prognostic value of genes BMC Medical Genomics : 생존정보 종합하여 PrognoScan DB 만듬
- An online survival analysis tool to rapidly assess the effect of 22,277 genes on breast cancer prognosis using microarray data of 1,809 patients Breast Cancer Research Treatment : Kaplan-Meier Plotter 논문
예후 관련
- Using knowledge-driven genomic interactions for multi-omics data analysis: metadimensional models for predicting clinical outcomes in ovarian carcinoma Journal of the American Medical Informatics Association : CNA, DNA methylation, Gene expression 데이터로부터 기계학습 이용 예후 예측 모델 개발
- Identification of gene-drug interactions that impact patient survival in TCGA BMC Bioinformatics : TCGA 임상정보와 CNA 데이터를 이용하여 질병 특이적인 gene-drug 상호작용을 확인하는 GDISC 파이프라인 개발 - 두개의 암종(LGG, GBM)에 대해 분석함
- Identification of Gene Expression Pattern Related to Breast Cancer Survival Using Integrated TCGA Datasets and Genomic Tools BioMed Research International : TCGA4U 분석 플랫폼 개발 - 생존정보와 연관된 Gene expression 프로파일을 분석함 - DAVID 등 gene set 이용
- Survival analysis tools in genomics research Human Genomics : Genomics 연구에서 Survival analysis 도구들 리뷰
- Discovery Analysis of TCGA Data Reveals Association between Germline Genotype and Survival in Ovarian Cancer Patients PLOS ONE : TCGA 데이터 분석으로 Ovarian cancer 연관 germline 유전자형 밝힘
- Network-based Survival Analysis Reveals Subnetwork Signatures for Predicting Outcomes of Ovarian Cancer Treatment PLOS Computational Biology
- A comparative study on gene-set analysis methods for assessing differential expression associated with the survival phenotype BMC Bioinformatics : Survival analysis 데이터를 이용하여 GSEA 성능을 보완함
- A gene-expression signature to predict survival in breast cancer across independent data sets Oncogene : Gene expression 시그니처로 생존 예측
유전자 네트워크와 합성치사
- Gene Essentiality Profiling Reveals Gene Networks and Synthetic Lethal Interactions with Oncogenic Ras Cell : Ras와 합성치사 관계에 있는 유전자 네트워크
- The OncoPPi network of cancer-focused protein-protein interactions to inform biological insights and therapeutic strategies Nature Communications : Cancer-focused PPI 네트워크
- Quantitative and logic modelling of molecular and gene networks Nature Review Genetics : 유전자 정량 네트워크 모델링
- Pathway and network analysis of cancer genomes Nature Methods : 암 유전체에서의 Biological network 개요
- Pan-cancer network analysis identifies combinations of rare somatic mutations across pathways and protein complexes Nature Genetics
- DAISY: picking synthetic lethals from cancer genomes Cancer Cell : 합성치사 네트워크
- Predicting cancer-specific vulnerability via data-driven detection of synthetic lethality Cell : 합성치사 네트워크
- Pathway-based personalized analysis of cancer PNAS
암 구분
- Knowledge about the presence or absence of miRNA isoforms (isomiRs) can successfully discriminate amongst 32 TCGA cancer types Nucleic Acids Research : Machine learning 방법으로 TCGA miRNA 데이터 분석하여 32개 암종 구분
약물 추천
- MEDICI: Mining Essentiality Data to Identify Critical Interactions for Cancer Drug Target Discovery and Development PLOS One : PPI 정보를 이용하여 약물 개발. MEDICI 이라는 방법을 개발함.
- DrugBank 4.0: shedding new light on drug metabolism Nucleic Acids Research : 유전자 - 약물 관계 데이베이스 DrugBank 논문
- Therapeutic target database update 2012: a resource for facilitating target-oriented drug discovery Nucleic Acids Research : 유전자 표적 약물 데이터베이스 TTD 논문
기타
- Systematic screening of isogenic cancer cells identifies DUSP6 as context-specific synthetic lethal target in melanoma Oncotarget : DUSP6가 Melanoma의 합성치사 표적임을 systematic 방법으로 찾아냄 (in vitro assay from cell line)
- Comprehensive screening of target molecules by next-generation sequencing in patients with malignant solid tumors: guiding entry into phase I clinical trials Molecular Cancer : NGS로 임상환자들로부터 직접 분자 표적 확인, 약물 확인 - 131 환자 분석하여 59 환자에게서 actionable alteration을 확인하고, 11 환자에게 맞는 약물로 치료함
- Epigenomic Deconvolution of Breast Tumors Reveals Metabolic Coupling between Constituent Cell Types Cell Reports : DNA methylation과 Gene expression 데이터로 cell type composition을 추정하는 EDec 알고리즘 개발 - TCGA 유방암에 적용하여 immune cell infiltration 변화가 예후와 관련됨 확인
- Characterizing genomic alterations in cancer by complementary functional associations Nature Biotechnology : REVEALER라는 계산방법을 통해 기능 표현형과 관련된 mutually exclusive genomic alteration 조합 확인
- An in vivo screening system to identify tumorigenic genes Oncogene : 발암 유전자를 확인하는 in vivo 스크리닝 시스템
- An integrative somatic mutation analysis to identify pathways linked with survival outcomes across 19 cancer types Bioinformatics : TCGA 19 암종, 4790 암환자로부터, 암 특이 altered pathway를 분석함. 예후분석과 함께. (미네소타 황태현 박사님 논문)
암 유전자 네트워크 분석 #
유전자 변이(SNV), 발현(Gene expression) 변화, Synthetic lethality, 공발현에 기반한 유전자 네트워크를 구축하고, 환자별 임상 genomic abbreation 데이터로부터 유용한 정보를 제공하기
관련 데이터 #
- PID: Biological network 데이터로 이용
관련 논문 #
네트워크 일반 #
- The OncoPPi network of cancer-focused protein-protein interactions to inform biological insights and therapeutic strategies Nature Communications : Cancer-focused PPI 네트워크
- Global transcription network incorporating distal regulator binding reveals selective cooperation of cancer drivers and risk genes Nucleic Acids Research : KAIST 최정균 박사님 논문
- Pathway and network analysis of cancer genomes Nature Methods : 암 유전체에서의 Biological network 개요
Quantitative network #
- Quantitative and logic modelling of molecular and gene networks Nature Review Genetics : 유전자 정량 네트워크 모델링
Synthetic lethality #
- Synthetic lethality and cancer Nature Reviews Genetics
- Gene Essentiality Profiling Reveals Gene Networks and Synthetic Lethal Interactions with Oncogenic Ras Cell
- DAISY: picking synthetic lethals from cancer genomes Cancer Cell : 합성치사 네트워크
- Predicting cancer-specific vulnerability via data-driven detection of synthetic lethality Cell : 합성치사 네트워크
Suggested Pages #
- 0.025
- 0.025 ER
- 0.025 BioCarta
- 0.025 Lipoma
- 0.025 PLINK
- 0.025 Histone modification
- 0.025 PRDM14
- 0.025 January 4
- 0.025 Genome browser
- 0.025 PLoS One
- More suggestions...