Hanyang University
맞춤의료학세미나2
#
Find similar titles
- (rev. 5)
- Hyungyong Kim
Structured data
- End Date
- Location
- Hanyang University
- Start Date
Hanyang University 대학원 오픈 세미나
매주 수요일 11:00 ~ 12:00 제1의학관 508-1호
Table of Contents
강연 #
Yin and Yang of disease genes and death genes between reciprocally scale-free biological networks #
(, 서울의대 김주한)
Scale-free network는 노드 연결선수(degree)가 멱함수분포(Power law distribution)을 따르는 네트워크를 의미하며 SNS, Internet, 공항 등에서 발견된다. 이 네트워크는 구조적 안정성을 가지며, 오류나 공격에 대한 저항성을 갖는다.
정하웅 박사 등은 단백질 네트워크(PPI, Protein protein interaction)도 Scale-free network라는 보고를 했다. 많은 연결선을 갖는 허브 단백질이 별도로 존재하며, 이들은 대개 lethal gene에 해당한다. 허브 바로 옆의 주변(peripheral)에 disease gene이 위치하게 된다.
Perturbation sensitivity network (PSN)은 다른 유전자의 knockout에 얼마나 많은 다른 유전자들이 영향을 받는지를 근거로 만든 네트워크이며, 각각의 유전자를 knockout 시켜가며 다른 유전자들의 발현변화를 관찰함으로써 얻을 수 있다. 현재 효모로 실험한 결과가 있으며, 이를 가지고 PSN을 만들고, PPI 네트워크와의 차이를 분석할 수 있다. PPI와는 다르게 PSN에서는 disease gene이 허브에 위치하며 lethal gene이 주변에 위치한다.
즉, lethal gene과 disease gene이 각각 PPI 네트워크와 PSN에서 hub-peripheral, peripheral-hub 역할을 하고 있으며 이는 마치 음양사상과도 같다.
그외 노트들
- Yeast genome 으로 연구함
- 모든 유전자에 대한 knock out 데이터가 필요함.
- Psychoanalysis vs. Analytical Psychology
- Riddles of the Sphinx
- Oedipus Complex and Mandala
- Six degrees of separation and the small world
- Scale free networks
- systematic perturbations of biological systems
- Structural theories of mind
- Collective unconscious
- 스핑크스수수께끼 두번째는 해와 달
- 만달라 - 무한반복
- Attack tolerance 가 있다.
- Hub tend to be “older” proteins
- Lethal genes are indeed hub gene
- Are diseases errors or selections? or Has life selected diseases?
- Perturbation sensitivity network
- Excess retention & k-core
- Codon usage bias & dN/dS
- Conjunctio Oppositorum
Transcriptome sequencing for revealing hiddden features of the cell #
(, 서울의대 김종일)
NGS는 보통 다음처럼 나눌 수 있다.
- single end 1 * 36
- paired end 2 * 100
- mate pair
Alignment to reference sequence 할때 기준이 있어야 한다. 다른 부분을 찾는 것이 목적이나 달라도 너무 다르면 버려야 한다. 매치되는 부분이 여러개 있을 경우도 선택 옵션이 있다. unique, random, multiple alignment로 선택할 수 있다.
Alignment 결과(BAM)으로 다음을 알 수 있는 것들
- 양 (deleteion, amplification),
- RNA-seq이라면 유전자 발현양
- Epigenetic change (ChIP-seq, MEDIB-seq)
- SNP, short indel
- paired end 로 통해 deletion, translocation 등을 볼 수 있다.
WGS로 알 수 있는 것들
- pathogenic organism
- normal individuals
- patient genome (genetic disease or genetic susceptibility)
- sample tissue genome (for somatic mutation)
RNA-seq으로 알 수 있는 것들
- Expression profile
- Alternative splicing
- Mutation in transcript
- novel transcript
- Gene fusion with or without DNA change
의료용과 보고용이 다름. 보고인 경우 있는 그대로 버려서 발표하게 됨. SNP이 실제로는 더 있을 수 있다.
DNA와 RNA를 동시에 사용 Extensive genomic and transcriptional diversity identified through massively parallel DNA and RNA sequencing of eighteen Korean individuals
A가 C로 바뀌는 현상발견 - RNA editing - 엑손의 앞쪽에 몰려있다. —> very short exon이 있을 수 있지 않을까
Detection of Fusion Gene - orphan read를 확인하는 등 해서 discordant paired-end reads 확인함. 하지만 true-positive만 고르기 위해, 다음만 선별함.
- Inter-chromosome
- Long distance
- Make expression changes
보통의 경우 deletion되서 fusion된다.
New challenges of RNA-seq
- Single cell sequencing
- noncoding RNAs
- strand-specific sequencing
- species-specific sequencing in mixed population
- Translatome sequencing or cell type specific sequencing
Mining omics data helps understand phenotype specific biological mechanisms #
(, 서울대 김선)
유전자 조절 네트워크를 만들고, 이를 해석함으로써, 특정 표현형의 생물학적 메커니즘을 이해할 수 있다. 특히 cytosine의 메틸화는 특정 유전자의 발현을 활성하거나 억제하는데 중요하므로, 이를 네트워크로 만들고 종합적으로 이해하고자 한다.
Aggressive cancer와 less aggressive cancer의 메틸화 정도를 봄으로써, Tumor suppressor gene의 발현 유무를 확인함.
- Putative TF network construction
- DNA-TF interaction
- Reconstruct TF network utilizing transcriptome, methylaome, and TF ChIP-seq data.
네트워크가 복잡할 때는 타겟유전자만 보면 좀 더 명확하게 볼 수 있다.
벼의 경우, AP2/ERF 를 증폭시키면 가뭄에 강하다 - How AP2/ERF transgenic rice acquired drought resistance phenotype.
암 치료를 하면 치료제에 의해 해당 패스웨이가 셧다운됨. methylation 때문임.
MMIA (microRNA and mRNA integrated analysis)라는 네트워크 모델을 개발함.
발현데이터를 이용하여 네트워크를 만드는 방법은 기존의 알려진 네트워크에 발현데이터를 붙혀 보는 것. 이를 통해 생체경로에 어떤 변화가 나타나는지 생물학적으로 해석하는 일은 쉽지 않아 보임.
Clinical NGS sequencing and reporting for personalized cancer medicine #
(, 아산병원 장세진)
ICGC, TCGA와 같은 공개 데이터베이스를 통해 암 유전체 데이터가 집적되고 있음. 암 치료를 위해 생물정보를 이용하여 drug prescription을 확인해보면,
- 2.9%: Benefit by FDA approved drug
- 12.6% benefit by Drug repositioning
- 92%: Benefit by off-target interaction and Drug Combination
이라고 함. 따라서, repositioning 등으로 전에 없던 치료방법을 확보할 수 있음. 이를 위해 세계적으로 WIN (Worldwide Innovation Networking), Combination Trials과 같은 기관들이 연구에 박차를 가하고 있음
Data-driven detection of cancer synthetic lethality - 고장난 유전자와 관련된 또 하나의 유전자를 타겟하면 잘 듣는다는 것도 암 치료 방법 가운데 하나.
현재 대략 3%의 암만 치료할 수 있음. 단일 유전자가 아닌 멀티 유전자 연구가 필요하며 Clinical sequencing를 통해 이를 극복하고자 함.
샘플상태(FF ro FFPE)도 NGS 퀄러티에 영향을 줌. 표준화된 확실한 분석 프로세싱 세팅이 필요함
암 유전체의 heterozygoty 때문에 정확한 변이정보를 얻기 위해서는 최소한 5%의 allele frequency는 detection 해야 함. 또한 검사의 sensitivity와 specificity를 알려줄 수 있어야 함.
ClinVar (NCBI database)와 My cancer genome 같은 웹 서비스들을 주목해야 하며, 최종 목표는 한번 실험으로 SNV, CNV 등을 모두 볼 수 있는 정보 서비스에 있음
맞춤형 암치료를 위한 타겟 변이들(SNV, CNV, Methylation) 가운데 가장 설명력이 높은 것은 무엇인가 - 아무래도 엑솜영역의 변이가 가장 중요하다고 함. Panel로 만드는 것도 이 이유라고 함.
Introduction of NGS data analysis for various types of genomics: Normal, Disease, Cancer and Crop genomes #
(, 테라젠 이성훈)
맥킨지에 소개된 12 Disruptive tech 가운데 Next-generation Genomics가 있음. 1사람당 675 TB 정도의 데이터를 생산하게 될 미래 유전체학이 주는 미래에 기대가 크다,
Elon Musk도 3 Opportunities that will impact humanity for the better를 다음처럼 설명
- Internet
- Artificial intelligence
- Rewriting Genomics
사람 NGS의 경우 다음의 목적
- 질병 민감성, 특이적 표현형 (Association study, 많은 샘플 필요)
- 유전병 (Linkage analysis, 가족력 샘플 필요)
- 암 (Somatic mutation, 정확하고 빠른 분석 필요)
- 일반인 (표현형 예측, GWAS, 충분한 양의 supporting data 필요 -> Social Network Genomics)
- 예 - Genomics England - 100,000 genomes project
동/식물 NGS의 경우 다음 목적
- 모든 종 (wild & domesticated), de novo assembly
- 작물 (Crops) - Finding useful traits by association study & linkage analysis
- Genomics based breeding
- Designed breeding
- 예 - Rice 3000 Genomes project
recombination pattern을 찾는 방향으로. - Recombination block detection, VB (variation block)을 확인 - Recombination hotspot - block 당 대표 marker 만 볼 수 있음 - block을 조합해서 새 품종을 만들 수 있음
“MyCrops" for clutivar identification and designed cultivars - 마커를 바코드 개념으로 표시하고 품종을 확인할 수 있음
질문
- 고전 육종에 비해 VB 방식이 갖는 장점은 무엇인가 - 잘 모르고 선발하는 경우를 줄일 수 있음
암 "omics" 정보를 이용한 개인 맞춤형 치료 #
(, 국립암센터 허철구)
암 치료를 위한 top 15 약물의 경제학을 살펴보면
- generated $27B w/ 35% response
- 65% non response = $18B waste
- toxicity = $20B
그만큼 거대한 시장이며, 개선해야 할 여지가 많다. 어떤 환자들에게 도움이 되는지 정확하게 파악하고, 적절한 타겟 약물을 만드는 것이 핵심임. 또한 약의 부작용을 감소시켜야 함
다음과 같은 연구 방법이 필요
Cancer subtyping —> signaling pathway —> Drug
변이는 암에게 멀티로 작용하기 때문에 네트워크 분석이 반드시 필요함.
SIFT, PolyPhen, SNP3D, PANTHER PSE PMUT과 같은 변이 분석 프로그램의 한계점을 탈피하려면, Gene expression, CNV, methylation, TF-first exon, subtype 등을 통합하여 활용해야 함.
다음과 같은 전략이 가능하다.
- WES + RNA-seq
- Signaling pathway, PPI DB 정보의 결합
약물 개발을 위해 Toxicogenomics 또한 중요하지만 제대로 연구되고 있지 않음.
Lesson from Minke whale genome: How did cetaceans adapt to marine habitat? #
(, KIOST 임형순)
Lesson from Minke Whale Genome - How did cetaceans adapt to marine habitat? (2014-10-29, 임형순)
Hyperthermophilic Archae 유전체결정 경험이 있으며, 8 Hydrogenease cluster - Formate-driven growth coupled with H2 production. 연구 경험을 토대로 고래 유전체 연구 도전. Whale (Cetacean, 고래목)은 Baleen whale (수염고래), Dolphin (돌고래), Porpoise (상괭이)가 있으며 이번 연구는 Baleen whale을 진행함.
고래는 포유류로서 다음의 특징을 지님 (그리고 우제류와 가까움)
- breathe air into lungs
- have hair
- are warm-blooded
- have mamary glands
또한 바다 포유류로서 다음의 특징도 지님
- Morphological adaptation
- Physiological adaptation: high salt, low oxygen,…
왜 고래를 연구하는가
- Hypoxia - cancer, neurodegenerative disease, angiogenesis,...
- Caisson disease (잠수병)
- Longevity 오래 삶 (200년까지?)
- Diabetes 지방이 많은데 당뇨에 안걸림
- Wound healing: isovaleric acid & organohalogen in blubber
- Blood clotting
- Unihemispheric slow-wave sleep (반구수면)
밍크고래는 다음의 특징이 있음.
- widely distributed throughout the world, commonly found from the poles to the tropics
- the most abundant baleen whales
시퀀싱 및 annotation으로 다음의 결과를 얻음
- 104,325 scaffolds
- 2.44 Gb size
- 20,605 genes
우제류에 감각과 관련된 유전자 퇴화하고, Hair related keratin family 줄어들며, 발달에 관련된 Hox gene clusters에서 다음의 변화를 관찰함 (positively selected)
- Hoxb1, Hoxb2 앞면 두개골
- Hoxd12 Hox13 다리
Analysis of tumor heterogeneity using single cell genome analysis #
(, 삼성의료원 박웅양)
하나의 수정란에서 유래한 세포들이지만, 사실은 모두 다름. 그 이유는 human DNA polymerase의 복제오류 10^-19 때문임. 세포분열당 하나의 변이가 생길 수 있으며, 10^13번의 세포분열이 일어남.
특정 세포 lineage의 복제 오류를 관찰함으로써, Cellular evolution을 추적할 수 있다.
Characterization of cellular phenotype based on context
-
200 different types of cells in human body
- Cell-based genotype-phenotype correlation
Whole genome/transcriptome amplification methods 을 통해 증폭함
- SMARTer Amplification
SNV calling은 다음의 방법을 이용함
- BWA, mpileup
- STAR, GATK v.3, SNIPR
질문 - 단일세포 지놈 시퀀싱으로 암 조직내 유전체 변이가 매우 hetero함을 알게되었다. 치료시 어떻게 응용할 수 있는가 - 일단 heterogenity가 높을수록 예후가 좋지 않다는 정보를 얻을 수 있고, 이후 복합 분석을 통해 대처할 수 있다.
NGS for Genome Medicine #
(, 마크로젠 이환석)
Illumina Buys Solexa - 역사적인 순간임. 이후, NGS 시퀀싱 시대를 열로, 이후 독점하게 됨. 454를 만들고 팔고, 또 Ion torrent를 만든 Jonathan Rothberg 역시 대단한 인물임. 자식의 건강과 질문 답변에 목표를 세워 실현함
HISEQ X 10
- 1.8 Tb per run
- < 3 day run time
- 5+ genomes a day
SNV calling 은 다음과 같은 방법을 사용함
- CASABA
- Isaac
- BWA+GATK
Anotation은 ANNOVAR 는 느려서 SnpEff로 대신함.
FASTQ 대신 BCL (퀄러티가 다름 - 용량을 줄이는 효과)
CNVseq 으로 CNV calling함
각 나라들이 Genome sequencing 하는 이유
- 영국 100K, 유럽 - 내수 진작을 위해서
- 미국 기업 이윤 기반 - HLI 회사 (샌디애고) - 특정한 병 보다는 장수 등.
이렇게 돈을 들여 100K, MVP 등을 하는 이유 - EMR과 연계되어 있기 때문
질문 - CNVseq이 적절히 CNV calling 하는가 - 꽤 괜찮은 성능을 보인다고 함
Life, Genome, Compulution, and Bioinformatics #
(, UNIST 박종화)
Genomics & Covolution hypothesis - 진화에는 진화를 가능하게 하는 보이지 않는 규칙이 있을 것임. 이 분석을 위해 다양한 생물종의 게놈분석을 진행함. 휴대폰, 자동차 잘 만드는 연구보다 훨씬 가치있는 연구임. 생명을 연구하고, 건강하게 살 수 있는 방법을 연구하는 것임.
고래게놈 minke의 경우, 냄새관련 유전자 수가 확 줄어 듬. 처해진 환경과 상황에 따라 기능 유전자의 갯수가 늘어나거나 줄어들 수 있음. 다이나믹한 유전체 변화가 관여함.
Multiscale Data Analysis for Complex Injury Responses in Multiple Organ Systems #
(, 고려대 석준희)
Complex disease로 인한 의료 개선 어려움. 이를 Muiti scale analysis 로 분석하고자 함.
Severe Injury가 있으면, Immune system에 변화가 생길 수 있음. 이를 white blood cell로 Expression profile 분석함 - Genomic storm
- Early activation
- late activation
- early suppression
- late suppression
Network analysis for therapeutic target discovery - 64 associated genes - interferon이 네트워크 중심에 있음. - Therapeutic target을 찾을 수 있음
Trajectory of organ function scores
- neuro
- resp
- cardio
- renal
- hep
- hem
Recovery point
The analysis of times to multiple events
- complicated by missing observations or right-censoring
- Univariate survival analysis - Kaplan-Meier estimator
- Multivariate 일 경우 어렵다. - CenOpt, structured multivariate analysis
Resp 가 중요하다. The respiratory recovery may cause or at least is necessary for the recovery
in-depth genomic analysis와 systemitic 방식을 결합해서 예측모델을 만들고 생존분석했더니 더 회복이 좋아짐 - Differential treatments 가 가능하다.
Suggested Pages #
- 0.050 Fusion gene
- 0.050 TCGA
- 0.025 April 8
- 0.025 Pareto rule
- 0.025
- 0.025 May 17
- 0.025 AI
- 0.025 Protein-protein interaction
- 0.025 RNA splicing
- 0.025 April 21
- More suggestions...