Structured data
암(Cancer)은 유전체(Genome)의 고장(Aberration)으로 생기는 질병이다. 최근 고밀도 유전자 발현분석(mRNA array Gene expression)과 대량서열결정기술(NGS)의 발전으로 이 유전체 고장을 자세히 들어다 볼 수 있었고, 주요 원인 메커니즘들이 속속 밝혀지고 있다. 이 고장의 패턴은 실제로 매우 다양하게 일어나는데, 고장의 패턴에 따라 다른 치료를 하고자 하는 것이 암 맞춤의학(Personalized medicine)이다. 분자 수준의 정밀한 의료라는 의미로 정밀의학(Precision medicion)이라고도 한다. 생물정보학, 빅데이터 분석(Data analysis) 등 최신의 정보분석 기술들을 접목하여 암 환자별 맞춤치료를 효과적으로 수행할 수 있는 시스템을 갖추는 것은 이쪽 분야의 가장 큰 도전과제이자 화두가 되고 있다. 이에 관련 내용들을 개략적이고 알기쉽게 리뷰하고자 한다.
Table of Contents
암 유전체 #
지금 막 수술실에서 조직검사용으로 추출한 암 조직을 상상해보자. 이 세포들은 왜 정상과 다를까? 이 원인을 알기 위해 현미경적인 방법, 과 발현 단백질 분석 (항원항체반응 등)을 수행했던 것이 고전적인 방법이였다면, 지금은 전체 유전자 발현 정도와 변이 유무를 통해 그 원인을 밝히려 하고 있다.
암의 시작은 누적되는 유전체 고장이다. 자외선, 발암물질 등 DNA를 고장나게 하는 요인에 지속적으로 노출되면 세포의 생장 및 사멸에 관련된 유전자들도 고장날 확률이 높아지고, 결국 고장나며, 머지않아 불멸의 길을 가게 된다. 정상세포에서는 발현되지 않다가 암세포가 되면서 발현되는 유전자들을 온코진(Oncogene, 종양형성유전자)이라고 하고, 정상세포에서 특정 기능을 수행하다가 암세포에서 발현되지 않는 유전자들을 TSG(Tumor suppressor gene, 종양억제유전자)라고 한다. 일반적으로 세포 분열 및 성장에 관련된 유전자가 온코진이고, 세포 자살 프로그램(Apotosis) 및 DNA 수리(DNA repair) 관련 유전자가 TSG에 해당된다. 암은 온코진의 발현과 TSG의 비발현 때문이다.
(표1. 주요 Oncogene과 그 활성 (Robbins and Cotran Pathologic Basis of Disease))
(표2. 주요 Tumor suppressor gene과 그 기능 (Robbins and Cotran Pathologic Basis of Disease))
Category | TSG | Function |
---|---|---|
Inhibitor of mitogenic signaling pathway | APC | Inhibitor of WNT signaling |
Inhibitor of mitogenic signaling pathway | NF1 | Inhibitor of RAS/MAPK signaling |
Inhibitor of mitogenic signaling pathway | NF2 | Cytoskeletal stability, Hippo pathway signaling |
Inhibitor of mitogenic signaling pathway | PTCH | Inhibitor of Hedgehog signaling |
Inhibitor of mitogenic signaling pathway | PTEN | Inhibitor of PI3K/AKT signaling |
Inhibitor of mitogenic signaling pathway | SMAD2, SMAD4 | TGF beta signaling pathway, repression of MYC and CDK4 expression, inducers of CDK inhibitor expression |
Inhibitor of cell cycle pregression | RB | Inhibitor of G1/S transition |
Inhibitor of cell cycle pregression | CDKN2A | p16: negative regulator of CDK; p14, indirect activator of p53 |
Inhibitor of "pro-growth", Angiogenesis | VHL | Inhibitor of hypoxia-induced transcription factor |
Inhibitor of "pro-growth", Angiogenesis | STK11 | Activator of AMPK family of kinases; suppresses cell growth when cell nutrient and energy levels are low |
Inhibitor of "pro-growth", Angiogenesis | SDHB, SDHD | TCA cycle, oxidative phosphorylation |
Inhibotor of invasion and Metastasis | CDH1 | Cell adhesion, inhibition of cell motility |
Enablers of genomic stability | TP53 | Cell cycle arrest and Apoptosis in response to DNA damage |
DNA repair factor | BRCA1, BRCA2 | Repair of double-stranded breaks in DNA |
DNA repair factor | MSH1, MLH1, MSH6 | DNA mismatch repair |
Unknown | WT1 | Transcription factor |
Unknown | MEN1 | Transcription factor |
가장 대표적인 유전체 고장은 CNV(Copy-number variation)이다. 보통 암세포에서의 CNV를 SCNA(Somatic copy-number alteration)라고 하는데, 유전되는 단일염기변이를 SNV(Single nucleotide variation)라고 하고, 유전되지 않는 체세포 변이를 그냥 Somatic mutation이라고 하는 것처럼, CNV는 유전되는 변이, SCNA는 유전되지 않는 체세포 Copy-number 변이라는 의미로 통용된다. 암세포 입장에서 온코진을 발현시키고 TSG를 비발현시키는 가장 쉬운 방법은 유전체 카피수를 바꾸는 것이다. 카피수가 늘어나는 것을 증폭(amplify), 카피수가 0이 되는 것을 삭제(delete)라고 표현한다. 실제로 성장호르몬, 세포분열 관련 유전자 등이 증폭되고, Apoptosis 관련 유전자들이 삭제되거나, 변이로 기능이 정지된다. SCNA는 SNP array와 유사한 고밀도 CNV array(예, Genome-Wide Human SNP Array 6.0)로 확인할 수 있으며, NGS 데이터로부터 SCNA를 추정하는 문제는 중요한 생물정보학 도전과제중 하나이다.
다음으로 중요한 고장이 유전자 변이에 의한 기능 상실(Loss-of-function variant) 혹은 기능획득(Gain-of-function variant)이다. MYC와 같은 다중 기능 전사 인자(multi function transcription factor)가 그 기능을 상실하면 특정 Biological pathway가 우르르 활성화되거나 정지된다. 유전자 변이를 확인하려면 시퀀싱해야 하기에 오늘날 NGS가 의료분야 응용사례로 부각되고 있다. WES로 유전자부분만 볼 수 도 있고, WGS로 유전자가 아닌 부분도 보려는 시도가 있으며, Foundation Medicine 같은 기업은 암 관련 유전자만 별도로 딥 시퀀싱(Deep sequencing) 할 수 있는 패널(Panel)을 만들어 서비스하고 있다. OncoPanel_v2 상용패널은 500개의 암 관련 주요 유전자와 전좌확인용 인트론(Translocation intron)으로 구성되어 있고 약 2.9 Mb 영역을 딥 시퀀싱한다. (참고로 WES는 44Mb를 시퀀싱함)
(그림 1. TCGA Breast cancer 환자들의 Receptor tyrosine kinase signaling pathway 관련 유전자 증폭, 변이 현황 (cBioPortal) - 많은 환자에게서 Growth factor인 EGFR과 Growth factor receptor인 ERBB2 유전자가 증폭되어 있음을 알 수 있다)
많은 경우, 암 관련 유전자 증폭과 변이로 발암 메카니즘을 설명하지만 그 외의 또 다른 요인 중 하나가 후성유전학적(Epigentics) 원인이다. 암세포는 특정 유전자를 발현시키거나 정지시키기 위해 증폭, 변이 말고도 DNA 메틸화(DNA methylation) 혹은 microRNA 변이도 활용한다. TSG 유전자 부근을 메틸화시키거나 shRNA(small hairpin RNA)로 동작하여 특정 유전자의 발현을 막거나 활성화시키는 방식이다. 유전자 증폭(SCNA) 및 변이(mutation)는 비가역적인 변화여서 돌이킬 수 없으나, 후성유전체학적 변화는 가역적이어서(reversible) 관련 메카니즘을 방해하는 적절한 약물을 개발하는 연구가 활발하다. 그밖에 일부 암에서 발견되는 유전자융합(Gene funsion)도 원인 중 하나이며 염색체 전좌(Translocation)와 같은 구조변이(Structural variation) 때문이다. 정상 신호전달경로에 엉뚱한 신호를 내며 온코진 역할을 한다.
암 맞춤의학 #
최근 개정된 병리학 교과서(Robbins and Cotran Pathologic Basis of Disease, 9th edition) 7장 Neoplasm 부분을 보면 암 전이(Metastasis)의 분자적 메커니즘이 모두 밝혀졌다라고 시작하고 있다. 그만큼 발암, 침범, 전이, 재발 등과 관련된 많은 암 관련 분자적 메커니즘들이 이미 많이 밝혀졌고, 또 계속 밝혀지고 있다. 전체 유전자 발현 관점에서 많은 부분의 발암 메커니즘을 설명할 수 있고 이에 맞는 치료 방법을 제안할 수 있다. 가장 유명한 예는 HER2 양성 유방암(Breast cancer) 환자에게 있는 HER2 유전자 증폭을 허셉틴(Herceptin, Trastuzumab)이라는 타겟 약물로 치료가 가능하게 한 사례로 원인 유전자를 발견하고 이 유전자를 기능하게 혹은 못하게 하는 약물을 처방하는 암 맞춤의학 시대로의 진입을 알렸다.
실제 암 유전자 변이는 환자마다 매우 다양하다. 특정 Biological pathway에 누구는 어떤 유전자가 증폭되어 있고, 누구는 어떤 유전자가 고장난 상태일 것이다. 이 상태의 Biological network를 분석하면 어떤 유전자를 타겟하면 암세포를 사멸시킬 수 있을지 알 수 있다. 하나의 유전자 고장으로는 죽지 않지만, 두개 이상이 동시에 고장일 경우 세포가 죽는 현상을 합성치사(Synthetic lethality)라고 하는데, 암세포는 이미 특정 유전자가 고장이므로, 조합으로 고장시 세포가 죽게 될 유전자를 찾아 그 유전자를 타겟으로 하는 약물을 만들면 암세포만 선택적으로 죽일 수 있다. DrugBank 데이터베이스를 참고하면, 특정 유전자를 타겟으로 하는 FDA 승인 약물과 연구중 약물을 알 수 있다.
(그림 3. 암 합성치사 네트워크를 이용한 약물 개발과 예후 분석 (Cell 158, 2014))
많은 암환자들에서 공통적인 유전적 패턴들이 있고, 쉽게 그 타겟을 알 수 있는 것도 있지만, 반면 복잡한 경우도 있다. 이 경우, 단일 데이터의 분석 보다는 다차원 수준이 더 효과적이다. 소개한 것처럼 체세포 CNV, SNV, DNA 메틸화(DNA methylation), mRNA, mircoRNA 발현을 종합하여 분석하려는 다중 암유전체 데이터 통합 분석 기법들이 기계학습 알고리즘과 함께 다양하게 개발되고 있다. 일례로, iCluster는 다양한 데이터를 토대로 적절히 군집화하며, iBAG은 유전자발현과 DNA메틸화 사이의 연관관계를 평가한다. CNAmet은 CNV, DNA 메틸화, mRNA 발현을 통합분석하여 상호작용(synergistic) 효과를 측정한다.
당면과제와 향후 미래 #
암유전체 분석을 어렵게 하는 요인 가운데 하나는 암세포들이 하나의 조직내에서도 서로 매우 다르다는 것(Tumour heterogeneity)이다. 암세포 시료의 NGS 데이터는 정상세포도 섞여있는 혼재된 상태다. 이 문제를 해결하기 위해 단일세포시퀀싱 기술들이 함께 발전하고 있긴 하지만, 좀 더 다른 차원의 정보 분석 방법을 필요로 한다.
암은 정복될 수 있을까? 인류의 숙원과도 같은 이 문제는 암 맞춤의학 방법으로 머지않아 곧 가능해질 것이다. 그 미래는 생물정보학, 빅데이터 분석기술의 발전이 핵심 역할을 수행할 것이다. 암을 정복한 그 방식은 곧바로 다른 복합질병(Complex disease)에도 효과를 낼 것이며, 더 나아가 정상인의 예방의학 즉, 아예 병에 걸리지 않도록 하는 방향으로 발전할 것이다. 또한 최근 유전체 편집기술 (Genome editing)의 발전은 원한다면 유전체마저도 바꿀 수 있는 그야말로 상상하기도 어려운 미래가 머지 않았음을 말해주고 있다. 이 모든 미래에 생물정보기술이 중심에 있음은 두말할 나위가 없다.
Suggested Pages #
- 0.147 상대적이며 절대적인 지식의 백과사전
- 0.082 Passengers
- 0.067 Low-density lipoprotein
- 0.038 파피용
- 0.025 Nature Communications
- 0.025
- 0.025 Enhancer
- 0.025 Telomerase
- 0.025 DNMT3a
- 0.025 NEAT1
- More suggestions...