ENCODE
#
Find similar titles
- (rev. 12)
- Hyungyong Kim
Structured data
Encyclopedia of DNA Elements. Human Genome Project의 후속프로젝트로 Human genome의 세밀한 기능을 밝히고자 한다. (http://en.wikipedia.org/wiki/ENCODE)
Table of Contents
ENCODE Project #
Motivation and significance #
인간의 유전자는 약 20,000개로 추정되고 있으며 전체 Human genome의 약 1.5%에 해당한다. (엑솜 영역) ENCODE 프로젝트는 junk DNA라고 알려진 나머지 영역의 기능을 밝히고자 한다.
각종 GWAS 연구에 의하면, 대략 90%의 SNP이 비 유전자영역에서 발견된다.
단백질 코딩 유전자는 Regulome, 즉 Promoter, transcriptional regulatory sequence 그리고 Chromatin 구조와 Histone 변형에 의해 조절된다. 이들 조절영역을 정확히 밝히는 것은 변이와 유전자별현, 질병발달의 관계를 알려줄 것이다.
Phase 1: The Pilot Project #
다양한 분석 방법들을 검토함. 타켓 영역 1%(30Mbp) 설정 후 분석. 타겟영역의 절반은 매뉴얼 선정, 나머지 절반은 임의로 선택함. 선정 기준은
- Gene density
- Non exonic conservation
결과는 , Nature에 공개됨. Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project.
다음과 같은 결과들을 얻었다.
- Human genome은 구석구석 전사된다. 하나의 메인 전사물과 연관된 다양한 전사물이 있다.
- 많은 새로운 Non-protein-coding transcripts, overlapping protein coding loci 발견함
- 기존에 몰랐던 다양한 전사개시지점을 확인함. 이들 중 다수는 Chromatin 구조와 서열 특이 결합 영역을 확인함.
- 조절영역은 전사개시지점 업스트림 뿐 아니라 다양하게 퍼져있음.
- Chromatin 접근과 Histone 변형 패턴은 전사개시지점의 존재와 활성에 의해 예측이 가능함
- DNase I hypersensitive 사이트는 Histone 변형 패턴을 가짐
- DNA replication 타이밍은 Chromatin 구조와 관련되어 있음
- 인간 집단내에서 기능요소의 다양성 발견
Phase 2: The Production Phase Project #
Human genome 전 영역으로 확대. 국제 규모 대형 프로젝트로 440명 과학자와 32개 연구그룹이 참여. 다음의 기본 분석들이 사용됨.
- ChIP-seq
- DNase I hipersensitivity
- RNA-seq
- Assays of DNA methylation
, Nature에 관련 결과들이 공개됨. Genomics: ENCODE explained 약 20여편이 다양한 저널에 추가 결과가 발표됨.
147 cell types, GWAS로 알게된 영역, 진화적 Biological constraints 영역들에 대한 결과들이 통합되어 다음의 결과들을 얻음.
- Human genome의 80.4%가 적어도 하나의 RNA 혹은 Chromatin 연관되어 있음. 많은 부분이 조절 기능임.
- 영장류 특이 요소들을 종합해 볼 때 negative selection임. 즉 이들이 특정 기능을 수행함.
- 7 chromatin states, 399,124 regions with Enhancer-like features, 70,292 regions with Promoter-like features.
Data management and analysis #
UCSC Genome Browser를 통해 공개됨. 결과를 웹에서 보기 쉽게 정리한 FactorBook 웹사이트도 있다.
기타 #
모델 생물종으로 확장한 modENCODE 프로젝트가 진행중이다.
ENCODE Data #
Assay #
Total 4052 assays
Biosamples #
Total 1702 samples
- by organism (Human, Mouse)
- by cell type (Immortalized cell line, tissue, primary cell, stem cell, in vitro differentiated cells, induced pluripotent stem cell line)
- by organ (brain, liver, skin, blood vessel, heart,...)
- by sex (female, male,...)
- by life stage (adult, embryonic, child, fetal, newborn, postnatal)
Antibodies #
Total 1451 antibodies
Data access #
Incoming Links #
Related Articles (Article 0) #
Related Medical Scholarly Articles (MedicalScholarlyArticle 1) #
- Methods of integrating data to uncover genotype–phenotype interactions
- Practical guidelines for the comprehensive analysis of ChIP-seq data
Related Books (Book 2) #
Related Codes (Code 3) #
Suggested Pages #
- 0.139 cyvcf2
- 0.092 Bowtie
- 0.087 Microbiome
- 0.082 BWA
- 0.031 Microsatellite
- 0.029 gnomeAD
- 0.025 Gene expression
- 0.025 October 24
- 0.025 September 25
- 0.025
- More suggestions...