Skip to content

ENCODE #
Find similar titles

Encyclopedia of DNA Elements. Human Genome Project의 후속프로젝트로 Human genome의 세밀한 기능을 밝히고자 한다. (http://en.wikipedia.org/wiki/ENCODE)

ENCODE Project #

Motivation and significance #

인간의 유전자는 약 20,000개로 추정되고 있으며 전체 Human genome의 약 1.5%에 해당한다. (엑솜 영역) ENCODE 프로젝트는 junk DNA라고 알려진 나머지 영역의 기능을 밝히고자 한다.

각종 GWAS 연구에 의하면, 대략 90%의 SNP이 비 유전자영역에서 발견된다.

단백질 코딩 유전자는 Regulome, 즉 Promoter, transcriptional regulatory sequence 그리고 Chromatin 구조와 Histone 변형에 의해 조절된다. 이들 조절영역을 정확히 밝히는 것은 변이와 유전자별현, 질병발달의 관계를 알려줄 것이다.

Phase 1: The Pilot Project #

다양한 분석 방법들을 검토함. 타켓 영역 1%(30Mbp) 설정 후 분석. 타겟영역의 절반은 매뉴얼 선정, 나머지 절반은 임의로 선택함. 선정 기준은

  1. Gene density
  2. Non exonic conservation

결과는 2007-06-14, Nature에 공개됨. Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project.

다음과 같은 결과들을 얻었다.

  1. Human genome은 구석구석 전사된다. 하나의 메인 전사물과 연관된 다양한 전사물이 있다.
  2. 많은 새로운 Non-protein-coding transcripts, overlapping protein coding loci 발견함
  3. 기존에 몰랐던 다양한 전사개시지점을 확인함. 이들 중 다수는 Chromatin 구조와 서열 특이 결합 영역을 확인함.
  4. 조절영역은 전사개시지점 업스트림 뿐 아니라 다양하게 퍼져있음.
  5. Chromatin 접근과 Histone 변형 패턴은 전사개시지점의 존재와 활성에 의해 예측이 가능함
  6. DNase I hypersensitive 사이트는 Histone 변형 패턴을 가짐
  7. DNA replication 타이밍은 Chromatin 구조와 관련되어 있음
  8. 인간 집단내에서 기능요소의 다양성 발견

Phase 2: The Production Phase Project #

Human genome 전 영역으로 확대. 국제 규모 대형 프로젝트로 440명 과학자와 32개 연구그룹이 참여. 다음의 기본 분석들이 사용됨.

  1. ChIP-seq
  2. DNase I hipersensitivity
  3. RNA-seq
  4. Assays of DNA methylation

2012-09-06, Nature에 관련 결과들이 공개됨. Genomics: ENCODE explained 약 20여편이 다양한 저널에 추가 결과가 발표됨.

147 cell types, GWAS로 알게된 영역, 진화적 Biological constraints 영역들에 대한 결과들이 통합되어 다음의 결과들을 얻음.

  1. Human genome의 80.4%가 적어도 하나의 RNA 혹은 Chromatin 연관되어 있음. 많은 부분이 조절 기능임.
  2. 영장류 특이 요소들을 종합해 볼 때 negative selection임. 즉 이들이 특정 기능을 수행함.
  3. 7 chromatin states, 399,124 regions with Enhancer-like features, 70,292 regions with Promoter-like features.

Data management and analysis #

UCSC Genome Browser를 통해 공개됨. 결과를 웹에서 보기 쉽게 정리한 FactorBook 웹사이트도 있다.

기타 #

모델 생물종으로 확장한 modENCODE 프로젝트가 진행중이다.

ENCODE Data #

Assay #

Total 4052 assays

  1. ChIP-seq
  2. RNA-seq
  3. DNase-seq
  4. RNA Array
  5. RRBS,...

Biosamples #

Total 1702 samples

  1. by organism (Human, Mouse)
  2. by cell type (Immortalized cell line, tissue, primary cell, stem cell, in vitro differentiated cells, induced pluripotent stem cell line)
  3. by organ (brain, liver, skin, blood vessel, heart,...)
  4. by sex (female, male,...)
  5. by life stage (adult, embryonic, child, fetal, newborn, postnatal)

Antibodies #

Total 1451 antibodies

Data access #

REST API가 제공됨.

Incoming Links #

Related Medical Scholarly Articles #

Related Articles #

Related Codes #

Related Books #

Suggested Pages #

web biohackers.net
0.0.1_20140628_0