Robust relationship inference in genome-wide association studies
#
Find similar titles
- (rev. 5)
- Hyungyong Kim
Structured data
- About
- KING
- GWAS
- DNA profiling
- Kinship analysis
- Date Published
- Publisher
- Bioinformatics
- URL
- http://www.ncbi.nlm.nih.gov/pubmed/20926424
혈연관계가 알려지지 않은 가족력 기반 GWAS를 위해 혈연관계 추정이 필요하다. 기존의 방법은 allele frequency에만 의존하며, 균질한 집단 구조를 가정해야 한다.
혈연관계는 kinship coefficient를 통해 추정할 수 있다. 수천의 데이터로부터 시뮬레이션한 결과 충분한 추정력이 있다. 이 알고리즘은 훨씬 빠르고, 효과적이다.
Table of Contents
Summary #
Introduction #
family-based GWAS, Population stratification 등 연구를 위해 잘못된 혈연관계는 보정되어야 한다.
기존의 방법들
- GRR (Graphical representation of relationship errors) -> IBS를 통해 outlier를 찾아냄
- PLINK's IBD statistics - IBS 평균과 HWE를 고려한 샘플수준 allele frequency를 통해 추정
Methods #
개체 i, j 에 대해
- \(\phi_{ij}\): kinship coefficient - 개체 i 와 j 에서 무작위로 SNP를 뽑았을 때 이것이 IBD일 확률
- \(\pi_{0ij}\): IBD0, 개체 i 와 j 가 IBD를 공유하지 않을 확률
- \(\pi_{1ij}\): IBD1, 개체 i 와 j 가 IBD를 하나 공유할 확률
- \(\pi_{2ij}\): IBD2, 개체 i 와 j 가 IBD를 두개 공유할 확률
$$ 2 \phi_{ij} = \frac{\pi_{1ij}}{2} + \pi_{2ij} $$
Relationship inference in a homogeneous population #
HWE에 의해, \(\pi_{0ij}\)과 \(\phi_{ij}\)를 추정하고, 이를 KING 테이블 참조하여 혈연관계를 추정할 수 있다.
Analytical framework for efficient computation #
bit operation으로 빠르게 계산
Robust relationship inference in the presence of population substructure #
Population stratification 정보를 알고 있으면, 좀 더 robust하게 추정할 수 있다.
HWE 가정이 약한 경우, kinship coefficient를 over-estimate 할 수 있다.
가족기반 추정 KING-homo에 비해 비 가족 기반 추정 KING-robust은 아닌 가족관계를 가족으로 추정할 가능성이 낮다.
Results #
Resolution of relationship inference varies with genotyping density #
Robust relationship inference in the presence of population stratification #
Robust relationship inference in a real GWAS #
Computational efficiency: minutes rather than days #
Discussion #
Use KING-homo when,
- homogeneous populations,
- relatively large sample sizes,
- allele frequencies at all SNPs
Use KING-robust when,
- under population stratification,
- a single set of allele frequencies for the given SNP panel is not appropriate for examination of the entire dataset,
- motivating our use of the robust estimator
Incoming Links #
Related Articles (Article 0) #
Related Software Applications (SoftwareApplication 1) #
Suggested Pages #
- 0.151 HISAT
- 0.111 DNA barcoding
- 0.108 PyCon Korea 2014 “DNA 데이터로 가족찾기” 발표 후기
- 0.058 Challenges in analysis and interpretation of microsatellite data for population genetic studies
- 0.025 Briefings in Bioinformatics
- 0.025 Hyungyong Kim
- 0.025 Big data
- 0.025 Shaun Purcell
- 0.024 September 26
- 0.024 Genetic drift
- More suggestions...