Skip to content

An evaluation of copy number variation detection tools from whole-exome sequencing data #
Find similar titles

WES 데이터로 CNV calling from NGS data하는 프로그램 성능 평가 - XHMM, CoNIFER, ExomeDepth, CONTRA

Summary #

Introduction #

5 main methods for detecting CNVs with paired-end NGS data

  1. RD (read depth)
  2. PEM (paired-end mapping)
  3. SR (split read)
  4. AS (assembly)
  5. a combination of the above

NGS CNV 도구는 대개 RD 방법을 기본으로 사용함

평가는 germline structural variation에 초점을 맞춤

도구별 설명

Materials and Methods #

Samples and Ethics Statement #

33 WES (9 trios, 13 also WGS)

WES/WGS and CNV Detection #

NCBI build 37 (hg19), 각 프로그램 버전 표시 및 구동 옵션은 디폴트

Preparing the tagSNP Dataset #

Results #

CNV Size and Distribution #

CNV Concordance with WGS Data #

Common CNV Discovery by tagSNPs #

CNV Mendelian Error Rates #

Heterozygosity Checks for Deletions #

Concordance Across CNV-Calling Algorithms #

Discussion #

본 연구의 목적은 4개의 도구를 종합 평가하여, 연구자들에게 어떤 프로그램을 쓰는 것이 좋을지 의사결정을 지원하기 위함

Low Sensitivity and Specificity #

대부분의 프로그램이 RD 방법을 사용함. PCA/SVD or GC-content bias correaction 방식의 정규화 이후 RD 신호분포는 diploid region에서 다르게 나타나고, 이를 통해 duplication인지 deletion인지 추정함

이 방식은 많은 한계가 있음

  1. resolution is often poor - PEM, SR 방식에 비해 작은 CNV를 찾기 어려움
  2. systemic group effect를 제거하기 어려움

Advantages and Disadvantages for Each Tool #

PCA/SVD의 단점은 batch analysis에 의존한다는 점. small sample size가 잘못된 batch effect를 가져올 수 있음. 따라서 read depth method보다 low sensitivity.

HMM은 모든 size의 full spectrum을 detection.

Limitations and Suggestions #

이 연구에서 aCGH나 SNP array result가 아닌 WGS result를 gold standard로 가정함. sensitivity를 높일 순 있지만 다양한 size의 CNV는 array basd CNV가 더 정확함.

아직 WES based CNV detection에 많은 과제들이 남아있으며 사용자들은 위의 문제점을 고려해 자신의 연구에 가장 적합한 tool을 선택해 study design할 것을 당부함.

Incoming Links #

Related Articles #

Suggested Pages #

web biohackers.net
0.0.1_20140628_0