Sensitive detection of somatic point mutations in impure and heterogeneous cancer samples
Abstract
Detection of somatic point substitutions is a key step in characterizing the cancer genome. However, existing methods typically miss low-allelic-fraction mutations that occur in only a subset of the sequenced cells owing to either tumor heterogeneity or contamination by normal cells. Here we present MuTect, a method that applies a Bayesian classifier to detect somatic mutations with very low allele fractions, requiring only a few supporting reads, followed by carefully tuned filters that ensure high specificity. We also describe benchmarking approaches that use real, rather than simulated, sequencing data to evaluate the sensitivity and specificity as a function of sequencing depth, base quality and allelic fraction. Compared with other methods, MuTect has higher sensitivity with similar specificity, especially for mutations with allelic fractions as low as 0.1 and below, making MuTect particularly useful for studying cancer subclones and their evolution in standard exome and genome sequencing data.
Link
Comment
MuTect은 Broad Institute에서 개발한 Somatic point Mutation을 찾는 툴 중에 공개 된 버전입니다. (더 좋은건 비공개) 논문에서는 툴에 대한 알고리즘 설명과 왜 타 툴들보다 MuTect이 왜 좋은지 설명 되있습니다. 솔직히 다른 툴이 별로 없고 성능 테스트 하기가 까따로운 (cancer data의 양) 분야 이다 보니 성능이 얼마나 좋은지는 불명확 합니다. (정보: 교수님이 만들고 싶어 하시는 툴)
sequencing artifect에 의한 variant를 filtering 하는 부분이 재미있네. 이 부분의 논리는 mapping 해서 뭔가를 하는 사람이라면 교양적으로 알아야겠다. (1) 가까운 주변에 indel이 있다. (2) mapping의 similarity 낮다. (3) Triallelic site.. 이건 편의상 filtering하는 것 같은데 ㅠ
답글삭제(4) variant read가 한쪽 strand 에만 몰릴시 (5) 몰려있는 variants , 아마도 misalignment
그리고 (6) (7) control로 normal sample을 사용하는게 있네. Matched normal sample filter와 panel of normal samples 두 개 서로 다른 filter가 있는데 어떻게 다른지 잘 와닿지 않는다 ㅜ 아는 사람?
matched 는 해당 환자 자신의 normal sample로 filtering,
삭제panel 은 그 환자 말고도 다른 사람들의 normal sample들로 filtering 하는 차이인 걸로 알고 있어요