samtools 설치는 다음 링크를 참고해주세요.
설치 방법은 버전이 달라도 대개 비슷비슷합니다 ㅎㅎ;
http://korbillgates.tistory.com/57
이 부분에 대해서는 다음 포스팅에서 만나도록 하겠습니다 ㅎㅎㅎ
98499 + 0 secondary
0 + 0 supplementary
8745257 + 0 duplicates
105925730 + 0 mapped (99.85% : N/A)
105987314 + 0 paired in sequencing
52993657 + 0 read1
52993657 + 0 read2
104310118 + 0 properly paired (98.42% : N/A)
105690822 + 0 with itself and mate mapped
136409 + 0 singletons (0.13% : N/A)
991440 + 0 with mate mapped to a different chr
858383 + 0 with mate mapped to a different chr (mapQ>=5)
bam 파일을 samtools view 로 열어서 보면 아래처럼 나오는데 두번째 컬럼인 FLAG 를 보시면..
Query template NAME |
bitwise FLAG |
Reference sequence NAME |
1-base leftmost mapping POSition | MAPping Quality |
ABCD:123:12345AA:1:1234:1234:1234 |
145 |
chr1 |
51 | 60 |
ABCD:123:12345AA:1:1234:5234:2213 |
1105 |
chr1 |
51 | 60 |
ABCD:123:12345AA:1:1234:6234:4241 |
81 |
chr1 |
51 | 60 |
이런식으로 duplicate를 FLAG 형식으로 표시해줍니다.
우리는 FLAG 정보로 duplicate를 골라낼 수 있는 것 이지요..
Bit |
Description |
1 |
template having multiple segments in sequencing |
2 |
each segment properly aligned according to the aligner |
4 |
segment unmapped |
8 |
next segment in the template unmapped |
16 |
SEQ being reverse complemented |
32 |
SEQ of the next segment in the template being reverse complemented |
64 |
the first segment in the template |
128 |
the last segment in the template |
256 |
secondary alignment |
512 | not passing filters, such as platform/vendor quality controls |
1024 | PCR or optical duplicate |
2048 | supplementary alignment |
ABCD:123:12345AA:1:2421:4334:2241 1187 chr1 68 60
ABCD:123:12345AA:1:3131:2134:5313 1123 chr1 98 60
ABCD:123:12345AA:1:4124:3214:1143 1107 chr1 169 60
samtools를 가지고 duplicate read를 골라내는 방법에 대해 알아보았습니다.
'생물정보학 > Tools' 카테고리의 다른 글
[samtools] BAM 파일에서 특정 chromosome 영역 추출하기 (0) | 2017.11.22 |
---|---|
[SnpEff] SnpEff 사용방법2 VCF annotation, SnpEff ANN field, Sequence Ontology term 설명 (5) | 2017.10.31 |
[GATK] GATK 오류 - "Problem detecting index type" 해결법 (0) | 2017.10.16 |
[dbSNP] rsID 로 chromosome position, gene 찾기 (0) | 2017.08.04 |
[dbSNP] dbSNP rest API 사용법 - rsID 로 chromosome position 찾기 (0) | 2017.04.26 |
댓글