반응형
안녕하세요
한주현입니다
생물정보학 코딩 연습과 파일 형식을 익히기 위한 포스팅 첫 번째 시간입니다
오늘은 VCF를 활용한 생물정보학 문제를 포스팅하겠습니다
문항) VCF파일에서 PASS filter하기
VCF (Variant Calling Format) 파일은 텍스트 형식의 파일로 meta-information lines, Header, data lines 로 구성되어있습니다
이번 문항에서는 VCF 의 Data Line에서 7번째 컬럼인 FILTER 컬럼에서 PASS로만 찍혀있는 line의 개수를 세어 출력하겠습니다.
문항에 해당하는 VCF는 아래의 VCF를 사용하세요.
https://raw.githubusercontent.com/KennethJHan/Bioinformatics_smalltalk_Python50/master/sampleVCF.vcf
VCF에 대한 자세한 설명은 아래 링크를 참고하시기를 바랍니다.
정답)
17
문항에 의문사항이 있으시면 댓글로 말씀 부탁드리겠습니다
그럼 다음 문항에서 만나요~
반응형
'생물정보학 > 생물정보학_연습문제' 카테고리의 다른 글
[Sequence] 04. DNA 서열에서 base count 하기 (1) | 2017.04.07 |
---|---|
[VCF] 03. VCF 파일에서 Variant 개수 count 하기 (1) | 2017.04.06 |
[VCF] 02. VCF 파일에서 SNP, InDel Count 하기 (1) | 2017.04.04 |
[공지] 생물정보학 연습문제 카테고리를 시작하며 (2) | 2017.04.03 |
댓글