본문 바로가기
생물정보학/생물정보학_연습문제

[VCF] 01. VCF 파일에서 PASS filter 하기

by HanJoohyun 2017. 4. 3.
반응형


안녕하세요


한주현입니다


생물정보학 코딩 연습과 파일 형식을 익히기 위한 포스팅 첫 번째 시간입니다


오늘은 VCF를 활용한 생물정보학 문제를 포스팅하겠습니다



문항) VCF파일에서 PASS filter하기

VCF (Variant Calling Format) 파일은 텍스트 형식의 파일로 meta-information lines, Header, data lines 로 구성되어있습니다



이번 문항에서는 VCF 의 Data Line에서 7번째 컬럼인 FILTER 컬럼에서 PASS로만 찍혀있는 line의 개수를 세어 출력하겠습니다.

문항에 해당하는 VCF는 아래의 VCF를 사용하세요.

https://raw.githubusercontent.com/KennethJHan/Bioinformatics_smalltalk_Python50/master/sampleVCF.vcf



VCF에 대한 자세한 설명은 아래 링크를 참고하시기를 바랍니다.

https://samtools.github.io/hts-specs/VCFv4.2.pdf






정답)

17

 



  문항에 의문사항이 있으시면 댓글로 말씀 부탁드리겠습니다


  그럼 다음 문항에서 만나요~



반응형

댓글