본문 바로가기
생물정보학/Tools

[생물정보학] VCF에서 snpEff html report의 정보 내용 가져오기

by HanJoohyun 2018. 11. 16.
반응형




 


안녕하세요 한주현입니다.

오늘은 VCF 파일에서 snpEff html report의 정보들을 가져오는 방법에 대해 알아보겠습니다.


목차

0. 시작하며
1. VCF 파일 파싱



0. 시작하며

블로그를 방문해주신 선생님께서 vcf파일을 snpEff 에 넣어 나오는 html report 의 스탯 뽑는 방법에 대해 문의해주셨습니다.

VCF 파일을 파싱하면 되겠군요. 파이썬으로 진행해보겠습니다.

다음 예시에서는 Variants rate details 와 Number variants by type 을 뽑아보겠습니다.

코딩 한 번 해보죠.. ㅋㅋ





1. VCF 파일 파싱

다음과 같이 코드를 만들어봤습니다. VcfParser 의 메서드 부분의 역할을 보시면서 필요한 부분 가져가심 될 것 같습니다.



실행하면 다음과 같이 나옵니다.
1
2
3
4
5
6
7
8
$ python 181116.py test.chrY.ann.vcf 
Variants rate details
Chromosome    Length        Variants    Variants rate
Y            59373566    6862        8652
SNP    6369
INS    174
DEL    319
 



오늘은 VCF에서 snpEff html report의 정보 내용 가져오는 파이썬 스크립트에 대해 알아보았습니다.

도움이 되셨음 좋겠네요

그럼 다음에 만나요~~ 





기부 버튼을 만들었습니다
단지 $1 의 작은 정성도 저에게는 큰 힘이 됩니다
기부해주신 분들을 기억하며
더 좋은 내용으로 보답해 드리겠습니다 :)

Donate 버튼은 paypal 결제로 paypal 계정이 없으시더라도
카드로도 기부 가능하십니다 :)
Use your credit card or bank account (where available). 옆의 continue 를 누르시면 됩니다

한주현 드림



 



반응형

댓글