본문 바로가기
반응형

VCF18

[GATK] VCF란, gVCF란, VCF와 gVCF의 차이점 - Variant Calling Format 설명, genomic VCF 안녕하세요 한주현입니다. 오늘은 GATK의 결과 파일 중 gVCF와 VCF의 차이점과 gVCF가 무엇인지 대해서 알아보겠습니다. 요새 들어 GATK에 대해서 포스팅을 많이 쓰고 있네요 ㅎㅎ;; 워낙 GATK 안에 많은 기능들이 들어있고 개발도 활발히 진행되고 있으며 실제 분석을 진행 할 때도 유용하고 잘 사용하고 있기에 저도 정리 하며 여러분들께 도움이 되려고 포스팅을 남깁니다 :) 간단하지만 VCF가 무엇인지, gVCF가 무엇인지 알아보면 두 포맷간의 차이를 알 수 있겠죠? VCF란? VCF는 Variant Calling Format 의 약자로 Meta 정보가 담긴 라인과 헤더, 그리고 데이터 라인이 있습니다. Meta 정보는 두개의 샾(##), Header는 샾(#) 으로 시작하며 데이터 라인은 탭(.. 2018. 3. 4.
[SnpEff] SnpEff 사용방법2 VCF annotation, SnpEff ANN field, Sequence Ontology term 설명 안녕하세요 한주현 입니다. 오늘은 SnpEff 로 VCF annotation하는 간단한 명령어와 annotation된 VCF의 컬럼에서 ANN field 중 annotation, Annotation_Impact 컬럼에 대해 알아보겠습니다. SnpEff 설치 방법에 대해 찾으신다면 다음 링크를 참고해주세요http://korbillgates.tistory.com/61 SnpEff 사용방법1 - 다운로드 및 설치, vcf annotation 위의 링크에서도 알아봤듯이 VCF annotation 하는 명령어를 간단히 리뷰해보도록 하겠습니다. SnpEff로 VCF annotation 하는 방법 java -jar snpEff.jar hg19 in.vcf > out.vcf java 1.7이상 에서 작동하며 라인이 많.. 2017. 10. 31.
[GATK] GATK 오류 - "Problem detecting index type" 해결법 안녕하세요 한주현 입니다 오늘은 GATK 오류메시지인 "Problem detecting index type" 해결법에 대해 알아보겠습니다 현상 $ java -Xmx40g -Djava.io.tmpdir=/tmp -jar GenomeAnalysisTK.jar -T GenotypeGVCFs -R ucsc.hg19.fasta --variant multicall.gvcf.list --out rawVariants.vcf INFO 10:52:58,657 HelpFormatter - ----------------------------------------------------------------------------------------- INFO 10:52:58,659 HelpFormatter - The Genom.. 2017. 10. 16.
[VCF] 03. VCF 파일에서 Variant 개수 count 하기 안녕하세요 한주현입니다 생물정보학 코딩 연습과 파일 형식을 익히기 위한 포스팅 세 번째 시간입니다 오늘은 VCF를 활용한 생물정보학 문제를 포스팅하겠습니다 문항) VCF 파일에서 Variant 개수 count 하기 VCF (Variant Calling Format) 파일은 텍스트 형식의 파일로 meta-information lines, Header, data lines 로 구성되어있습니다 이번 문항에서는 VCF에서 variant의 개수를 세어보겠습니다.샾(#) 으로 시작하는 Meta-information 과 Header Line을 제외한 line의 개수를 세어보면 variants의 개수가 나오게 됩니다. 주의! 위의 예시 VCF에서 세 번째 data line (chr20 1110696) 에서 5번째 컬럼.. 2017. 4. 6.
반응형