본문 바로가기
반응형

2017/0414

[VCF] 03. VCF 파일에서 Variant 개수 count 하기 안녕하세요 한주현입니다 생물정보학 코딩 연습과 파일 형식을 익히기 위한 포스팅 세 번째 시간입니다 오늘은 VCF를 활용한 생물정보학 문제를 포스팅하겠습니다 문항) VCF 파일에서 Variant 개수 count 하기 VCF (Variant Calling Format) 파일은 텍스트 형식의 파일로 meta-information lines, Header, data lines 로 구성되어있습니다 이번 문항에서는 VCF에서 variant의 개수를 세어보겠습니다.샾(#) 으로 시작하는 Meta-information 과 Header Line을 제외한 line의 개수를 세어보면 variants의 개수가 나오게 됩니다. 주의! 위의 예시 VCF에서 세 번째 data line (chr20 1110696) 에서 5번째 컬럼.. 2017. 4. 6.
[bedtools 사용방법] bedtools를 이용하여 vcf 의 특정 범위 꺼내기 안녕하세요 한주현 입니다 오늘은 bedtools를 이용하여 vcf에서 필요한 영역을 꺼내는 작업을 해보겠습니다. 물론 스크립트를 작성하여 작업하는 방법도 있겠습니다만, 빌게이츠가 좋아하는 명언 중 하나인, Do not reinvent the wheel.(바퀴를 다시 발명하지 말라.) 라는 말 처럼 이번 시간에는 있는 tool을 사용해보도록 하겠습니다 bedtools 설치에 대해서는 다음 링크를 참조해 주세요 [bedtools] bedtools 설치 방법 - How to install bedtools http://korbillgates.tistory.com/66 여담으로 도전정신이 있으신 분들께서는 아래의 예시를 프로그래밍하여 해결해보시기를 바랍니다 :) VCF 의 특정 범위 꺼내는 방법 먼저 이번 실습에.. 2017. 4. 4.
[bedtools] bedtools 설치 방법 - How to install bedtools 안녕하세요 한주현입니다. 오늘은 bedtools 설치방법에 대해서 말씀드리겠습니다. bedtools는 UNIX(LINUX)나 OSX machine 에서 사용가능합니다. source code 설치 방법$ wget https://github.com/arq5x/bedtools2/releases/download/v2.25.0/bedtools-2.25.0.tar.gz $ tar -zxvf bedtools-2.25.0.tar.gz $ cd bedtools2 $ make 기본적으로는 /usr/local/bin 에 설치가 됩니다. 소스코드 설치가 어려우신 분 들은 아래를 참고하시면 됩니다. Centos$ yum install BEDTools Ubuntu$ apt-get install bedtools 참고 URLhttp.. 2017. 4. 4.
[VCF] 02. VCF 파일에서 SNP, InDel Count 하기 안녕하세요 한주현입니다 생물정보학 코딩 연습과 파일 형식을 익히기 위한 포스팅 두 번째 시간입니다 오늘은 VCF를 활용한 생물정보학 문제를 포스팅하겠습니다 문항) VCF파일에서 SNP, InDel count하기VCF (Variant Calling Format) 파일은 텍스트 형식의 파일로 meta-information lines, Header, data lines 로 구성되어있습니다 VCF의 Data Line에서 4번째 컬럼과 5번째 컬럼인 REF와 ALT를 보겠습니다. REF는 Reference base(s)로 hg19, hg38 과 같이 기준이 되는 서열에서 각 해당 position에서의 서열을 의미합니다.ALT는 Alternate base(s)로 sequencer 에서 읽어낸 base가 REF 와 .. 2017. 4. 4.
반응형