본문 바로가기
반응형

GATK8

[뱀뱀이 프로그래밍 만화] Pileup Read - 생물정보학 안녕하세요 한주현 입니다 :) 오늘은 생물정보학 포맷 개념 중 하나인 pileup 에 대해서 그려보았습니다. Pileup pileup 은 기준이 되는 서열에 sequencer (샘플로 부터 염기서열을 읽는 기계) 에서 나온 Read(리드, sequencer 가 한 번 동안에 읽은 서열)를 잘~ 맞게 붙여서 만든 파일 (sam 또는 bam 파일)에서 쌓아 올라가는 방식으로 read를 표현한 포맷 입니다 ㅎㅎ... 어려운데 말 또한 기네요;; ㅜㅜ GATK 로 해당 파일을 생성해 낼 수 있습니다. 다음 링크를 참고해 주세요 ㅎㅎ 링크 : http://korbillgates.tistory.com/165 어려운 내용 쉽게 풀어보고자 열심히 그림을 그려보고 있습니다!! 꼭 도움이 되셨으면 좋겠네요 ㅎㅎ 생물정보학.. 2018. 6. 21.
[GATK] pileup 파일 얻기 - bam 에서 쌓인 read base 얻기 - gatk pileup 분석 안녕하세요 한주현입니다. 오늘은 GATK의 툴 중 하나인 Pileup 에 대해 알아보겠습니다. Pileup 이란? pileup 은 말 그대로 쌓아 올린것을 의미합니다 ㅎㅎ Reference 서열에 맞춘 read 들을 쭉~ 쌓아 올린 것을 pileup 이라고 하지요 그림을 하나 그려봤습니다 ㅎㅎ.. 뱀뱀이 프로그래밍 만화도 많이 봐주세요 ㅎㅎ 링크 : http://korbillgates.tistory.com/category/뱀뱀이 프로그래밍 만화/단편작 참고로 아래는 쌓인 read 들을 보여주는 여러가지 소프트웨어 입니다 ㅎㅎ IGV (Integrative Genomics Viewer) - Broad Institute Samtools tview GATK Pileup - GATK3.x , GATK4 GATK.. 2018. 6. 21.
[GATK] DepthOfCoverage 란? Depth of coverage의 soft clip 처리. Depth of coverage 분석 방법 안녕하세요 한주현입니다. 오늘은 GATK의 툴 중 하나인 DepthOfCoverage 에 대해 알아보고, Soft Clip을 처리하는 방식과 DepthOfCoverage 의 command line에 대해 알아보겠습니다. Depth Of Coverage 란? DepthOfCoverage 는 GATK 의 Tool 중의 하나로, 말 그대로 Coverage의 Depth를 계산해줍니다. 아래 그림은 Reference genome에 mapping 된 read들을 표현한 그림입니다. 100bp 가 되는 12개의 read들이 reference sequence에 맞게 mapping 된것인데요, 왼쪽의 covered region의 길이가 350bp라고 해봅시다. mapping된 read는 총 1,200bp 이며, 계산식에.. 2018. 5. 16.
[GATK] VCF index 파일 생성 3가지 방법, VCF 인덱스 만들기 - GATK3, GATK4, bgzip, tabix 안녕하세요 한주현입니다. 오늘은 VCF 파일에서 index를 만드는 방법에 대해서 알아보겠습니다. VCF파일은 Variant Calling Format 파일의 약자로 파일에 대한 소개는 아래 링크를 참고해주세요 ㅎㅎ http://korbillgates.tistory.com/136 - VCF 파일 소개 파일 indexing 이란? 파일의 indexing 은 random access를 용이하게 하기 위해 key 값을 만드는 과정입니다. indexing 은 우리말로 색인 이라고도 말합니다. 쉽게 말해 종이 사전을 예시로 들어봅시다 ㅎㅎ.. 우리가 Sea 를 찾는 다고 하면, 종이 사전 옆구리의 알파벳 S쪽을 열어보겠죠? 만약 사전 옆구리의 알파벳이 없다면 찾기가 조금 더 힘들고 시간이 오래 걸릴 것 입니다 ㅎ.. 2018. 4. 10.
반응형