본문 바로가기
생물정보학/Tools

[samtools] BAM 파일을 FASTA, FASTQ 파일 형식으로 변환하기

by HanJoohyun 2017. 11. 22.
반응형

 

 

 

안녕하세요 한주현입니다.

 

오늘은 samtools로 BAM파일의 정보를 가지고 FASTA, FASTQ 파일 형식으로 바꾸는 방법


에 대하여 알아보겠습니다.

 


 samtools

 

samtools 로 BAM 파일에서 FASTA, FASTQ 파일형식으로 변환 - 준비물


준비물

1) samtools

samtools 설치가 되어 있지 않다면 다음 링크들을 참고해 주세요


  - samtools 공식 다운로드 페이지

http://www.htslib.org/download/


  - samtools 설치 방법

http://korbillgates.tistory.com/57



2) 실습 bam 파일

http://hgdownload.cse.ucsc.edu/goldenPath/hg19/encodeDCC/wgEncodeUwRepliSeq/wgEncodeUwRepliSeqBg02esG1bAlnRep1.bam

Size: 92MB


http://hgdownload.cse.ucsc.edu/goldenPath/hg19/encodeDCC/wgEncodeUwRepliSeq/wgEncodeUwRepliSeqBg02esG1bAlnRep1.bam.bai

Size: 4.9MB


 

 

samtools 로 BAM 파일에서 FASTA, FASTQ 파일형식으로 변환 - 실행


samtools 커맨드에서 fasta, fastq 를 사용합니다.

아래의 예시는 std out으로 출력되는 결과 중 일부를 보여드립니다. ㅎㅎ


1) BAM 파일을 FASTA 파일형식으로 변환하기


1
$ samtools fasta sample1.bam
cs


1
2
3
4
5
6
7
8
9
10
>SOLEXA-1GA-2_2_FC20EMB:5:251:979:328
AACCCCTAACCCTAACCCTAACCCTAACCCTAAACT
>SOLEXA-1GA-2_2_FC20EMB:5:102:214:278
CCCTAACCCTAACCCTAACCCTAACCCTAACCTAAC
>SOLEXA-1GA-2_2_FC20EMB:5:195:284:685
GGTTAGGTTAGGGTTAGGGTTAGGGTTAGTGTTTGG
>SOLEXA-1GA-2_2_FC20EMB:5:35:583:827
CTAACCCTAAACCTAACCCTAACCCTAACCTAACCA
>SOLEXA-1GA-2_2_FC20EMB:5:248:130:724
AACCCTAACCCTAACCCCAACCCTAACCTAACCCTA
cs



2) BAM 파일을 FASTQ 파일형식으로 변환하기


1
$ samtools fastq sample1.bam
cs


1
2
3
4
5
6
7
8
@SOLEXA-1GA-2_2_FC20EMB:5:251:979:328
AACCCCTAACCCTAACCCTAACCCTAACCCTAAACT
+
hhhhHcWhhHTghcKA_ONhAAEEBZE?H?CBC?DA
@SOLEXA-1GA-2_2_FC20EMB:5:102:214:278
CCCTAACCCTAACCCTAACCCTAACCCTAACCTAAC
+
hbfhhhXUYhT_ULZdLRTKNIMIKGLJCHFFJQJN
cs



 


오늘은 samtools를 사용하여 BAM 파일의 정보로 FASTA, FASTQ 파일형식으로 변환하는


방법에 대하여 알아봤습니다.


생각보다 너무나도 간단했죠? ㅎㅎㅎ


부디 여러분들께 도움이 되셨음 좋겠습니다 ㅎㅎ.


그럼 다음 시간에 만나요!


참고자료 : http://www.htslib.org/doc/samtools.html

 

 

 


반응형

댓글