반응형
안녕하세요 한주현입니다.
오늘은 samtools로 BAM파일의 정보를 가지고 FASTA, FASTQ 파일 형식으로 바꾸는 방법
에 대하여 알아보겠습니다.
samtools
samtools 로 BAM 파일에서 FASTA, FASTQ 파일형식으로 변환 - 준비물
준비물
1) samtools
samtools 설치가 되어 있지 않다면 다음 링크들을 참고해 주세요
- samtools 공식 다운로드 페이지
http://www.htslib.org/download/
- samtools 설치 방법
http://korbillgates.tistory.com/57
2) 실습 bam 파일
Size: 92MB
Size: 4.9MB
samtools 로 BAM 파일에서 FASTA, FASTQ 파일형식으로 변환 - 실행
samtools 커맨드에서 fasta, fastq 를 사용합니다.
아래의 예시는 std out으로 출력되는 결과 중 일부를 보여드립니다. ㅎㅎ
1) BAM 파일을 FASTA 파일형식으로 변환하기
1 | $ samtools fasta sample1.bam | cs |
1 2 3 4 5 6 7 8 9 10 | >SOLEXA-1GA-2_2_FC20EMB:5:251:979:328 AACCCCTAACCCTAACCCTAACCCTAACCCTAAACT >SOLEXA-1GA-2_2_FC20EMB:5:102:214:278 CCCTAACCCTAACCCTAACCCTAACCCTAACCTAAC >SOLEXA-1GA-2_2_FC20EMB:5:195:284:685 GGTTAGGTTAGGGTTAGGGTTAGGGTTAGTGTTTGG >SOLEXA-1GA-2_2_FC20EMB:5:35:583:827 CTAACCCTAAACCTAACCCTAACCCTAACCTAACCA >SOLEXA-1GA-2_2_FC20EMB:5:248:130:724 AACCCTAACCCTAACCCCAACCCTAACCTAACCCTA | cs |
2) BAM 파일을 FASTQ 파일형식으로 변환하기
1 | $ samtools fastq sample1.bam | cs |
1 2 3 4 5 6 7 8 | @SOLEXA-1GA-2_2_FC20EMB:5:251:979:328 AACCCCTAACCCTAACCCTAACCCTAACCCTAAACT + hhhhHcWhhHTghcKA_ONhAAEEBZE?H?CBC?DA @SOLEXA-1GA-2_2_FC20EMB:5:102:214:278 CCCTAACCCTAACCCTAACCCTAACCCTAACCTAAC + hbfhhhXUYhT_ULZdLRTKNIMIKGLJCHFFJQJN | cs |
오늘은 samtools를 사용하여 BAM 파일의 정보로 FASTA, FASTQ 파일형식으로 변환하는
방법에 대하여 알아봤습니다.
생각보다 너무나도 간단했죠? ㅎㅎㅎ
부디 여러분들께 도움이 되셨음 좋겠습니다 ㅎㅎ.
그럼 다음 시간에 만나요!
참고자료 : http://www.htslib.org/doc/samtools.html
반응형
'생물정보학 > Tools' 카테고리의 다른 글
[samtools] sam, bam 파일간 변환 방법, sam to bam , bam to sam (0) | 2017.12.12 |
---|---|
[LINUX] FASTQ에서 random read 골라내기 (0) | 2017.12.07 |
[samtools] BAM 파일에서 특정 chromosome 영역 추출하기 (0) | 2017.11.22 |
[SnpEff] SnpEff 사용방법2 VCF annotation, SnpEff ANN field, Sequence Ontology term 설명 (5) | 2017.10.31 |
[Samtools] BAM 파일에서 Duplicated Read 찾기 (0) | 2017.10.30 |
댓글