본문 바로가기
반응형

2017/1010

[SnpEff] SnpEff 사용방법2 VCF annotation, SnpEff ANN field, Sequence Ontology term 설명 안녕하세요 한주현 입니다. 오늘은 SnpEff 로 VCF annotation하는 간단한 명령어와 annotation된 VCF의 컬럼에서 ANN field 중 annotation, Annotation_Impact 컬럼에 대해 알아보겠습니다. SnpEff 설치 방법에 대해 찾으신다면 다음 링크를 참고해주세요http://korbillgates.tistory.com/61 SnpEff 사용방법1 - 다운로드 및 설치, vcf annotation 위의 링크에서도 알아봤듯이 VCF annotation 하는 명령어를 간단히 리뷰해보도록 하겠습니다. SnpEff로 VCF annotation 하는 방법 java -jar snpEff.jar hg19 in.vcf > out.vcf java 1.7이상 에서 작동하며 라인이 많.. 2017. 10. 31.
[바이오파이썬] 4.2 Sequence Record 객체 - FASTA, GenBank 파일로 부터 생성하기 안녕하세요 한주현입니다. 오늘은 FASTA, GenBank 파일로 부터 SeqRecord 객체를 만드는 방법에 대해 알아보겠습니다. 바로 이전 포스팅에서 SeqRecord 객체에 대해서 알아보았는데요, http://korbillgates.tistory.com/86 SeqRecord 객체는 서열과 annotation 정보 등등을 포함한 객체입니다. 이전 시간에는 아래와 같이 직접 타이핑을 하여 SeqRecord 객체를 만들었는데요, 1 2 3 4 5 6 from Bio.Seq import Seq from Bio.SeqRecord import SeqRecord simple_seq = Seq("GATC") simple_seq_r = SeqRecord(simple_seq) print(simple_seq_r) c.. 2017. 10. 30.
[리눅스] 텍스트 파일에서 random으로 n개 라인 뽑기 안녕하세요 한주현 입니다. 오늘은 텍스트 파일에서 무작위로 n개의 라인을 뽑는 방법에 대해 포스팅 해 보겠습니다. 먼저 샘플 파일입니다 샘플파일 $ cat num.txt 1 2 3 4 5 6 7 8 9 10 방법1 - sort sort -R 을 하여 head로 원하는 만큼 자릅니다. $ sort -R num.txt 3 2 5 9 10 4 6 1 7 8 $ sort -R num.txt | head -3 2 7 5 방법2 - shuf shuf 명령어를 사용합니다. $ shuf -n 3 num.txt 8 1 3 파일 사이즈가 크고 라인 개수가 많은 경우 sort -R 보다는 방법2인 shuf를 사용하는 것이 훨씬 빠릅니다. 그럼 다음 시간에 만나요~~~ 2017. 10. 30.
[Samtools] BAM 파일에서 Duplicated Read 찾기 안녕하세요 한주현입니다. 오늘은 bam 파일로 부터 duplicate read만 가져오는 방법에 대해 알아보겠습니다 필요한 툴, 파일 samtools실습할 bam 파일 samtools 설치는 다음 링크를 참고해주세요.설치 방법은 버전이 달라도 대개 비슷비슷합니다 ㅎㅎ; http://korbillgates.tistory.com/57 NGS 분석에서는 기술특성상 필연적으로 PCR duplicate(또는 optical duplicate) 가 생길 수 밖에 없습니다.이 부분에 대해서는 다음 포스팅에서 만나도록 하겠습니다 ㅎㅎㅎ duplicate의 존재는 samtools로 stat을 확인해보면 나오는데요,각자 가지고 계신 bam파일을 가지고 아래와 같은 command를 실행해봅시다. Command $ samtoo.. 2017. 10. 30.
반응형