반응형 생물정보학90 [바이오파이썬] 4.2 Sequence Record 객체 - FASTA, GenBank 파일로 부터 생성하기 안녕하세요 한주현입니다. 오늘은 FASTA, GenBank 파일로 부터 SeqRecord 객체를 만드는 방법에 대해 알아보겠습니다. 바로 이전 포스팅에서 SeqRecord 객체에 대해서 알아보았는데요, http://korbillgates.tistory.com/86 SeqRecord 객체는 서열과 annotation 정보 등등을 포함한 객체입니다. 이전 시간에는 아래와 같이 직접 타이핑을 하여 SeqRecord 객체를 만들었는데요, 1 2 3 4 5 6 from Bio.Seq import Seq from Bio.SeqRecord import SeqRecord simple_seq = Seq("GATC") simple_seq_r = SeqRecord(simple_seq) print(simple_seq_r) c.. 2017. 10. 30. [Samtools] BAM 파일에서 Duplicated Read 찾기 안녕하세요 한주현입니다. 오늘은 bam 파일로 부터 duplicate read만 가져오는 방법에 대해 알아보겠습니다 필요한 툴, 파일 samtools실습할 bam 파일 samtools 설치는 다음 링크를 참고해주세요.설치 방법은 버전이 달라도 대개 비슷비슷합니다 ㅎㅎ; http://korbillgates.tistory.com/57 NGS 분석에서는 기술특성상 필연적으로 PCR duplicate(또는 optical duplicate) 가 생길 수 밖에 없습니다.이 부분에 대해서는 다음 포스팅에서 만나도록 하겠습니다 ㅎㅎㅎ duplicate의 존재는 samtools로 stat을 확인해보면 나오는데요,각자 가지고 계신 bam파일을 가지고 아래와 같은 command를 실행해봅시다. Command $ samtoo.. 2017. 10. 30. [바이오파이썬] 4.1. Sequence Record 객체 안녕하세요 한주현 입니다. 오늘은 Sequence Record 객체에 대해 알아보겠습니다. 이전 03. Sequence 객체 단원에서는 문자열 같은 Sequence 객체에 대해서 알아보았는데요, 오늘 말씀드릴 Sequence Record는 서열 뿐만 아니라 여러 정보를 가지고 있는 객체입니다. 4.1 SeqRecord 객체 .seq - Sequence 그 자체 입니다 [Seq 객체] .id - primary ID 로 sequence를 판별할 때 사용하며 대부분의 경우 accession number입니다. [문자열] .name - sequence의 이름으로 accession number와 같을 수도 있습니다. [문자열] .description - 사람이 읽을 수 있는 설명입니다 [문자열] .letter_a.. 2017. 10. 29. [GATK] GATK 오류 - "Problem detecting index type" 해결법 안녕하세요 한주현 입니다 오늘은 GATK 오류메시지인 "Problem detecting index type" 해결법에 대해 알아보겠습니다 현상 $ java -Xmx40g -Djava.io.tmpdir=/tmp -jar GenomeAnalysisTK.jar -T GenotypeGVCFs -R ucsc.hg19.fasta --variant multicall.gvcf.list --out rawVariants.vcf INFO 10:52:58,657 HelpFormatter - ----------------------------------------------------------------------------------------- INFO 10:52:58,659 HelpFormatter - The Genom.. 2017. 10. 16. 이전 1 ··· 14 15 16 17 18 19 20 ··· 23 다음 반응형