본문 바로가기
반응형

2020/072

[VCF 파일] genozip - VCF 파일의 효율적인 압축 방법을 제시한 툴 여러분 안녕하세요 한주현입니다. 오늘은 genozip 이라는 툴에 대해 알아보겠습니다. 들어가며 이 논문은 제가 좋아하는 논문 저널 중 하나인 Bioinformatics 에서 최근에 출판한 논문입니다. Bioinformatics 저널에서 새로운 분석 방법과 결과 등을 살펴보는 식으로 읽어오곤 했었는데요, 이번에 소개드릴 논문은 생물정보학에서 VCF, bam, fastq, fasta, 그리고 23andMe 파일을 더 효율적으로 압축해주는 툴에 대한 논문입니다. https://academic.oup.com/bioinformatics/article/36/13/4091/5837110 genozip: a fast and efficient compression tool for VCF files AbstractMot.. 2020. 7. 12.
[생물정보학] ORF와 CDS의 차이점과 refGene.txt.gz 파일 안녕하세요 한주현입니다 오늘은 ORF (Open Reading Frame)와 CDS (Coding Sequence) 의 차이점과 refGene.txt.gz 파일에 대해서 알아보겠습니다. ORF ORF (Open Reading Frame)는 시작 코돈 (AUG)에서부터 종결 코돈 (UAA, UAG, UGA) 까지의 서열을 말합니다. ATG [xxx] TAG 와 같이 시작과 종결 사이에 triplet code, 즉 3배수의 염기들로 구성 되어만 있다면 ORF 라고 부를 수 있습니다. 실제로 DNA 서열에서 ATG (3n) TAG 로 구성된 ORF 서열을 찾아보면 많이 존재합니다. 이러한 ORF를 찾아주는 프로그램들도 존재하지요. 1) ORF Finder https://www.bioinformatics.org.. 2020. 7. 5.
반응형