본문 바로가기
반응형

VCF18

[VCF 파일] genozip - VCF 파일의 효율적인 압축 방법을 제시한 툴 여러분 안녕하세요 한주현입니다. 오늘은 genozip 이라는 툴에 대해 알아보겠습니다. 들어가며 이 논문은 제가 좋아하는 논문 저널 중 하나인 Bioinformatics 에서 최근에 출판한 논문입니다. Bioinformatics 저널에서 새로운 분석 방법과 결과 등을 살펴보는 식으로 읽어오곤 했었는데요, 이번에 소개드릴 논문은 생물정보학에서 VCF, bam, fastq, fasta, 그리고 23andMe 파일을 더 효율적으로 압축해주는 툴에 대한 논문입니다. https://academic.oup.com/bioinformatics/article/36/13/4091/5837110 genozip: a fast and efficient compression tool for VCF files AbstractMot.. 2020. 7. 12.
[강의자료] 생물정보학 강의, FASTQ, BAM, VCF, samtools 설치 안녕하세요 한주현입니다. 감사하게도 기회가 되어 2019년부터 서울여대 학생들께 생물정보학을 가르치러 강의를 나가고 있습니다. 강의를 열어주신 김명겸 교수님께 이 자리를 빌어 감사의 말씀드립니다. 강의 주제는 생물정보학 전반에 대한 내용으로 다음과 같은 주제를 다루었습니다. 리눅스 다루기 시퀀싱과 염기서열 분석 리눅스에서 생물정보학 툴 설치 간단한 파이프라인 만들기 (BWA-GATK) github 사용하기 클라우드 컴퓨팅 환경 사용하기 (AWS (Amazon Web Service) 또는 GCP (google cloud platform)) 바이오파이썬 실무에서 있던 에피소드들 등등.. 1년간 여러 주제와 실무 환경을 학부생들의 눈높이에 맞게 강의 했었네요 이번 2020년도 1학기의 경우 코로나19로 인해 .. 2020. 5. 21.
[생물정보학] vcf 파일 chromosome, position 별로 정렬 sorting 하기 안녕하세요 한주현입니다. 오늘은 vcf 파일을 chromosome 별로 position 별로 정렬 sorting 하는 방법에 대해 알아보겠습니다. 들어가며 가끔 vcf 파일이 다음과 같이 sorting 되어있지 않는 경우가 있는데요, 이렇게 정렬이 되어있지 않으면 어떤 툴들에서는 정렬이 안되었다고 오류가 띡! 뜹니다 ... 정렬이 안된 vcf 파일을 다음과 같이 정렬하고 싶은거죠. 참고로 vcf 파일은 임의로 생성하였고 편의상 chromosome, position, ref, alt 만 값을 넣었고 나머지는 점(.) 으로 채웠습니다. VCF 정렬하기 vcf를 정렬하는 방법에는 여러가지가 있습니다만, 프로그램 쓰지 않고 간단히 정렬하는 방법을 찾으시는 분들께, 다음의 리눅스 기본 명령어로 간단히 vcf 파일.. 2020. 3. 8.
VCF GT, DP, AD와 genotype 0/0 , 0/1 , 1/1의 의미 안녕하세요 한주현입니다. 오늘은 VCF 파일의 GT, DP, AD와 Genotype에서 0/0, 0/1, 1/1 의 의미에 대해 알아보겠습니다. 목차 VCF 파일의 관찰 GT, AD, DP의 의미 Genotype 에서의 0/0, 0/1, 1/1 의 의미 그럼 genotype 언제 쓰나요? VCF 파일의 관찰과 GT, AD, DP의 의미 VCF 파일을 보시면 1 2 3 4 #CHROM POS ID REF ALT [중간 삭제] FORMAT Sample1 Sample2 chr21 18269600 rs12345 T TGCG [중간 삭제] GT:AD:DP 0/1:44,37:81 0/0:0,90:90 chr21 18269704 . A C [중간 삭제] GT:AD:DP 0/1:720,910:1630 1/1:2,401.. 2019. 7. 15.
반응형