본문 바로가기
반응형

생물정보학/Tools43

[Tool] Expansion Hunter 설치 및 사용방법 안녕하세요 생물정보학자 한주현 입니다. 오늘은 Expansion Hunter 툴의 설치 방법과 사용방법 그리고 결과파일에 대해서 알아보겠습니다. 소개 Expansion Hunter는 sequencer로 유명한 Illumina 에서 만든 툴로 기준 서열 유전체(refernece genome)에 정렬된 BAM 포맷에서 반복되는 서열을 찾아주는 툴입니다. 반복되는 서열이 질환을 일으키는 질병 중 유명한 예시로 Huntington’s Disease가 있습니다. 이 질환은 4번 염색체인 4p16.3에서 HTT 유전자의 CAGCAGCAGCAG… 와 같은 (CAG)의 반복 서열이 원인이 됩니다. 이러한 반복서열을 찾아주는 툴이 Expansion Hunter 입니다. 설치 방법 설치에는 두 가지 방법이 있습니다. 하나.. 2022. 11. 24.
[VCF 파일] genozip - VCF 파일의 효율적인 압축 방법을 제시한 툴 여러분 안녕하세요 한주현입니다. 오늘은 genozip 이라는 툴에 대해 알아보겠습니다. 들어가며 이 논문은 제가 좋아하는 논문 저널 중 하나인 Bioinformatics 에서 최근에 출판한 논문입니다. Bioinformatics 저널에서 새로운 분석 방법과 결과 등을 살펴보는 식으로 읽어오곤 했었는데요, 이번에 소개드릴 논문은 생물정보학에서 VCF, bam, fastq, fasta, 그리고 23andMe 파일을 더 효율적으로 압축해주는 툴에 대한 논문입니다. https://academic.oup.com/bioinformatics/article/36/13/4091/5837110 genozip: a fast and efficient compression tool for VCF files AbstractMot.. 2020. 7. 12.
[생물정보학] ORF와 CDS의 차이점과 refGene.txt.gz 파일 안녕하세요 한주현입니다 오늘은 ORF (Open Reading Frame)와 CDS (Coding Sequence) 의 차이점과 refGene.txt.gz 파일에 대해서 알아보겠습니다. ORF ORF (Open Reading Frame)는 시작 코돈 (AUG)에서부터 종결 코돈 (UAA, UAG, UGA) 까지의 서열을 말합니다. ATG [xxx] TAG 와 같이 시작과 종결 사이에 triplet code, 즉 3배수의 염기들로 구성 되어만 있다면 ORF 라고 부를 수 있습니다. 실제로 DNA 서열에서 ATG (3n) TAG 로 구성된 ORF 서열을 찾아보면 많이 존재합니다. 이러한 ORF를 찾아주는 프로그램들도 존재하지요. 1) ORF Finder https://www.bioinformatics.org.. 2020. 7. 5.
[생물정보학 유튜브 강의] 생물정보학 툴 설치 (samtools) 및 bam 파일 보는 방법 안녕하세요 한주현 입니다. 생물정보학 유튜브 강의를 하나 더 제작하였습니다. 오늘은 "생물정보학 리눅스 툴 설치 (samtools) 및 bam 파일 보는 방법" 의 주제로 포스팅해보겠습니다. 생물정보학을 처음 접하고, 리눅스를 처음 접한 생물정보학 꿈나무라면, 리눅스에서 툴 설치는 큰 산으로 다가올 수 있습니다. 동영상 강좌가 도움이 되셨으면 좋겠습니다. 오늘은 생물정보학에 처음 입문하시고 리눅스가 익숙치 않으신 분들을 위해, 생물정보학 툴 중 하나인 samtools를 설치하고 bam 파일을 보는 방법에 대해 유튜브 동영상을 만들어서 업로드 해보았습니다. 유튜브 구독과 좋아요 많이 부탁드릴게요! 그럼 담에 또 만나요~~ 2020. 6. 14.
반응형