본문 바로가기
반응형

생물정보학/Tools43

[생물정보학] FASTA gzip 파일 읽기 - 염색체 별로 염기 숫자 세기 - UCSC FASTA 다운로드 - 자바 JAVA , 파이썬 Python, 파일 읽기 속도 비교 안녕하세요 한주현입니다. 오늘은 자바, 파이썬으로 FASTA gzip 파일을 읽어 염기서열을 세는 프로그래밍을 해보겠습니다. 목차 1. UCSC FASTA 파일 다운로드 2. 염색체 별로 읽기3. Python 스크립트 구현4. JAVA 코드 구현5. 결과6. 파일 읽기 속도 비교 - JAVA, Python 1. UCSC FASTA 파일 다운로드 - chromosome 별 다음 경로에 들어가서 chromosome 별로 fa.gz 파일을 받습니다. hg38 http://hgdownload.soe.ucsc.edu/goldenPath/hg38/chromosomes/ hg19http://hgdownload.soe.ucsc.edu/goldenPath/hg19/chromosomes/ 사이트에 접속하시면 다음과 같은 .. 2018. 11. 14.
[FastqGizmo] Fastq 파일의 스탯 stat 및 N Base read count, Fastq Report 리포트 ` 안녕하세요 한주현 입니다! 오늘은 제가 만든 툴인 FastqGizmo를 소개합니다... ㅎㅎ FastqGizmo는 Fastq 파일에서 염기에 대한 스탯 (개수, 퀄리티) 및 N Base의 개수별로 리드의 개수를 세는 프로그램입니다. FastqGizmo 주요 기능 소개 1. Fastq 파일의 염기 개수 및 퀄리티 스탯2. Fastq의 리드당 N Base 개수를 세어 N Base의 개수별로 리드를 표시3. 위의 두 결과를 HTML 파일로 리포트 FastqGizmo 사용 방법 FASTQGIZMO 는 기본적으로 터미널 환경에서 돌아갑니다.Java 1.8 에서 돌아갑니다. 1$ java -jar FastqGizmo.jar FastqGizmo 리포트 FastqGizmo.jar 의 StatReport 를 실행하면.. 2018. 11. 10.
[fastqe] fastqe , fastq 파일의 quality를 이모티콘으로! , fastq 파일이란? 안녕하세요 한주현입니다. 오늘은 fastqe 라고 재미난 라이브러리를 하나 소개해 보겠습니다. ㅎㅎ fastqe 개발자님 페이지 https://fastqe.com/https://github.com/lonsbio/fastqe fastq에 emoji (에모지, 이모티콘) 정보를 더한 fastqe에 대해 적어보겠습니다 fastq의 quality를 아래와 같이 emoticon 으로 나타낸 것 이지요. fastqe를 알아보기 전에 간단하게 fastq가 어떤 포맷의 파일인지 알아볼까요? fastq? fastq는 시퀀서에서 읽은 염기서열의 정보를 4줄에 걸친 텍스트 정보로 나타낸 것 입니다. fastq 각 줄의 정보 첫 번째 줄: @ 로 시작하여 sequence identifier를 나타냅니다.두 번째 줄: raw .. 2018. 7. 29.
[GATK] pileup 파일 얻기 - bam 에서 쌓인 read base 얻기 - gatk pileup 분석 안녕하세요 한주현입니다. 오늘은 GATK의 툴 중 하나인 Pileup 에 대해 알아보겠습니다. Pileup 이란? pileup 은 말 그대로 쌓아 올린것을 의미합니다 ㅎㅎ Reference 서열에 맞춘 read 들을 쭉~ 쌓아 올린 것을 pileup 이라고 하지요 그림을 하나 그려봤습니다 ㅎㅎ.. 뱀뱀이 프로그래밍 만화도 많이 봐주세요 ㅎㅎ 링크 : http://korbillgates.tistory.com/category/뱀뱀이 프로그래밍 만화/단편작 참고로 아래는 쌓인 read 들을 보여주는 여러가지 소프트웨어 입니다 ㅎㅎ IGV (Integrative Genomics Viewer) - Broad Institute Samtools tview GATK Pileup - GATK3.x , GATK4 GATK.. 2018. 6. 21.
반응형