본문 바로가기
반응형

생물정보학31

[FastqGizmo] Fastq 파일의 스탯 stat 및 N Base read count, Fastq Report 리포트 ` 안녕하세요 한주현 입니다! 오늘은 제가 만든 툴인 FastqGizmo를 소개합니다... ㅎㅎ FastqGizmo는 Fastq 파일에서 염기에 대한 스탯 (개수, 퀄리티) 및 N Base의 개수별로 리드의 개수를 세는 프로그램입니다. FastqGizmo 주요 기능 소개 1. Fastq 파일의 염기 개수 및 퀄리티 스탯2. Fastq의 리드당 N Base 개수를 세어 N Base의 개수별로 리드를 표시3. 위의 두 결과를 HTML 파일로 리포트 FastqGizmo 사용 방법 FASTQGIZMO 는 기본적으로 터미널 환경에서 돌아갑니다.Java 1.8 에서 돌아갑니다. 1$ java -jar FastqGizmo.jar FastqGizmo 리포트 FastqGizmo.jar 의 StatReport 를 실행하면.. 2018. 11. 10.
[fastqe] fastqe , fastq 파일의 quality를 이모티콘으로! , fastq 파일이란? 안녕하세요 한주현입니다. 오늘은 fastqe 라고 재미난 라이브러리를 하나 소개해 보겠습니다. ㅎㅎ fastqe 개발자님 페이지 https://fastqe.com/https://github.com/lonsbio/fastqe fastq에 emoji (에모지, 이모티콘) 정보를 더한 fastqe에 대해 적어보겠습니다 fastq의 quality를 아래와 같이 emoticon 으로 나타낸 것 이지요. fastqe를 알아보기 전에 간단하게 fastq가 어떤 포맷의 파일인지 알아볼까요? fastq? fastq는 시퀀서에서 읽은 염기서열의 정보를 4줄에 걸친 텍스트 정보로 나타낸 것 입니다. fastq 각 줄의 정보 첫 번째 줄: @ 로 시작하여 sequence identifier를 나타냅니다.두 번째 줄: raw .. 2018. 7. 29.
[GATK] pileup 파일 얻기 - bam 에서 쌓인 read base 얻기 - gatk pileup 분석 안녕하세요 한주현입니다. 오늘은 GATK의 툴 중 하나인 Pileup 에 대해 알아보겠습니다. Pileup 이란? pileup 은 말 그대로 쌓아 올린것을 의미합니다 ㅎㅎ Reference 서열에 맞춘 read 들을 쭉~ 쌓아 올린 것을 pileup 이라고 하지요 그림을 하나 그려봤습니다 ㅎㅎ.. 뱀뱀이 프로그래밍 만화도 많이 봐주세요 ㅎㅎ 링크 : http://korbillgates.tistory.com/category/뱀뱀이 프로그래밍 만화/단편작 참고로 아래는 쌓인 read 들을 보여주는 여러가지 소프트웨어 입니다 ㅎㅎ IGV (Integrative Genomics Viewer) - Broad Institute Samtools tview GATK Pileup - GATK3.x , GATK4 GATK.. 2018. 6. 21.
[C#] 파일 쓰고 읽기 - 파일 입출력 - FASTQ GC content ratio 계산기 - 생물정보학 안녕하세요 한주현 입니다 여러분들 잘 지내시나요? 저는 요새 생각하는 기능들이 들어있고, 생각하는 대로 척척 잘 만들어 주는 C#의 매력에 빠져있습니다 ㅎㅎ 오늘은 C# 의 파일 쓰고 읽기에 대해 알아보겠습니다. 준비물 Visual Studio EGFR 유전자 서열https://raw.githubusercontent.com/KennethJHan/SampleData/master/EGFR_NC_000007.14_GRCh38.fasta 1. 개요 파일을 쓰고 읽는 것은 어느 프로그래밍 언어에서나 기본적인 내용인데요 C# 에서 어떻게 파일을 다루는지 오늘 정리해보겠습니다!! 먼저 한 번에 쓰고 읽는 방법에 대해서 알아보고, 그 다음 대용량의 파일을 다룰 수 있도록 한 줄씩 쓰고 읽는 방법에 대해서도 알아보겠습니.. 2018. 6. 10.
반응형