반응형 전체 글245 [생물정보학] VCF에서 snpEff html report의 정보 내용 가져오기 안녕하세요 한주현입니다. 오늘은 VCF 파일에서 snpEff html report의 정보들을 가져오는 방법에 대해 알아보겠습니다. 목차 0. 시작하며1. VCF 파일 파싱 0. 시작하며 블로그를 방문해주신 선생님께서 vcf파일을 snpEff 에 넣어 나오는 html report 의 스탯 뽑는 방법에 대해 문의해주셨습니다. VCF 파일을 파싱하면 되겠군요. 파이썬으로 진행해보겠습니다. 다음 예시에서는 Variants rate details 와 Number variants by type 을 뽑아보겠습니다. 코딩 한 번 해보죠.. ㅋㅋ 1. VCF 파일 파싱 다음과 같이 코드를 만들어봤습니다. VcfParser 의 메서드 부분의 역할을 보시면서 필요한 부분 가져가심 될 것 같습니다. 실행하면 다음과 같이 나옵.. 2018. 11. 16. [생물정보학] Fasta Reader GUI, 윈도우에서 FASTA 파일 읽어서 염기서열 세는 프로그램, JAVA GUI 예제, JAVA Swing 예제 안녕하세요 한주현입니다. 오늘은 FASTA 파일을 윈도우, 맥 GUI 환경에서 읽어 염기서열 세어주는 프로그램을 제작해 보았습니다. 목차 1. 프로그램 소개2. 프로그램 사용방법부록. UCSC FASTA 파일 다운로드 1. 프로그램 소개 "Fasta Reader GUI" 는 윈도우나 맥, 리눅스의 GUI (Graphic User Interface) 환경에서 FASTA 파일을 읽어 전체 염기서열 개수, A, C, G, T 그리고 N 염기의 개수를 세는 프로그램입니다. 프로그램은 JAVA로 제작하였으며 사용하시는 환경에 JAVA 8 버전이 필요합니다. 참고로 FASTA 파일은 유전서열을 담고 있는 파일로 ">" 기호가 있는 헤더 부분과 서열부분으로 나뉩니다. FASTA 파일 형식> 헤더 ACACACGGCCN.. 2018. 11. 15. [생물정보학] FASTA gzip 파일 읽기 - 염색체 별로 염기 숫자 세기 - UCSC FASTA 다운로드 - 자바 JAVA , 파이썬 Python, 파일 읽기 속도 비교 안녕하세요 한주현입니다. 오늘은 자바, 파이썬으로 FASTA gzip 파일을 읽어 염기서열을 세는 프로그래밍을 해보겠습니다. 목차 1. UCSC FASTA 파일 다운로드 2. 염색체 별로 읽기3. Python 스크립트 구현4. JAVA 코드 구현5. 결과6. 파일 읽기 속도 비교 - JAVA, Python 1. UCSC FASTA 파일 다운로드 - chromosome 별 다음 경로에 들어가서 chromosome 별로 fa.gz 파일을 받습니다. hg38 http://hgdownload.soe.ucsc.edu/goldenPath/hg38/chromosomes/ hg19http://hgdownload.soe.ucsc.edu/goldenPath/hg19/chromosomes/ 사이트에 접속하시면 다음과 같은 .. 2018. 11. 14. [생물정보학 알고리즘] 1 부터 n 까지 합 구하기 - 파이썬 알고리즘 공부, 자바 알고리즘 학습 안녕하세요 한주현 입니다. 오늘 부터 생물정보학 알고리즘에 대해서 포스팅 해보고자 합니다. 포스팅 계획은간단한 알고리즘에서 부터 재귀, 탐색, 정렬, 그래프 그리고 생물정보학 알고리즘 까지 정리하는 것을 목표로 하고 있습니다. 목차 (계속하여 업데이트될 예정) 1. 1 부터 n 까지 합 구하기 - korbillgates.tistory.com/1902. 배열에서 최대값, 최소값 찾기 - korbillgates.tistory.com/204 오늘 알아볼 알고리즘은 “1 부터 n 까지 합 구하기” 입니다. 알고리즘 생각 1 부터 n 까지의 합은 단순하게 생각하여 합을 모으는 변수를 두고1, 2, 3, ..., n 을 더해 봅시다. 파이썬 스크립트 1234567def oneToN(num): sum_val = 0 .. 2018. 11. 13. 이전 1 ··· 14 15 16 17 18 19 20 ··· 62 다음 반응형