본문 바로가기
반응형

FASTA6

[바이오파이썬] 5.1.1 SeqIO 모듈로 서열 파일 읽기 - FASTA 안녕하세요 한주현입니다. 오늘은 SeqIO 로 파일읽는 방법에 대해 알아보겠습니다. SeqIO로는 FASTA, FASTQ, GenBank 등의 파일을 읽을 수 있는데 오늘은 SeqIO의 메서드와 FASTA 파일 읽기를 살펴보겠습니다. 목표 SeqIO 모듈의 Sequence 파일을 읽는 두 가지 메서드인 SeqIO.read(), SeqIO.parse()에 대해 알아보겠습니다. SeqIO 모듈을 활용하여 FASTA 파일을 읽는 방법에 대해 알아보겠습니다. 준비물 오늘은 준비물이 없습니다 ㅎㅎ 예시 파일은 우리가 그냥 메모장으로 만들어봐요~ SeqIO의 두 가지 메서드 SeqIO 모듈을 가지고 Sequence 파일을 읽을 때 두 가지 메서드가 있습니다. SeqIO.read() SeqIO.parse() 간단히 .. 2018. 12. 24.
[생물정보학] Fasta Reader GUI, 윈도우에서 FASTA 파일 읽어서 염기서열 세는 프로그램, JAVA GUI 예제, JAVA Swing 예제 안녕하세요 한주현입니다. 오늘은 FASTA 파일을 윈도우, 맥 GUI 환경에서 읽어 염기서열 세어주는 프로그램을 제작해 보았습니다. 목차 1. 프로그램 소개2. 프로그램 사용방법부록. UCSC FASTA 파일 다운로드 1. 프로그램 소개 "Fasta Reader GUI" 는 윈도우나 맥, 리눅스의 GUI (Graphic User Interface) 환경에서 FASTA 파일을 읽어 전체 염기서열 개수, A, C, G, T 그리고 N 염기의 개수를 세는 프로그램입니다. 프로그램은 JAVA로 제작하였으며 사용하시는 환경에 JAVA 8 버전이 필요합니다. 참고로 FASTA 파일은 유전서열을 담고 있는 파일로 ">" 기호가 있는 헤더 부분과 서열부분으로 나뉩니다. FASTA 파일 형식> 헤더 ACACACGGCCN.. 2018. 11. 15.
[생물정보학] FASTA gzip 파일 읽기 - 염색체 별로 염기 숫자 세기 - UCSC FASTA 다운로드 - 자바 JAVA , 파이썬 Python, 파일 읽기 속도 비교 안녕하세요 한주현입니다. 오늘은 자바, 파이썬으로 FASTA gzip 파일을 읽어 염기서열을 세는 프로그래밍을 해보겠습니다. 목차 1. UCSC FASTA 파일 다운로드 2. 염색체 별로 읽기3. Python 스크립트 구현4. JAVA 코드 구현5. 결과6. 파일 읽기 속도 비교 - JAVA, Python 1. UCSC FASTA 파일 다운로드 - chromosome 별 다음 경로에 들어가서 chromosome 별로 fa.gz 파일을 받습니다. hg38 http://hgdownload.soe.ucsc.edu/goldenPath/hg38/chromosomes/ hg19http://hgdownload.soe.ucsc.edu/goldenPath/hg19/chromosomes/ 사이트에 접속하시면 다음과 같은 .. 2018. 11. 14.
[C#] 파일 쓰고 읽기 - 파일 입출력 - FASTQ GC content ratio 계산기 - 생물정보학 안녕하세요 한주현 입니다 여러분들 잘 지내시나요? 저는 요새 생각하는 기능들이 들어있고, 생각하는 대로 척척 잘 만들어 주는 C#의 매력에 빠져있습니다 ㅎㅎ 오늘은 C# 의 파일 쓰고 읽기에 대해 알아보겠습니다. 준비물 Visual Studio EGFR 유전자 서열https://raw.githubusercontent.com/KennethJHan/SampleData/master/EGFR_NC_000007.14_GRCh38.fasta 1. 개요 파일을 쓰고 읽는 것은 어느 프로그래밍 언어에서나 기본적인 내용인데요 C# 에서 어떻게 파일을 다루는지 오늘 정리해보겠습니다!! 먼저 한 번에 쓰고 읽는 방법에 대해서 알아보고, 그 다음 대용량의 파일을 다룰 수 있도록 한 줄씩 쓰고 읽는 방법에 대해서도 알아보겠습니.. 2018. 6. 10.
반응형