본문 바로가기
반응형

FASTA7

[cpp] FASTA 파일을 인덱스를 사용하여 읽는 방법 들어가며안녕하세요 한주현입니다 오늘은 cpp로 fasta 파일을 읽는데 index를 사용하여 전체 파일을 읽지 않고,미리 인덱스 파일을 읽어 해당 위치로 이동하여 읽을 수 있는 코드에 대해 말해보겠습니다. FASTA 파일 설명먼저 FASTA 파일과 FASTA 파일의 index 파일에 대해서 설명해보겠습니다.FASTA 파일은 아래와 같이 생겼습니다. > 로 시작하는 header 줄이 있고 그 다음은 염기서열이 있는 줄 들이 있습니다.각각의 >header 와 서열들을 하나의 record라고 부릅니다.FASTA 파일에는 하나의 record가 들어있을 수도 있고 여러개의 records가 있을 수도 있습니다.예시에서는 세 개의 records가 있고 각각의 record는 한 줄의 염기 개수가 60자로 되어있습니다... 2024. 6. 20.
[바이오파이썬] 5.1.1 SeqIO 모듈로 서열 파일 읽기 - FASTA 안녕하세요 한주현입니다. 오늘은 SeqIO 로 파일읽는 방법에 대해 알아보겠습니다. SeqIO로는 FASTA, FASTQ, GenBank 등의 파일을 읽을 수 있는데 오늘은 SeqIO의 메서드와 FASTA 파일 읽기를 살펴보겠습니다. 목표 SeqIO 모듈의 Sequence 파일을 읽는 두 가지 메서드인 SeqIO.read(), SeqIO.parse()에 대해 알아보겠습니다. SeqIO 모듈을 활용하여 FASTA 파일을 읽는 방법에 대해 알아보겠습니다. 준비물 오늘은 준비물이 없습니다 ㅎㅎ 예시 파일은 우리가 그냥 메모장으로 만들어봐요~ SeqIO의 두 가지 메서드 SeqIO 모듈을 가지고 Sequence 파일을 읽을 때 두 가지 메서드가 있습니다. SeqIO.read() SeqIO.parse() 간단히 .. 2018. 12. 24.
[생물정보학] Fasta Reader GUI, 윈도우에서 FASTA 파일 읽어서 염기서열 세는 프로그램, JAVA GUI 예제, JAVA Swing 예제 안녕하세요 한주현입니다. 오늘은 FASTA 파일을 윈도우, 맥 GUI 환경에서 읽어 염기서열 세어주는 프로그램을 제작해 보았습니다. 목차 1. 프로그램 소개2. 프로그램 사용방법부록. UCSC FASTA 파일 다운로드 1. 프로그램 소개 "Fasta Reader GUI" 는 윈도우나 맥, 리눅스의 GUI (Graphic User Interface) 환경에서 FASTA 파일을 읽어 전체 염기서열 개수, A, C, G, T 그리고 N 염기의 개수를 세는 프로그램입니다. 프로그램은 JAVA로 제작하였으며 사용하시는 환경에 JAVA 8 버전이 필요합니다. 참고로 FASTA 파일은 유전서열을 담고 있는 파일로 ">" 기호가 있는 헤더 부분과 서열부분으로 나뉩니다. FASTA 파일 형식> 헤더 ACACACGGCCN.. 2018. 11. 15.
[생물정보학] FASTA gzip 파일 읽기 - 염색체 별로 염기 숫자 세기 - UCSC FASTA 다운로드 - 자바 JAVA , 파이썬 Python, 파일 읽기 속도 비교 안녕하세요 한주현입니다. 오늘은 자바, 파이썬으로 FASTA gzip 파일을 읽어 염기서열을 세는 프로그래밍을 해보겠습니다. 목차 1. UCSC FASTA 파일 다운로드 2. 염색체 별로 읽기3. Python 스크립트 구현4. JAVA 코드 구현5. 결과6. 파일 읽기 속도 비교 - JAVA, Python 1. UCSC FASTA 파일 다운로드 - chromosome 별 다음 경로에 들어가서 chromosome 별로 fa.gz 파일을 받습니다. hg38 http://hgdownload.soe.ucsc.edu/goldenPath/hg38/chromosomes/ hg19http://hgdownload.soe.ucsc.edu/goldenPath/hg19/chromosomes/ 사이트에 접속하시면 다음과 같은 .. 2018. 11. 14.
반응형