본문 바로가기
반응형

전체 글244

[바이오파이썬] 바이오파이썬 1.78에서 달라진 점 - Seq 클래스 편 - Bio.Alphabet has been removed from Biopython 안녕하세요 한주현입니다. 오늘은 바이오파이썬 1.78에서 달라진 Seq 클래스에 대해 알아보겠습니다. 들어가며 2020년 9월에 바이오파이썬의 1.78 버전 업데이트로, Seq 클래스의 사용법이 조금 바뀌었습니다. 오늘은 1.78 버전에서 Seq 클래스의 달라진점과 도서에서 작동하지 않는 부분을 어떻게 하면 실행할 수 있는지 방법에 대해 알아보겠습니다. 버전업! 앞서 말씀드렸듯이 2020년 9월 바이오파이썬이 1.78로 업데이트 되었습니다. 덕분에 ㅎㅎ.. 도서에서 사용했던 코드가 작동하지 않는 부분이 있습니다. ㅜㅜ 다음은 도서 70페이지의 4.5.2 Bio.SeqUtils로 서열의 무게를 계산하는 코드인데요, ATGCAGTAG를 DNA 로 볼 경우와 아미노산 서열로 보는 경우에 따라 다르게 무게가 계.. 2020. 10. 3.
[강연 후기] 덕성여대 WISET 사업단 바이오인포매틱스 교육, 생물정보학 강의 안녕하세요 한주현입니다. 오늘은 지난 7월에 진행한 바이오인포매틱스 교육 후기와 사진 및 강의 자료를 공유해보는 시간을 가져보겠습니다. 들어가며 지난 7월 중순의 주말동안 토, 일, 토, 일의 4일 동안 덕성여대 WISET 사업단에서 마련해준 자리에서 생물정보학 강의를 오프라인+온라인 진행했습니다. 내용은 나름 야심차게.. 준비했었습니다.. ㅋㅋ 1) 현업에서 일하고 있는 인생 선배로 생물정보학에 관심이 있는 꿈나무들에게 해주고 싶은 업계 이야기 2) 기본적인 파이썬 문법 강의 3) "바이오파이썬으로 만나는 생물정보학" 의 내용을 일부 발췌하여 바이오파이썬으로 covid19 서열 다루고, 논문들의 abstract 를 가져오고, weblogo를 만들고 4) AWS 클라우드로 인스턴스 만들고 리눅스 커맨드라.. 2020. 8. 9.
[VCF 파일] genozip - VCF 파일의 효율적인 압축 방법을 제시한 툴 여러분 안녕하세요 한주현입니다. 오늘은 genozip 이라는 툴에 대해 알아보겠습니다. 들어가며 이 논문은 제가 좋아하는 논문 저널 중 하나인 Bioinformatics 에서 최근에 출판한 논문입니다. Bioinformatics 저널에서 새로운 분석 방법과 결과 등을 살펴보는 식으로 읽어오곤 했었는데요, 이번에 소개드릴 논문은 생물정보학에서 VCF, bam, fastq, fasta, 그리고 23andMe 파일을 더 효율적으로 압축해주는 툴에 대한 논문입니다. https://academic.oup.com/bioinformatics/article/36/13/4091/5837110 genozip: a fast and efficient compression tool for VCF files AbstractMot.. 2020. 7. 12.
[생물정보학] ORF와 CDS의 차이점과 refGene.txt.gz 파일 안녕하세요 한주현입니다 오늘은 ORF (Open Reading Frame)와 CDS (Coding Sequence) 의 차이점과 refGene.txt.gz 파일에 대해서 알아보겠습니다. ORF ORF (Open Reading Frame)는 시작 코돈 (AUG)에서부터 종결 코돈 (UAA, UAG, UGA) 까지의 서열을 말합니다. ATG [xxx] TAG 와 같이 시작과 종결 사이에 triplet code, 즉 3배수의 염기들로 구성 되어만 있다면 ORF 라고 부를 수 있습니다. 실제로 DNA 서열에서 ATG (3n) TAG 로 구성된 ORF 서열을 찾아보면 많이 존재합니다. 이러한 ORF를 찾아주는 프로그램들도 존재하지요. 1) ORF Finder https://www.bioinformatics.org.. 2020. 7. 5.
반응형