본문 바로가기
반응형

2018/025

[GATK] GATK4 - Google Cloud - FireCloud 5달러 분석시대 안녕하세요 한주현입니다. 오늘은 GATK4의 새로운 소식에 대해 포스팅 해보겠습니다. ㅎㅎ WGS 30x 를 GATK Best Practice Pipeline로 분석하는 비용이 5달라..? GATK 포럼에 다음과 같은 포스팅이 올라왔습니다 ㅎㅎ.. https://software.broadinstitute.org/gatk/blog?id=11415 30x depth의 WGS(Whole Genome Sequencing)를 분석하는데 사용되는 computing 자원이 5달러 (약 5,300원) 면 분석이 가능하다는 얘기입니다! 개발한 파이프 라인은 Unmapped Read인 uBAM단계에서 부터 VCF까지 분석해주는 것을 얘기 하는 것인데요 아래와 같습니다 데이터 분석가의 입장에서 관심이 가지 않을 수 없는 포.. 2018. 2. 26.
[리눅스] 쉘 스크립트에서 파일 사이즈 구하기 안녕하세요 한주현입니다. 오늘은 리눅스 쉘 스크립트에서 파일사이즈를 알아내어 이후과정을 처리하는 방법 에 대하여 알아보겠습니다. 쉘 스크립트로 파일 사이즈 구하기 stat 또는 wc 명령어 쉘 스크립트에서 파일 사이즈를 구하는 방법은 stat 또는 wc 명령어로 간단하게 사용할 수 있습니다. 아래 코드의 9번, 10번 라인을 보시면 stat 또는 wc 명령어로 파일사이즈를 구하였습니다. 이후에 진행되는 12-15 라인에서는 if 문으로 파일 크기에 따라 명령어를 실행 할 수 있게 만들어주는 부분입니다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 #!/bin/bash if [ $# -ne 1 ];then echo "#usage: sh $0 " exit fi FILE=$1 #FILESI.. 2018. 2. 14.
[pandas] 파이썬 판다스를 활용한 컬럼 정렬 안녕하세요 한주현입니다 오늘은 파이썬 판다스를 활용하여 컬럼간 정렬하는 방법에 대해 알아보겠습니다 준비물 1) 파이썬 판다스https://pandas.pydata.org/ 2) 헤더가 있고 행과 열로 구성된 데이터 *) 모든 소스코드와 샘플 데이터는 다음 링크에서 받으실 수 있습니다https://github.com/KennethJHan/PandasColumnSorter 기본 원리 판다스에서는 행과 열로 구성된 데이터를 엑셀 테이블 처럼 다룰 수 있는 DataFrame이라는 객체에 담을 수 있습니다 0) pandas를 import 합니다 1import pandas as pdcs 1) data 파일을 읽습니다. panadas의 method 중 read_csv 라는 메서드를 사용합니다. 여기서는 구분자가 co.. 2018. 2. 5.
[여행] 겨울 방콕 여행, 날씨, 옷차림 안녕하세요 한주현입니다 방콕에 놀러온지 이틀째 되는 날입니다 ㅎㅎ 시차가 2시간이 있어서 6시쯤 되니 딱 눈이 떠지더라구요 ㅎㅎ;; 벌써부터 많이 먹었는지 얼굴이 찐빵이 되었습니다 ㅋㅋㅋ 원래 부터 제가 좀 찐빵 모양 얼굴이긴 합니다 ㅎㅎㅎ.. 지금이 2월 초인데 한국은 -10도 정도 인데 여기는 25~30도 정도입니다 날씨는 구름이 끼었는지 파란 하늘이라기 보다는 하얗습니다 ㅎㅎ;; 여기 현지 방콕 사람들은 선선해서 그런지 이게 좋은날씨라고 하더군요 지금 옷차림은 반팔에 반바지를 입었는데 따뜻하고 선선하고 쾌적하고 너무나 좋습니다!! 여러분들도 기회가 닿으신다면 겨울 방콕 여행 해보시기를 추천드립니다! 그럼 다음 포스팅에서 만나요~ ! 2018. 2. 4.
반응형