본문 바로가기
생물정보학/Tools

[GATK] GATK4 - Google Cloud - FireCloud 5달러 분석시대

by HanJoohyun 2018. 2. 26.
반응형

 

 

 

안녕하세요 한주현입니다.

 

오늘은 GATK4의 새로운 소식에 대해 포스팅 해보겠습니다. ㅎㅎ



WGS 30x 를 GATK Best Practice Pipeline로 분석하는 비용이 5달라..?


GATK 포럼에 다음과 같은 포스팅이 올라왔습니다 ㅎㅎ..

 

https://software.broadinstitute.org/gatk/blog?id=11415







30x depth의 WGS(Whole Genome Sequencing)를 분석하는데 사용되는 computing 자원이 5달러 (약 5,300원) 면 분석이 가능하다는 얘기입니다!


개발한 파이프 라인은 Unmapped Read인 uBAM단계에서 부터 VCF까지 분석해주는 것을 얘기 하는 것인데요 아래와 같습니다




데이터 분석가의 입장에서 관심이 가지 않을 수 없는 포스팅인데요 ..ㅎㅎ


포스팅을 간단히 정리해보면 아래와 같습니다



30x WGS 분석 비용 5달러

1) Google Cloud 에서 분석 진행


2) 분석 파이프라인에서 가장 많은 자원을 쓰는 BWA mapper가 Heng Li에 의해 개선된다면 $3 아래 까지 낮아질 것으로 기대함


3) Github에 공개 함 (open source) - https://github.com/gatk-workflows


4) 분석은 FireCloud에서 제공함 (google cloud)


5) FireCloud에서 무료로 분석 할 수 있는 $250 상당의 Credits를 제공함 - https://software.broadinstitute.org/firecloud/documentation/freecredits


6) 향후에는 google cloud 말고 Alibaba cloud와 같은 타 vendor의 서비스에서도 분석이 가능하게 할 예정




이쯤되면 자연스레 다음 포스팅은 Fire Cloud의 사용해본 결과와


GATK4의 실행 내용 GATK3.x 와의 차이점에 대한 정리가 되겠군요 ㅎㅎ



부지런히 찾아보고 움직이겠습니다 ㅋㅋ



오늘은 GATK4를 서비스 해주는 FireCloud 5달러 분석시대에 대하여 알아봤습니다.


부디 여러분들께 도움이 되셨음 좋겠습니다 ㅎㅎ.


그럼 다음 시간에 만나요!


 

 참고 링크: https://software.broadinstitute.org/gatk/blog?id=11415


 


반응형

댓글