본문 바로가기
생물정보학/뉴스

[한주현의 Genome Mining] NGS 산업 시장 알아보기

by HanJoohyun 2018. 8. 4.
반응형

 


안녕하세요 한주현입니다. ^^

 

오늘의 Genome Mining의 주제는 "NGS 시장 알아보기" 입니다.


제가 쓰는 첫 번째 Genome Mining 칼럼이므로 제 소개 먼저 하고 진행해 보겠습니다

1. 한주현 소개

저는 생물정보학자로, 2018년 현재 마크로젠 데이터분석부에서 Human Sequencing 분석을 주 업무로 맡고 있습니다.

NGS Sequencing을 단계별로 표현하자면 아래와 같습니다.


NGS Sequencing 단계
샘플 -> 라이브러리 -> 시퀀서 -> rawdata -> Readable Variant Calling Format -> 연구

1) 시퀀싱 하고 싶은 샘플을 채취하여
2) 샘플을 시퀀서 기계가 읽을 수 있도록 라이브러리를 제작하고
3) 시퀀서에 돌리면
4)  A, C, G, T 염기서열의 rawdata (fastq) 가 나오게 됩니다.
5) 이를 유전체 분석 tool로 분석을 진행하면
6) 결과가 나오고
7) 이를 연구자들께서 후속 연구를 진행해 주십니다.

저는 여기서 4에서 6번 단계 까지의 과정의 데이터 생산과

연구자들과 함께 7번 단계인 후속 연구를 주 업무로 하고 있습니다.

어떻게 보면 간단한 일이긴 합니다만 ^^;;

연구자들께서 의미있는 연구를 진행하시기 위해서 필요한 중요한 단계라 생각하며

데이터의 품질에 만전을 기하며 업무를 진행하고 있습니다. ㅎㅎ




2. NGS 산업 시장 알아보기

NGS 산업 시장은 아래와 같이 4단계로 구성되어있습니다.

1) 샘플 채취단계인 Pre-Sequencing 단계
2) 염기서열을 읽는 Sequencing 단계
3) 데이터분석 단계
4) 후속 연구인 의료적 연구 및 비의료적 연구 단계

각 단계를 자세히 들여다 보겠습니다

1) 샘플 채취단계인 Pre-Sequencing 단계
Sequencing 할 샘플을 회사에 맡기거나 자체 연구실에서 library를 제작합니다.

library제작은 DNA를 잘라서(shearing) 조각화(fragmentation)를 진행합니다.

그 후 적당한 DNA 조각 사이즈를 골라냅니다.

만약 Exome 이나 target sequencing 이라면 원하는 영역을 capture 하는 방법이 추가 됩니다.

전체를 읽는 WGS(Whole Genome Sequencing)은 capture 단계가 없습니다 ㅎㅎ;

그리고 만든 library가 제대로 만들어 졌는지 QC(Quality Control) 과정이 있습니다.



2) 염기서열을 읽는 Sequencing 단계
준비된 라이브러리를 시퀀서에 넣고 sequencing을 진행합니다.

아래 사진의 왼쪽이 HiSeqX, 오른쪽이 NovaSeq 입니다. ㅎㅎ


Sequencing이 완료되면 fastq라는 파일이 나오는데 sequencer가 읽은 정보를 read 단위로 서열과 quality를 포함하여 총 4줄로 표기한 텍스트 형식의 파일입니다.

텍스트는 너무 크니 압축된 형태로 rawdata를 가지고 있는데, Whole Genome Sequencing의 경우 약 15GB 정도 입니다.

꽤나 크지요.




3) 데이터분석 단계
염기서열을 읽었으면 그 다음 단계는 분석입니다.

분석을 하기 위해서는
기준서열에 붙여서 (mapping)
다른 서열들을 찾고 (variant calling)
다른 서열들이 이전에 보고 되었는지, 의미가 있는지 여부를 데이터베이스에 붙여서 확인하는 작업을 진행합니다. (annotation)

앞서 말씀드렸듯이 매우 큰 파일들이 분석 되므로 그냥 우리가 쓰는 일반 컴퓨터로는 분석이 안됩니다 ㅎㅎ;

그래서 아래처럼 메모리와 스토리지, 계산능력이 좋은 대용량의 서버를 사용하거나,

아마존, 구글 클라우드 같은 서비스를 이용합니다.




4) 의료적 연구 및 비의료적 연구 단계
네 가지 기업으로 준비해 보았습니다.

- Foundation Medicine


Broad Institute에서 분사한 벤처기업으로 
진단 시장에서 활약하고 있으며 NGS 기술을 활용하여 322개의 암과 관련된 gene(315개의 유전자 영역, 28개의 intron 영역)을 검사 해 줍니다.


- 23andMe


타액(침, saliva) 로 SNP(Single Nucleotide Polymorphism)를 확인하여 

Ancestry reports,

Genetic Health Risk reports (BRCA1/BRCA2, 알츠하이머병, 파키슨병 등),

Wellness reports (카페인 소비, 숙면 등),

Traits report (탈모, 기미, 기상 시간, 모기가 자주 물리는 정도...ㅋㅋ 등),

Carrier Status reports (Cystric Fibrosis, Sickle Cell Anemia, Tay-Sachs Disease 등)

의 정보를 제공해 줍니다.


미국 FDA와 툭탁 거리는 에피소드들이 좀 있었습니다만 다양하고 많은 정보를 제공해주는 회사 입니다.



- AncestryDNA


Ancestry 검사를 받고 친척을 찾고 자신이 어느나라 인종출신인지 알 수 있는 서비스 입니다. 
만약 미국에 사는 유럽계열 사람들이라면 내가 독일 출신인지 필란드 출신인지 알 길이 묘연하기에 이러한 서비스가 인기가 있습니다 ㅎㅎ..


- MyGenomeBox

마지막으로 알아볼 기업은 MyGenomeBox로 한국 기업 EDGC에서 제공하는 서비스 입니다.
아래와 같이 앱마켓이 존재하여 자신의 DNA 정보가 있다면 아래와 같이 앱으로 분석하는 서비스를 제공하고 있습니다.









오늘은 NGS 산업시장에 대해 알아보았습니다


그럼 다음에 또 만나요 ^^





기부 버튼을 만들었습니다
여러분들의 작은 정성이 저에게 큰 힘이 됩니다
기부해주신 분들을 기억하며
더 좋은 내용으로 보답해 드리겠습니다 :)

Donate 버튼은 paypal 결제로 paypal 계정이 없으시더라도
카드로도 기부 가능하십니다 :)
Use your credit card or bank account (where available). 옆의 continue 를 누르시면 됩니다

한주현 드림



 



반응형

댓글