AI 창업, 당신은 지금 OpenAI 를 꿈꾸고 있습니까?
- 바이오 스타트업이 반드시 짚어야 할 세 갈래 길
ChatGPT가 등장한 이후, 전 세계 창업가들이 “AI 시대”를 외치기 시작했습니다.
모두가 OpenAI를 닮고 싶어 하고, NVIDIA를 부러워합니다.
바이오 스타트업도 예외는 아닙니다.
어떤 팀은 자신들의 유전체 데이터를 기반으로 GPT를 만들겠다고 하고,
어떤 팀은 영상 기반 Foundation 모델을 자체 개발하겠다고 합니다.
꿈은 클수록 좋지만, 한 가지 질문이 필요합니다.
그 창업, 정말로 가능한 일일까요?
AI 시대의 창업, 세 가지 갈래길
AI 시대에에서 우리가 할 수 있는 사업은 크게 세 가지 입니다.
1. GPU를 제조하거나 설계하는 일
- NVIDIA, TSMC, Hynix 같은 기업들이 합니다.
- 사실상 거의 모든 스타트업은 이 영역에서 실질적으로 경쟁력이 없습니다.
2. Foundation Model을 직접 개발하는 일
- OpenAI, Google, Meta가 수조 원을 태워서 만드는 영역입니다.
- GPT-4 한 개 개발 비용이 웬만한 바이오 스타트업 전체 펀딩의 수백 배에 달하며
- 수 천 명의 세계적 AI 인재들이 투입되는 전쟁터입니다.
3. 자신만의 데이터를 활용하여 Foundation Model을 fine-tuning하거나, 그 위에 부가가치를 창출하는 서비스 또는 제품을 만드는 일
- 이 것이 바로 AI 시대에 바이오 스타트업이 할 수 있는, 아니 반드시 해야하는 길 입니다.
그런데, 놀랍게도 많은 스타트업들이 2번을 꿈꾸고 있습니다.
심지어 2~3명 짜리 팀이 논문 몇 편을 근거로 “우리는 GPT 기반으로 유전체 분석 모델을 만들 수 있다”라고 이야기 합니다.
하지만 냉정히 보자면, 이는 극히 비현실적인 접근입니다.
왜 Foundation Model 개발은 바이오 스타트업에게 ‘불가능한 게임’ 일까?
GPT-4는 단순한 LLM이 아닙니다.
그 뒤에는 다음과 같은 자원이 결합되어 있습니다.
- 수조 token에 이르는 학습 데이터
- 수십만개의 GPU
- 수천명의 탑 클래스 AI 연구자
- 수년간 최적화된 인프라 관리 경험
게다가 Foundation Model의 본질은 범용성입니다.
그러나 바이오 산업은 전문성과 규제, 해석의 일관성, 윤리와 임상적 근거가 핵심인 영역입니다.
따라서 바이오 도메인에서는 범용성보다 도메인 적합성이 훨씬 더 중요합니다.
바이오 스타트업의 진짜 기회는 어디에 있는가?
답은 3번입니다.
고유한 도메인 데이터를 바탕으로, 기존 모델을 활용하여 가치를 창출하는 것.
- Alpha fold가 단백질 구조를 예측해도, 그 위에 유전체와 임상 데이터를 통합할 수 있는 팀은 거의 없습니다.
- 유전체 시퀀싱 데이터는 많지만, 정확한 임상 표현형과 연결된 대규모 데이터셋을 대규모로 보유한 조직은 드뭅니다.
- EMR에서 나오는 한국어/영어 혼용, 각종 병원별로 다른 용어 체계를 정제해 신뢰성 있는 분석이 가능한 팀은 더욱 희귀합니다.
이처럼 복잡하고 정제되지 않은 dirty data를 다룰 수 있는 능력은
AI 시대 바이오 스타트업의 핵심 경쟁력입니다.
3번도 결코 쉽지 않습니다.
“가능한 길”이라고 해서 “쉬운 길”은 절대 아닙니다.
- 각종 규제와 IRB, 프라이버시 이슈
- 병원 및 연구기관과의 파트너십 구조
- 실제 임상 사용 가능성을 검증하는 기나긴 단계들
하지만 이 길을 제대로 걷는 사람은 극히 드물고,
기회는 바로 그 안에 존재합니다.
거인을 닮지 말고, 거인을 활용하자.
- NVIDIA를 만들수 없다면, 그들의 인프라를 활용하자.
- OpenAI를 따라갈 수 없다면, 그들의 모델을 바이오 데이터에 맞춰 fine-tuning 하자.
- 진짜 경쟁력은 “나만이 가진 바이오 데이터”에서 나옵니다.
AI 시대의 바이오 창업은,
모델을 만드는 것이 아니라, 누구도 갖지 못한 진짜 데이터를 수집하고 활용하는 것입니다.
거인을 닮으려 하지말고,
거인의 어깨 위에서 나만의 해석을 만들어 내는 것.
그것이 진짜 전략입니다.
----
바이오 스타트업에서 그리 길지 않았지만, 초기 멤버로써 조인하여 상장까지 함께한 진지한 시간을 통해 얻은 인사이트를 나눠봅니다. 비슷한 고민을 하고 있는 분들께, 이 글이 작은 참고가 되기를 바라겠습니다.
'생물정보학 > 일상' 카테고리의 다른 글
| 바이오스타트업 해킹사고, 23andMe의 교훈과 앞으로의 우리들의 액션 (2) | 2025.08.06 |
|---|---|
| "하나만 잘하자" - 진짜 맛집은 메뉴판이 얇다 (1) | 2025.07.22 |
| 경험이라는 자산과 함께 일한다는 것 - 한 중년 엔지니어와의 동료로서의 기록 (0) | 2025.07.14 |
| 생물정보학 분석 플랫폼의 착시: 분석을 ‘쉽게’ 만든 다는 환상 (0) | 2025.07.09 |
| 바이오 스타트업 “될 것 같은 느낌” 만으로 창업하면 어떤 일이 벌어질까요? (0) | 2025.06.22 |
댓글