빅데이터가 생명공학 분야에 빠르게 도입되고 있다. 기존에는 불가능했던
연구들이 수행되면서 획기적인 결과를 내고 있고, 기술 발전 속도는 더 빨라지고 있다. 빅데이터가 생명공학 분야에 한계를 끌어올릴 전망이다.
한국바이오협회 박봉현 연구원과 에비드넷 조인산 대표는 최근 '생명과학
분야에서 빅데이터의 영향과 향후 방향' 보고서를 발표했다. 이들은
보고서를 통해 빅데이터가 생명공학 분야에 새시대를 앞당길 것이라고 평가했다.
빅데이터는 기존 소프트웨어나 인터넷 기반 플랫폼으로 관리할 수 없는 방대한 데이터를 말한다. 미국 산업 애널리스트이자 IT 전문가 더그 레이니(Doug laney)는 빅데이터가 방대한 양의 데이터 용량(Volume), 실시간으로
생성되는 속도(Velocity), 다양한 형태로 제공되는 다양성(Variety), 이 세 가지 3V 특징을 가지고 있다고 설명했다. 다시
말해 빅데이터는 눈 깜짝할 새에 많은 정보와 데이터들을 모으고, 이 데이터를 분석해 사용자가 원하는
형태의 결과로 제공하는 기술로 볼 수 있다.
특히 빅데이터가 주목받는 점은 사용자가 원하는 결과를 도출하는 데 소요되는 시간과 비용을 획기적으로 줄였다는
점이다. 또한 결과 값의 정밀도와 정확도도 매우 우수하다. 이러한
장점에 따라 빅데이터는 생명공학 분야에 빠르게 도입되고 있고, 적용 기술 범위도 기하급수적으로 증가하고
있다.
▲자료=한국바이오협회 '생명과학
분야에서 빅데이터의 영향과 향후 방향' 바이오 이코노미 브리프 일부 발췌.
현재 생명공학 분야 중 유전체학에서 빅데이터 활용이 단연 돋보인다. 과거에는
세포나 동물에서 수행된 실험을 기반으로 질병과 관련된 경로 및 지식에 따라 약물이 개발됐지만, 이 결과는
인간에게까지 적용에 한계가 있었다. 유전적 변이와 종간 차이와 같은 생물학적, 기술적 변수를 고려해야 했기 때문이다. 이전에는 이러한 수천, 수만 가지의 변수를 연구자가 직접 수행해야 했지만, 빅데이터 적용을
통해 짧은 시간 내에 정확도 높은 결과를 얻을 수 있게 됐다.
이에 따라 단일세포 게놈 및 액체생검에서 종양 DNA의 전사체 시퀀싱을
포함한 유전체학과 메타지노믹스는 의학에 현저한 영향을 줄 만큼 발전했고, 현재 빅데이터를 기반으로 한
환자 개인맞춤 치료제 개발까지 이뤄지고 있다.
▲자료=한국바이오협회 '생명과학
분야에서 빅데이터의 영향과 향후 방향' 바이오 이코노미 브리프 일부 발췌.
또한 미국 국립 보건원과 국립 인간 게놈 연구소는 지난 2005년
빅데이터를 활용한 '암유전체지도(The Cancer Genome
Atlas, TCGA)' 프로젝트를 시작했고, 지난 2009년 기술 발전에 따라 TCGA 프로젝트를 대규모 확장했다. 이 프로젝트는 인간게놈 서열을 기반으로, 환자들의 유전적 프로파일을
평가하고 질병의 위험 및 치료적 접근과 방응, 관련 패턴을 식별한다. 이를 통해 여러 질병 부위의 표본을 배열하고 암과 관련된 유전적 변형에 대한 심층적인 데이터를 구축해 치료방법을 찾는다.
이러한 방대한 데이터를 기반으로 한 연구는 사람이 수행해야 하는 범위가 넓어서 막대한 비용과 시간이 소모돼 실현이
어려웠다. 그러나 이제는 빅데이터 도입으로 연구가 가능하게 됐다. 특히
빅데이터는 TCGA와 더불어 신약후보물질 발굴, 약물작용기전
파악, 맞춤형 치료제 개발까지 가능하도록 기술을 발전시켰다.
박봉현 연구원과 조인산 대표는 보고서를 통해 “빅데이터는 '데이터 과학'이라는 새로운 과학분야의 탄생으로 이어질 만큼 생명과학
분야에 혁신”이라며 “멀티오믹스, 메타분석, 공동발현 분석 등은 모두 대규모 데이터 세트를 기반으로
하므로, 원활한 사용을 위해 서로 다른 데이터 유형을 통합해야 한다”고
전했다.
또한 “데이터 간 이질성, 이해관계자 간 갈등, 데이터 소유권, 개인정보 보호 등 문제를 신속하게 해결하고, TCGA와 같은 범용적 고가치 데이터 세트 축적에 대한 자금 지원이 필요하다”고 덧붙였다.