신테카바이오가 인공지능(AI) 딥러닝 모델을 사용해 유전체 돌연변이
데이터를 기반으로 바이오마커를 정밀하게 선별하는 새로운 방법에 대한 미국 특허를 출원해 등록을 승인받았다고 16일
밝혔다.
이 특허는 ‘개체군 유전체 염기서열 및 변이의 변환데이터에 대한 인공지능
딥러닝 모델을 이용한 바이오마커 검출 방법’으로, ‘합성곱
신경망(CNN: Convolution Neural Networks)’이라는 AI 딥러닝 모델을 사용해 유전체 돌연변이 데이터에서 바이오마커를 정밀하게 선별하는 방법에 대한 것이다. 회사는 독일의 수학자 힐버트(Hilbert)가 만든 프랙탈 커브를
사용하는 이 검출 방법을 Hilbert-CNN으로 명명했다.
이번 특허에는 차세대 염기서열 분석(NGS) 데이터를 사용해 수집한
빅데이터를 신테카바이오만의 독창적인 방법으로 2D 및 3D 이미지로
표현하는 방법에 대한 세부 정보도 포함됐다.
Hilbert-CNN은 한 사람의 인간 전장 염기서열 1D 정보를 2D 힐버트 이미지로 바꾸는 기술로 수천명의 유전체 정보를
수천장의 이미지로 표현하고, AI 모델을 이용해 정밀하게 분석한다. 전통적인
선형(linear) 질병 연관성 연구로 찾지 못하는 비선형(non-linear) 바이오마커 발굴하는 새로운 방법으로 인정받아 미국 특허로 등록됐다.
Hilbert-CNN은 기존 방식 대비 적은 샘플 수로도 바이오마커
검출의 높은 정밀도와 재현성을 보이는 비선형 모델인 것이 특징이다. 환자계층화 시 환자의 질병 유무나
질병 종류, 진단 결과, 환자 상태 등에 따른 집단 분류, 치료제 임상 시험의 동반진단, 바이오마커를 직접 타깃하는 약물 개발
등에도 활용될 수 있다.
환자 계층화에 사용되는 일반 AI 툴이 사용한 바이오마커 요소들은
블랙박스에 포함되어 확인이 어려웠던 반면, Hilbert-CNN는 블랙박스 해석법에 대한 연구개발을
통해 계층화에 사용된 바이오마커 특정이 가능하다.
미국의 알츠하이머 치매(ADNI database)와 파킨슨 질병(PPMI database)의 빅데이터가 축적된 데이터베이스를 활용해 환자 유전체의 특징을 학습시킨 결과, Hilbert-CNN AI는 정확도 90% 이상의 환자 구분 능력을
보여주었으며, 매우 적은 숫자의 바이오마커 만으로도 높은 정확도가 유지됨을 확인했다. 바이오마커를 산업적으로 활용하기 위해서는 높은 재현성이 동반되야 하기 때문에 다수의 재현성 테스트를 실시했고, 각 실험간 정확도 및 성능에 큰 차이가 없는 것을 확인했다.
기존 방식은 실험집단 내부의 통계적 유의성 및 특정 바이오마커의 유무 등에 기초하고 있어 단일 실험에서는 높은
정확도를 보일수는 있으나, 새로운 블라인드 샘플을 적용했을 경우 성능이 급격히 낮아질 수 있다. 하지만 Hilbert-CNN은 각 그룹의 보편적인 특징을 바이오마커
간의 관계성(Biomarker Networks)에 근거하여 파악하기 때문에 새로운 블라인드 샘플을 적용하더라도
성능이 유지된다.
신테카바이오 정종선 대표이사는 “CNN 딥러닝 방법을 바이오 및 의약
분야에 적용하기 위해 연구를 지속해 왔다”며 “오랜 연구
끝에 개발한 Hilbert-CNN 검출 방법이 우수한 결과값과 독창성을 인정받아 미국 특허 등록까지
마칠 수 있어 기쁘고, 이 기술이 바이오마커 기반 맞춤 약물 개발에 큰 도움이 될 것”이라고 말했다.
또한 “한국을 비롯해 미국 특허 등록까지 승인된 만큼 특허 취득에
사용된 여러 질병 모델과 검증 데이터 등을 논문으로 작성할 계획”이라고 덧붙였다.