신테카바이오는 클라우드 기반 전자동(fully automated) AI신약 플랫폼 ‘STB CLOUD(에스티비 클라우드)’를 2022년 11월, 12월에 각각 한국, 미국에 공식 론칭했다. STB CLOUD는 신약후보물질 산출 관련 모든 프로세스를 표준화, 자동화, 단순화해 사용자가 몇 번의 클릭을 하면 손쉽게 결과물을 얻을 수 있는 것이 특징이다.
BIO와 IT 기술이 융합된 STB CLOUD
AI신약 연구를 하려면 단백질 3차원 구조 데이터와 수억 개의 화합물 라이브러리, 단백질-화합물 간 상호작용 동적 모션 데이터 등이 필요하다. 그리고 바이오 빅데이터를 운영하려면 슈퍼컴퓨팅 환경, 페타바이트(Petabyte) 스토리지, 바이오인포메틱스 S/W 및 복잡한 워크플로우 스크립트 등이 필요한데, 이는 훈련이 잘 된 고급 바이오인포메틱스 개발자도 다루기 어려운 고난도 원시(raw) 데이터다.
STB CLOUD는 이종의 하드웨어 및 수백 개 바이오 소프트웨어 등을 자동으로 통합 운영하는 플랫폼이다. 바이오 빅데이터들을 다루는 솔루션이 준비되어 있고, 슈퍼컴퓨팅 하드웨어, 병렬분산 하드웨어를 운영하는 슬럼시스템이 장착되어 있다. 또, 컨테이너의 분산배치, 상태 관리 및 컨테이너의 구동 환경까지 관리해 주는 쿠버네티스(Kubernetes), 컨테이너(Containers) 운영을 위한 도커(Docker), 그리고 워크플로우의 구동 환경을 실행하는 컨테이너 등이 모두 연결되어 있다.
STB CLOUD는 BIO와 IT 기술이 융합된 시너지 산물이라고 할 수 있다. 바이오 소프트웨어는 특정 바이오 데이터를 다루는 쪽으로 특화되어 있어 그 자체로는 솔루션 서비스를 할 수 없다. 그러나 다양한 이종 서버(CPU, GPU, 서로 다른 하드웨어)들과 통합적으로 운영되어 IT 기술과 만나면, 하나의 상품인 플랫폼 환경이 만들어진다. 따라서 STB CLOUD에 바이오 소프트웨어와 바이오 빅데이터가 워크플로우 개념으로 하나로 묶이면 바로 솔루션 서비스가 가능한 상품이 된다. 그것이 STB CLOUD의 첫 번째 상품인 ‘DeepMatcher®-Hit’이다.
딥매쳐는 버추얼 스크리닝 단계(DMC-Pre)에서 수백 대의 GPU와 CPU를 동시에 작동시켜 표적 단백질 별로 10억 개 화합물에 대한 스크리닝을 진행하고, 심층 스크리닝 단계(DMC-SCR)를 통하여 최적의 단백질-리간드 포즈를 생성한다. 여기서도 수백 대의 GPU와 CPU가 사용되며 유효물질 도출 마지막 단계인 분자동역학 검증(DMC-MD) 단계에서도 수백 대의 GPU가 일주일간 작동된다.
3단계로 작동하는 딥매쳐 플랫폼은 수백 개의 스크립트로 구성이 되어 있고 완전 자동으로 구동된다. IT의 엣지 기술인 쿠버네티스, 컨테이너 그리고 도커 등은 관리자, 운영자, 실행자와 같은 역할을 사람 대신 수행해주는 일종의 자동화 기술이다.
현재 STB CLOUD에는 2,000대 GPU 및 CPU가 클라우드로 묶여 있고 원클릭으로 신약후보물질 ‘AI-Hit’ 리포트를 자동 생성 해준다. AI-Hit은 컴퓨터가 실험 성공률이 높을 것으로 예측한 약물 유효물질이다. 실험 검증 후 Hit 물질을 기반으로 자동으로 약물최적화가 수행되고, 이렇게 생성된 결과물을 ‘AI-Lead’ 물질이라고 부른다.
STB CLOUD를 어떻게 활용할 수 있는지.
STB CLOUD는 기존의 신약개발 과정을 표준화, 단순화, 자동화한 새로운 개념의 클라우드 기반 AI 신약개발 플랫폼이다. 클라우드 기반 전자동 시스템으로 ‘언제 어디서든, 쉽고 편리한 원클릭 서비스를 제공한다. 네트워크에 연결된 컴퓨터만 있으면 커피숍에 앉아서도 신약개발을 할 수 있다.
STB CLOUD에 1차적으로 탑재된 ‘딥매쳐’ 서비스를 통해 소비자는 본인이 선정한 질병 관련 타깃 단백질과 수십 마이크로몰(uM) 수준에서 결합력을 갖는 합성신약 유효물질(Hit) 후보를 3주 안에 찾을 수 있다. 사용자는 단지 본인이 원하는 단백질을 결정하고 클릭만 하면 된다. 어떠한 소프트웨어나 하드웨어도 필요 없다.
기존의 AI 신약개발 플랫폼은 좋은 소프트웨어를 제공하지만 이를 활용하기 위해서는 소프트웨어가 돌아가는데 필요한 하드웨어인 슈퍼컴퓨터와 소프트웨어를 작동시킬 전문 인력이 필요했다. 슈퍼컴퓨터라는 장치적인 장벽과 전문가라는 인적 장벽이 존재했다.
STB CLOUD는 서비스 전자동화를 통해 전문가 장벽을 극복하고, 클라우드에 플랫폼을 탑재해 플랫폼을 구현함으로써 슈퍼컴이라는 장치적인 장벽을 극복했다. 이로써 국내외 제약사와 연구진들은 신약개발의 시간과 비용을 획기적으로 감소시킬 기회를 갖게 된 것이다.
또한 신약 개발 니즈는 있으나 임상 및 R&D 과정의 불확실성, 자금과 경험 부족 등의 이유로 first-in-class 신약 등 혁신신약 개발에 보수적이었던 다수의 바이오텍이 STB CLOUD를 통해 빠르게 신약 파이프라인을 확충하고 R&D 과정의 불확실성도 줄일 기회가 생겼다.
STB CLOUD는 외부 인프라가 아닌 고성능 서버를 갖춘 3천 대 규모의 자체 AI 슈퍼컴퓨팅 인프라를 기반으로 구축된 클라우드 서비스이다. 그리고 딥러닝을 통해 고도화된 ‘딥매쳐’가 탑재된 서비스로써 신테카바이오의 하드웨어(그림1의 AI Center)와 소프트웨어(그림1의 STB platform) 기술력을 융합한 서비스이다.
△자료=신테카바이오 제공
STB
CLOUD가 SaaS와 다른 점은.
AI 신약 플랫폼은 대부분 SaaS(software as a service) 형태로 서비스된다. 연구자들은 AI 신약 업체가 제공하는 소프트웨어를 활용해 타깃 단백질과 화합물 간의 상호작용을 계산한다. 고객사의 리소스를 많이 필요로 하지 않지만 SaaS 환경에서는 연구자들의
약물 디자인 능력과 함께 소프트웨어, 데이터 서버 및 데이터 라이브러리에 대한 전문지식이 필요하다.
한편 STB CLOUD는 SaaS처럼
신약개발 도구를 제공하는 것이 아니라 소비자가 원하는 유효물질 후보를 도출해 바로 결과로 제공하는 토탈 서비스다. 편의성과 정확도 측면에서도 SaaS 플랫폼을 앞선다. 인터넷만
연결되어 있다면 소프트웨어나 하드웨어가 전혀 필요하지 않고 전문가가 아니라도 누구나 쉽게 사용할 수 있다는 것이 가장 큰 차별점이다. 클라우드 기반 전자동화된(fully-automated) 환경에서
구동할 수 있다는 점 또한 장점이다.
딥매쳐 이후 STB CLOUD에 탑재될 주요 AI 플랫폼은.
STB CLOUD 서비스 상용화 이후 신생항원 발굴 플랫폼인 ‘NEO-ARS™(네오-에이알에스)’ 클라우드 탑재를 준비하고 있다. NEO-ARS™는 암 환자의 세포나 혈액샘플에서 얻어진
종양 특이적 변이 펩타이드인 신생항원을 예측할 수 있는 플랫폼이다. 타 알고리즘과 달리 MHC 단백질과 신생항원 간의 결합력뿐만 아니라 T세포 수용체와 신생항원의
결합 환경까지 예측해 면역원성까지 예측할 수 있는 플랫폼이다.
그 외에 딥매쳐 Auto-Lead-Opt, Tox/ADME, AI기반
항체신약 플랫폼 등 신약개발 전주기에 걸쳐 사용할 수 있는 다양한 플랫폼을 보유하고 있다. 현재 로컬
환경에서 서비스되고 있는 이 플랫폼들은 순차적으로 STB CLOUD에 탑재될 예정이다. 딥매쳐 Auto-Lead-Opt에 이어 NEO-ARS™와 항체신약 플랫폼 또한 딥매쳐 이상의 성능을 발휘할 수 있도록 준비하고 있다. 또한 2023년 이내에 PGM-ARS와 NGS-ARS 등 유전체 플랫폼도 클라우드에 탑재해 개인맞춤형 정밀의료와
바이오마커 발굴 등 임상 연구에 도움이 될 수 있도록 할 예정이다.
지금까지 R&D 영역에서만 제한적으로 활용할 수 있던 서비스를
표준화, 단순화, 자동화해 클라우드로 서비스할 수 있다는
것은 회사의 기술력 및 플랫폼의 경쟁력을 나타내는 지표라고 볼 수 있다. 또한 주요 플랫폼들의 클라우드
탑재는 서비스의 확장과 밀접한 관련이 있다. 즉, 클라우드를
통해 지리적 제한 없이 글로벌 시장에 대한 접근이 가능하고 시간과 장소에 대한 제약도 사라지게 되었다. 향후
다양한 서비스가 제공되며 연구자들 사이에 STB CLOUD의 활용도가 더욱 높아지게 될 것이다.
△정종선 신테카바이오 기술총괄·대표이사