빅데이터 활용 연구, 한국 어디까지 왔나? 조인산 에비드넷 대표, "한국 분산 데이터 연구망, 세계적 데이터망으로 성장할 것"

AI를 활용한 혁신은 보이지 않는 곳에서도 활발히 이루어지고 있고 있다. 어찌 보면 신약개발과 헬스케어 영역에서 AI를 활용한 혁신이 일어나는 것은 당연한 일이다.

이제 우리는 AI 기술을 활용해 신약이 개발되는 기간과 비용을 줄여 나가고 있고, 인간 고유 및 개인의 유전체 정보를 빅데이터 기법으로 해석 및 분석해 개인 맞춤형 치료와 헬스케어에 도움을 주는 시대에 살고있다.

한국바이오협회와 리드엑시비션스 코리아는바이오플러스-인터펙스 코리아 2021’ 2차 온라인 콘퍼런스를 지난 23일부터 24일까지 개최한다.

지난 23일 진행된 콘퍼런스는바이오와 디지털이란 주제로 ‘AI와 빅데이터, 바이오헬스케어 혁신의 새로운 세계(AI and Bigdata, A New World of Bio-healthcare Innovations)’란 주제로 진행됐다.

조인산 에비드넷 대표는한국에서 일어나는 의료 빅데이터 혁신이란 주제로 세션을 이끌었다.

미국 FDA RWD(Real World Data) 활용을 적극적으로 권장하는 것을 시작으로 유럽과 일본 등 많은 나라에서 RWD 활용이 장려되고 있다.

조인산 에비드넷 대표

조인산 대표는미국 맥킨지(McKinsey)에서 진행한 설문 자료에 의하면 코로나 사태 이후 비대면에 대한 경험이 전 산업군에 걸쳐 늘어나고 있는 추세이며 실제로 미국의 허가 문서를 제출하는 기업의 약 76~78%의 기업이 RWD를 직접적이거나 간접적으로 활용하고 있다이는 그 활용도가 점점 증가하고 있는 것을 확인할 수 있다고 설명했다.

이어 “RWD가 본격적으로 쓰이게 되면 기허가 품목에서 신규 적응증을 추가하거나 라벨을 변경한다 거나 비교효과에 대한 연구, 안전성에 대한 연구, 시판 후에 임상을 보완하거나 대체하는 용도로 굉장히 활발하게 쓰일 것으로 예상된다고 덧붙였다.

우리나라에서도 RWD를 활용하기 위해 빠르게 움직이고 있다.

식품의약품안전처에서도바이오의약품의 실사용데이터(RWD) 및 실사용증거(RWE) 국외 활용 정보집을 발간하고 허가 규제에 의료 데이터를 활용하는 시도 진행하고 있다.

조인산 대표는우리나라는 병원 대부분이 EMR에 환자 데이터를 기록한다그래서 굉장히 많은 디지털 레코드들이 병원에 축적이 되고 있다고 말했다.

이어이런 데이터가 잘 활용이 안되는 여러가지 원인이 있겠지만 그 중 하나는 축적된 데이터들이 표준화가 안되어 있는 데이터, 전처리가 안되어 있는 데이터라고 설명했다.

조 대표에 의하면 이를 인식한 정부와 병원에서는 표준화가 되지 않은 데이터를 표준화하기 위해 바쁘게 움직이고 있으며, 11월 현재 기준으로 전국의 대형 병원들 약 60여개에서 병원 내 데이터들이 상당 부분 표준화가 완료되어 가고 있다.


발표자료 1

또한 건강보험공단이나 심사평가원의 데이터도 표준화가 진행되고 있다.

조 대표는이렇게 표준화된 데이터를 플랫폼 형태에서 분산 형태로 분석을 해보는 일들이 가능해진다이는 한 개의 기관이 아닌 여러 다기관에서의 분석 결과를 쉽게 취합할 수 있다는 장점이 있다고 설명했다.

실제 2019년 란셋에 실린 논문 중 하나는 4개국, 9개의 의료기관 의료 데이터를 바탕으로 500만 명에 이르는 고혈압 환자들의 데이터를 바탕으로 쓰여졌다.

이만큼 과거에는 상상도 할 수 없었던 대규모의 데이터를 쉽게 분석하는 일들이 가능해 진 것이다.

조 대표는실제로 우리나라에서도 분산 데이터 플랫폼이 운영 중에 있으며 약 1만건이 넘는 데이터 풀이 있다환자의 치료법, 의약품의 효능 및 부작용을 연구하는 많은 의학 연구자들이 활용하고 있다고 말했다.

이어이런 의료 빅데이터를 다기관에서 구축해 보면 여러가지 쓰임새가 생기는데, 하나는 우리가 임상시험을 할 때 각 사이트별로 대상 환자가 얼마나 있을까 빠르게 미리 파악이 가능하다고 설명했다.

또한 조 대표에 의하면 이러한 빅데이터를 활용한 AI 트레이닝도 가능하다.

조 대표는분산되어 있는 데이터들을 페더레이티드 러닝 기법(Federated Learning)을 활용함으로 AI를 더 고도화시키는 글로벌 AI 튜닝을 할 수 있다고 설명했다.

에비드넷에서 실제로 당뇨병, 고지혈증, 고혈압 예측의 AI 알고리즘을 페더레이티드 러닝 기법을 활용해 만든 결과, 높은 수준의 정밀도를 가진 예측이 가능했다고 조 대표는 밝혔다.

이어이러한 데이터를 바탕으로 특정 환자에서 다음을 예측할 수 있고, 그 환자에 대한 건강 정보를 AI가 진단할 수 있는 모델들이 속속히 개발되고 있는 상황이라고 말했다.

우리나라 정부도 이러한 의료데이터 활용을 촉진하기 위해 작년 9보건의료데이터 활용 가이드라인을 편찬한 바 있다.

발표자료 2

조인산 대표는 발표를 마무리 하면서한국의 의료 데이터는 굉장히 풍부하며 디지털 형태로 잘 저장이 되어 있으며 과거에 좀 어려웠던 표준화의 문제를 상당 부분 해결해 놓은 상태라며한국에서 감염 데이터 활용에 대한 법이 통과됐고 가이드라인도 편찬이 되어서 의료 데이터를 활용할 수 있는 생태계들이 조성되고 있다고 말했다.