[메디파나뉴스 = 이정수 기자] 한국제약바이오협회가 국내 제약·바이오 신약개발 산업에서 역할을 확대하기 위한 행보에 속도를 높이고 있다.
지난 17일 한국제약바이오협회에 문을 연 '연합학습 기반 신약개발 가속화 프로젝트 사업단'은 이같은 협회 행보가 만든 핵심 성과 중 하나다.
'K-MELLODDY'로도 불리는 이 사업은 제약사 또는 의료기관 등이 신약후보물질 개발 가능성을 제대로 평가할 수 있도록 도와, 신약개발에 소요되는 비용과 시간을 절감할 수 있도록 하기 위해 고안됐다.
이를 위해 사업에 참여하는 여러 기관과 기업 등이 각각 보유하고 있는 로컬 데이터를 직접 AI(인공지능)가 학습하면서 평가 정확성을 높이게 된다. AI가 이같이 각각에 흩어져있는 데이터를 학습하는 것이 '연합학습'이다.
데이터를 한 곳에 모으는 것이 아니라 AI가 로컬에서 각 데이터를 직접 학습하는 형태이기 때문에, 데이터 유출 위험이 거의 없으면서도 민감정보 보호와 활용을 동시에 할 수 있다는 것이 사업단 측 설명이다.
AI가 학습할 로컬데이터를 공유한 기업·기관은 AI로부터 신약후보물질 개발 가능성을 평가할 수 있는 기회를 얻게 된다. AI 모델을 개선하기 위한 데이터 기여도는 후속 정부지원사업 등에 활용된다.
AI 모델 개발 분야에서도 학습할 수 있는 데이터 확보가 가능해져 더 빠르게 AI 신약개발 기술을 발전시킬 수 있다는 장점이 있다.
다만 연합학습이라는 특성 상 여러 기업·기관이 참여해야만 성과를 낼 수 있다는 전제조건과 데이터 공유를 기피하려는 기업 경향은 사업 추진에 가장 큰 부담이 될 수 있다.
이에 협회는 보건복지부, 과학기술정보통신부, 한국보건산업진흥원, 한국연구재단 등과 함께 K-MELLODDY 프로젝트를 추진하기 위한 사업단을 구성하고, 지난 3월 김화종 한국제약바이오협회 AI신약융합연구원장
<사진>을 사업단장에 앉혔다.
김화종 단장이 주축이 된 사업단은 지난달 개소식에 이어 복지부 설명회와 제1차 운영위원회를 가진 후 플랫폼 구축을 위한 작업에 착수했다. 이달 중에는 사업단 홈페이지 구축과 설명회, 의견수렴 회의 등을 거치고, 오는 7월부터 1차년도 과제를 시작할 예정이다.
이에 한국제약바이오협회 기자단은 김화종 단장을 만나 사업 취지와 목표, 향후 계획과 기대감 등에 대해 얘기를 나눠봤다. 김화종 단장은 사업 당위성과 성공에 자신감을 나타냈다.
Q. 이번 사업이 갖는 강점 핵심은.
신약후보물질 개발 가능성을 확인하려면 단계를 하나하나 넘어갈 수밖에 없는데, 각 단계별 데이터를 모두 학습할 수 있다면 동시에 확인하는 것이 가능하다. 그런 모델이 도출된다면 더 성공 확률이 높은 후보물질을 더 빠른 시간에 찾아내고 걸러내는 것이 가능하다. 데이터를 내놓지만 결국은 예측력이 높은 모델을 확보할 수 있다는 점에서 큰 수혜를 볼 수 있다.
Q. 프로젝트가 성공하기 위해선 제약사 참여가 필수인 듯 하다.
그렇다. 제약사로선 임상에 실패하면 그 데이터를 머신러닝에 사용하는 예가 거의 없는 것 같다. 빨리 다음 약을 찾아야 하기 때문이다. 반면 AI는 무조건 실패한 데이터가 많아야 한다. 성공한 임상이 아니라 실패한 임상 데이터를 찾는 것이 더 중요하다. 그래야만 가능성 없는 후보물질을 빠르게 걸러낼 수가 있고, 신약개발 효율을 높일 수 있다. '실패한 데이터를 어디다 써먹느냐'라는 생각을 바꿀 필요가 있다.
제약사들은 예전에 실패한 데이터를 보고 싶진 않더라도 어차피 다 갖고 있다. 그냥 창고에 쌓여 있는 데이터를 공유토록 하는 것이 이번 사업에서 가장 큰 관건이다.
Q. 이미 데이터를 많이 갖춘 제약사에게 참여할 동기가 있을까.
강제로 끌고 올 힘은 없다. 신약개발 사업을 유지하고 싶은 제약사라면 참여하진 않을 것이다. 다만 동기부여가 기대되는 것은, 이제는 AI를 쓰지 않고서는 진도를 나갈 수가 없다. 참여하면 AI 활용 기회가 생기지만, 그렇지 않으면 기회도 없는 것이 동기부여다.
신약개발하는 방식이 이전과 달라졌음을 인지해야 한다. 룰이 바뀌었다고 봐야한다. 방식이 달라진 것은 우리에게 일말의 가능성을 주고 있다. 그 상황에서 가장 해볼 만한 길을 찾는 것이 필요하다.
처음에 이것을 접하는 제약사들은 '이게 뭔가'라고 생각할 것이다. 하나의 새로운 시도이기 때문에 적극적으로 동참해서 같이 갈 수 있길 바란다.
Q. 데이터에 대한 무결성이나 신뢰성을 담보할 수 있나.
오류 등이 있는 데이터를 통틀어서 '노이즈'라 하는데, 노이즈 문제는 대책이 없다. 다만 결국 제약사 입장에서는 자신이 사용해야 할 데이터이기 때문에, 이를 고려한다면 노이즈를 억지로 넣을 가능성은 없고 가능한 무결한 데이터를 넣으려고 할 것이다.
설령 노이즈가 있다고 하더라도 참여기관이 많아지고 데이터가 누적될수록 노이즈는 다른 정상적인 데이터와 엮여 상쇄될 수 있다. 다양한 데이터로 학습한 모델일수록 더 안정적인 것은 당연한 이치다.
Q. 어느 정도 제약사가 모여야 무결성과 신뢰성이 확보될 수 있다고 보나.
많을수록 좋지만, 현재로서는 시범사업 격이기 때문에 20개 기업·기관만 뽑을 계획이다. 그 이상이 참여하려고 한다면 기준에 따라서 제외할 수밖에 없다. 여기서 성과를 얻고 괜찮다고 하면 그 때는 더 많은 투자가 이뤄져야 한다고 본다.
Q. 가급적 데이터를 더 많이 보유한 제약사가 참여하는 것이 사업에 유리한가.
당연하다. 연구를 많이 하고 있다기보다는 기존에 임상시험 데이터를 많이 갖고 있고 신약개발에 의지가 많은 제약사들이 필요하다. 그들도 더 참여하고 싶고 더 할 필요가 있을 것이라고 생각한다.
Q. 사전에 업계로부터 사업에 대한 피드백을 받아본 것이 있나.
사실은 사업안을 정부에 제출하기 전에 사전조사를 했는데, 당시에는 많은 기업들이 참여하고 싶다고 했다. 그때는 어떻게 보면 자세히 알고 있다기보다는 대충 들었을 때 빠질 이유가 없다고 생각해서 참여하겠다고 한 것 같다. 막상 참여해야 하는 상황이 오고 데이터를 AI가 학습하도록 내놓아야 한다는 것을 알게 되면 어떻게 할지는 두고 봐야 하겠지만 저는 긍정적으로 생각한다. 혼자보다는 둘이 낫고, 둘보다는 셋이 낫지 않나.
Q. 병원이 참여할 가능성은 충분하다고 보는가.
병원도 신약을 만드는 것은 아니지만 계속 임상 치료를 하기 위해선 약에 대해 잘 알아야 한다. 여러 임상 단계에서 각 환자마다 어떻게 적용해왔는지 파악되면 도움이 될 것이다. 임상 정보만으로도 충분히 관심있을 것이라고 본다. 또 임상약리학은 연구자적인 마인드가 상당하기 때문에 그런 측면에서 참여에 어려움은 없을 것이다.
병원은 임상시험 말고도 기존에 허가받은 약을 계속 환자에게 처방하고 있기 때문에 상당히 많은 정보를 갖고 있다. 병원과 제약사는 신약 부작용 등 여러 정보에 대해 서로 소통할 창구가 없는데, 연합학습 기반 모델이 마련되면 소통이 가능하다.
독자의견
작성자 비밀번호
0/200