[메디파나뉴스 = 이정수 기자] 국내에서 AI 신약개발을 위한 연합학습 체계 구축이 추진되고 있지만, 핵심이라 할 수 있는 '기여도 수치화' 방법론 확립까지는 일정 시일이 요구될 전망이다.
표준희 AI신약융합연구원 부원장은 6일 열린 '한국제약바이오협회 2024 프레스 세미나'에 연자로 나와 'AI 신약개발에서의 연합학습 적용' 발표를 통해 'K-MELLODDY 사업' 고려사항 등을 제시했다. AI신약융합연구원은 한국제약바이오협회 산하 기구다.
표준희 부원장은 이날 발표에서 "만약에 연합학습을 통해 좋은 모델이 나오고 좋은 솔루션이 나왔을 때, 또는 상업화되거나 특허권이 생겨났을 때, 그로 인한 이익을 서로 어떻게 나눌 것인가는 사업 추진 과정에서 고려해야 될 사항"이라고 말했다.
이어 "모델을 업데이트하는 데 각 기관마다 얼마나 많은 기여를 했는지, 각 데이터가 모델 성능 개선에 얼마나 기여했는지를 수치화하고, 그에 따라 적절한 리워드를 줄 수 있도록 하는 것에 대한 많은 고민이 있다. 그 부분이 잘 해결돼야 많은 기업이 참여토록 유도할 수 있다"고 설명했다.
다만 기여도 수치화와 관련된 과제를 해결하기 까지는 시간이 필요할 것으로 진단된다.
표준희 부원장은 질의응답에서 "K-MELLODDY 사업이 초기 과정에 있고, 과제가 시작한지 얼마 되지 않아 진척도가 높지 않다. 현재로선 금액적인 인센티브를 어떻게 나눌지 계산하는 방법을 수립하는 것이 목표"라며 "파일럿 테스트 등을 통해서 시뮬레이션을 해보고, 조금 더 프로젝트가 진행되면서 모델 트레이닝 단계를 거치고 나면 방법론을 조금 더 구체화해서 말씀드릴 수 있을 것 같다"고 답했다.
또 "인센티브 시스템에 대해서는 굉장히 많은 분들이 관심을 갖고 있고, 이익을 어떻게 분배할 것인가에 대한 부분은 굉장히 큰 토픽이다. 앞으로 그런 부분을 탐색해나가는 것이 중요한 과제다. 아직은 조금 더 시간이 걸릴 것 같고, 나중에 더 공유를 드릴 수 있도록 하겠다"고 덧붙였다.
K-MELLODDY 사업은 '연합학습(Federated Learning) 기반 신약개발 가속화 프로젝트'를 의미한다. 해당 프로젝트는 제약사 또는 의료기관 등이 신약후보물질 개발 가능성을 제대로 평가할 수 있도록 도와, 신약개발에 소요되는 비용과 시간을 절감할 수 있도록 하기 위해 고안됐다.
사업에 참여하는 여러 기관과 기업 등이 각각 보유하고 있는 로컬 데이터를 직접 AI(인공지능)가 학습하면서 평가 정확성을 높이게 된다. AI가 이같이 각각에 흩어져있는 데이터를 학습하는 과정을 '연합학습'으로 부른다.
이를 통해 기업·기관은 AI로부터 신약후보물질 개발 가능성을 평가할 수 있는 기회를 얻게 되고, AI 모델은 학습할 수 있는 데이터 확보가 가능해져 더 빠르게 발전할 수 있다.
다만 이 사업이 성공을 거두기 위해서는 연합학습이라는 특성상 많은 기업·기관 참여가 전제돼야 한다. 그러나 기업 입장에서는 사업 기밀이라 할 수 있는 연구 데이터를 공유해야 하는 것에 대한 부담이 불가피하다.
이는 지난 6월 열린 사업설명회에서도 여실히 드러나기도 했다. 이같은 점은 분명한 기여도 수치화 정립을 통해 기업 참여를 유도·독려해야 하는 이유가 된다.
이날 표준희 부원장은 기여도 수치화 이외에 데이터 이형성 조정·관리, 이상 데이터 선별, 기술적 인센티브 확립 등 다른 고려사항도 언급했다. 이 역시 사업 참여를 고민 중인 기업들이 의문으로 갖는 요소다.
표준희 부원장은 "여러 기관에서 공유한 데이터 간에는 속성, 특성 등에 차이가 있을 수밖에 없는데 이를 어떻게 핸들링할지, 혹시라도 잘못된 데이터가 유입됐을 경우 어떻게 영향을 최소화할 것인지, 금전적인 것 외에 기술 접근이나 네트워크 확대 기회를 제공하는 인센티브를 어떻게 마련할지 등도 고려사항에 포함된다"고 밝혔다.
독자의견
작성자 비밀번호
0/200