"신약개발에서 AI 활용법, 정답 없어…다양한 시도 필요"

동국대학교 식품·의료제품규제정책학과 제약바이오산업학과, 5차 단기교육과정 진행
이민호 동국대학교 교수, 신약개발 시 AI 활용한 다양한 테스트 필요성 언급

조해진 기자 (jhj@medipana.com)2024-05-23 12:48

[메디파나뉴스 = 조해진 기자] 인공지능(AI)을 활용해 신약을 개발하는 것은 필수적인 트렌드로 자리했다. 그러나 각 단계에서 AI를 어떻게 활용해야 정답을 도출할 수 있는지에 대한 방법은 정해져 있기 않기 때문에 다양한 시도가 필요하다.

23일 서울시 중구 코리아나호텔에서 '의약품 개발과정에서 AI 활용과 기회, 그리고 도전'을 주제로 동국대학교 식품·의료제품규제정책학과 제약바이오산업학과 5차 단기교육과정이 진행됐다.

이날 '초기 신약 개발단계에서의 딥러닝 등의 AI 활용'에 대한 강연을 맡은 이민호 동국대학교 교수<사진>는 "신약개발 단계에서 AI를 활용하는 방법, 테스트는 굉장히 다양하다. 이 중에 개발을 할 때 가장 좋은 방법 하나만을 택할 수 없다. 테스트 바이 테스트일 뿐"이라고 말했다. 

이 교수의 강연에 따르면, AI 활용은 크게 비지도학습(강화학습)과 지도학습 크게 두 가지 방식이 존재한다. 

신약개발에서 비지도학습 방식을 사용하는 대표적 방법으로는 클러스터링(Clustering)이 있다. 이 방식은 데이터를 스스로 이해하고 분석해 연결고리를 찾아내 유사한 특성을 가진 데이터들을 그룹화하는 것으로 클러스터링을 통해 얻은 범주에서 신약개발 관련 테스트를 진행할 수 있다.

지도학습 방식은 데이터를 학습시키고, 분류를 기반으로 예측을 가능하게 한다. 이 방식 또한 다양한 방법이 존재하지만, 많은 데이터를 학습시키는 것은 필연적으로 오버피팅(Overfitting)이 발생하게 된다. 너무 학습에 집착한 나머지 불필요한 노이즈가 과도하게 반영돼 오히려 원하는 결과를 도출하는 것이 어려워진다. 

이에 오버피팅 문제점을 해결하고, 새롭게 제시하는 과제들을 잘해결할 수 있는지가 지도학습 방식을 통한 신약개발에서의 화두다. 
 
AI를 활용하기 위해서는 우선 데이터를 컴퓨터의 언어로 수치화 하는 것이 필수적이다. 보통은 케미컬 핑거프린트 방법을 많이 사용한다. 분자, 항체 등의 구성을 0과 1로 바꿔 비트를 채우는 데, 이 방법이 매우 다양하다.

이 방법을 무엇으로 쓰느냐에 따라서 신약개발에서의 AI 사용 형태가 굉장히 많이 바뀌기도 한다. 유사성(Similality)을 찾아내는 방식으로 비교, 예측하거나, 혹은 필터링을 하는 디스크립터(Descriptor) 방식으로 진행하는 경우가 많다. 

딥러닝이 한때 이목을 끌었지만, 이는 엄청나게 많은 데이터와 샘플이 필요하기 때문에 학습 가능한 수많은 임상샘플을 구하기 어렵다면 딥러닝은 적합하지 않을 수 있다.

이 밖에도 타겟 질환, 분자, 단백질마다 AI 활용 방법을 다양하게 적용할 수 있다. 이와 관련해 수십년 동안 논쟁이 이어졌지만 '베스트는 없다'는 것이 현재의 결론이다. 샘플의 수, 피처의 기능 등을 보고 신약개발을 위한 알고리즘을 고려해 전략을 세워야 한다는 것이다. 

이 교수는 "각 방법마다 장단점이 존재하기 때문에, 한 가지 방법으로 단정지어 테스트하지 말고, 여러가지 방법을 테스트 해보고 확인해야 한다"면서 "AI 활용은 정답이 없기 때문에 다양한 테스트를 시도할 수록 좋다"고 강조했다. 

이런 기사
어때요?

실시간
빠른뉴스

당신이
읽은분야
주요기사

독자의견

작성자 비밀번호

0/200

메디파나 클릭 기사

독자들이 남긴 뉴스 댓글

포토