AI

신약 개발 속도, AI로 크게 앞당길 수 있지만… 현실적인 걸림돌은?

강민혜


[디지털데일리 강민혜 기자] 인공지능(AI) 기반 협력으로 신약 개발을 앞당길 수 있다는 주장이 나왔다.

김화종 한국제약바이오협회 AI신약개발지원센터장은 26~27일 양일간 진행된 한국제약바이오협회 프레스 웨비나서 'AI 신약 개발, 어디까지 왔나' 세션 연사로 참석, 한국 제약 기업의 신약 개발에는 ▲정부 ▲경쟁사 ▲프로그램 업체 등 관계자들이 AI 기반 데이터 모델 프로그램 공유가 도움될 수 있다고 강조했다. 훌륭한 과학자에 의지하는 현재를 뛰어넘어 AI 모델을 통해 관계사들이 고품질 연구를 하는데 이바지할 수 있다는 설명이다.

◆ 제약 분야 혁신, AI 왜 필요한가

김 센터장은 과거의 기업 논리로 AI 기반 신약 개발에 접근하면 안 된다고 강조했다. 논리 체계 기반으로 결과값을 도출해내는 것이 아닌 데이터 누적에 따른 결과값 바로 도출 방식에 익숙해져야 한다는 설명이다.

그는 "예를 들어 남녀 구분 프로그램은 예전 방식으론 못 짠다. 딱 보면 맞추는 거다. 그건 논리가 아니라 많은 사진 보고 판단 능력 생긴 데이터 사이언스 일환이다. 컴퓨터도 그걸 한다"며 "제약 분야 개발 단계에도 적응하면 마찬가지"라고 설명했다.

인간이 단계별 검증을 통한 신약 개발에 익숙했던 과거와 달리 AI 프로그램 기반 도출값이 바로 나오는 것을 그대로 받아들여야 다음 단계로의 도약이 가능하다는 주장이다.

그는 "작년 한해 신약 개발 투자액이 2019년 대비 월등히 늘었다"며 "코로나19 영향 외의 것도 있다. 글로벌 제약사들이 AI 제약사와 파트너십 맺고 있다. 질병 메커니즘을 프로그램서 이해하거나 생물학 연구를 가속화하는 틀에서 계약하는 것이다. 스펙트럼을 넓히는 기업이 신약 개발도 잘할 것이다. 이런 배경을 잘 봐야 한다"고 설명했다.

◆ 디지털 생물학 시대 앞당긴다?

김 센터장은 제약 사업에 AI를 도입하면 디지털 생물학을 통해 정밀 의료 시대를 앞당길 수 있을 것이라 전망했다.

그는 "AI를 제약 산업에 도입하면 위험, 시간, 돈 줄여 안전성, 효율성 높인다"며 "또, 특허는 피하면서 효능은 비슷한 물질을 컴퓨터가 대신 찾아줄 수 있다. 각자 쌓인 데이터가 점점 많아진다. 개인 프로필, 생활습관, 라이프스타일 등 따라 분류도 된다. 앞으로 더 늘어날 것이다. 이제 시작이라 얼마나 발전할지 모른다"고 AI 활용성을 높이 평가했다.

그는 "정밀 의료시대가 올 것"이라며 "지금은 정밀의료가 어려운 것처럼 느껴지지만 머지않아 이뤄질 것이다. AI가 실제 신약 개발에 쓰인 사례도 있다. 지난해 4년 걸리던 것을 12개월만에 했다는 사례가 있다. 최근 이걸 8개월로 줄일 수 있다는 보고도 나왔다. AI 덕에 시간이 단축됐고 많은 데이터를 한 번에 볼 수 있어 이런 사례는 늘어날 것"이라고 말했다.

▲ 정답은 협력?


김 센터장은 AI 도입의 효과가 분명한데도 국내 제약 기업이 어려워하는 이유로 ▲전문가 부재 ▲업계 기밀화 ▲협력 부족을 들었다.

그는 "AI를 기업에 도입하는 것은 모든 기업이 어려워 한다"며 "정작 본인의 기업에 적용하려면 산이 많은 거다. 성공한 회사는 비밀로 하지 풀지 않는다. 기관, 기업이 태생적으로 받아들여야 하는 변화가 있는데 일하던 방식과 달라 받아들이지 못한다. 생물학과 AI를 다 아는 전문가가 거의 없어서, 사람이 없어 도입하지 못하는 문제가 있다"고 말했다.

김 센터장에 따르면, 이같은 문제를 데이터 공유로 해결하고자 유럽은 지난 2019년 멜로디(MELLODDY, Machine Learning Ledger Orchestration for Drug Discovery)를 꾸렸다. 대형 제약사들이 모여 학계와의 협력시 데이터를 공유하자고 약속한 것이다.

이 때 연합 학습(federated learning)도 사용했다. 연합 학습은 ▲임상 결과 ▲연구 데이터 등을 가지고 모델을 만든다. 한 기관이 자기가 갖고 있는 로컬 데이터만 가지고 질병 예측하거나 적절한 약 찾거나 치료법 찾으면 정확도 등이 떨어진다. 이 때 각사의 결과값을 합치면 정확도가 올라갈 수 있다는 설명이다.

다만 개인 정보는 공유할 수 없으므로 데이터 아닌 학습 능력만 공유하는 것이다. 판독 능력, 계수만 공유함으로써 데이터 보안 문제로부터도 자유롭다는 게 김 센터장의 설명이다. 일종의 모델 쉐어링인 셈이다.

김 센터장은 "데이터를 한 곳에 모아 공유하는 것은 지금은 아니더라도 언젠가는 노출 위험에 처할 수 있다"며 "그것이 아닌 각자의 딥러닝 모델링 방식을 공유하는 셈이다. 일종의 기준을 공유함으로써 각사의 정확도를 올릴 수 있다"고 설명했다.

그는 "유럽이 했는데 우리가 못할 이유가 없다"며 "AI 기반 신약 개발 데이터 공유가 어려운 점은 데이터 공유가 불가능하다는 점이다. 책임, 개인 정보, 양질의 데이터인지의 여부 등도 문제다. 모든 기관이 실력좋은 데이터 사이언티스트를 구할 수 도 없다. 이는 결국 연합 학습 플랫폼을 함께 만들어가면서 해결할 수 있을 것"이라고 제안했다.

<강민혜 기자> mineral@ddaily.co.kr

강민혜
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널