“4차 산업혁명의 키워드는 IT 기술과 전문성(expertise)의 ‘융합’이다. 신약개발에서의 전문성은 신약개발과 관련된 데이터를 해석하는 것이다. 약과 관련된 깊은 전문지식을 가진 인력들의 데이터 해석이 있어야지만, 인공지능을 활용한 신약개발도 가능하다” / 배영우 한국제약바이오협회 전문위원은 20일 코엑스에서 열린 대한약학회 춘계학술대회에서 ‘인공지능을 활용한 신약후보물질 개발’ 발표가 끝난 후, 플로우에서 받은 질문에 대한 답이다. 질문 내용은 인공지능의 신약개발 지능화를 돕기 위해서 약학 연구자의 역할에 관한 것이었다. / 메디포뉴스는 배 위원의 발표내용을 토대로, 약학 연구자들이 알아두면 좋을▲인공지능이 신약개발에 활용되는 단계 및 과정 ▲인공지능 신약개발에 활용 사례를 전한다. [편집자주]
◆신약개발 단계 중 target-to-hit, Hit-to-target, lead optimization 적용
Nature가 2010년에 출판한 리뷰 논문 ‘how to improve R&D productivity the pharmaceutical industry's grand challenge’에 따르면, 신약개발에 앞 단에 해당하는 ▲target-to-hit ▲Hit-to-target ▲lead optimization에만 사용되는 연구개발 비용이 전체 신약개발에 1/3에 해당한다. 이 앞 단의 비용만 줄여도 신약개발의 비용과 시간을 효율적으로 관리할 수 있다. 이를 위해 활용될 수 있는 도구가 인간의 편향을 최대한 줄일 수 있는 ‘인공지능’이다.
그렇다면 신약개발 초기 단계에 인공지능을 어떻게 적용할까? 배 위원의 IBM 신약 탐색 모델에 관한 설명에 따르면, 인공지능 신약개발 탐색 모델은 새로운 연구 가설 → 연구 가설 조사 → 조직화 및 협업 체계 → 연구 결과 표준화를 통한 학습 →적합한 데이터 탐색 등의 선순환 구조를 이룬다.
인공지능은 연구 가설을 세우기 위해 적합한 개념과 주요 상관성을 탐색해 연구자에게 신약 개발 성공 확률을 제공해 줄 수 있다. 이때 인공지능은 질병, 화합물, 표적, 단백질 등의 데이터를 학습해 상관성을 탐색한 후, 인간에게 적합한 신약관련 정보를 제공할 수 있다. 이어 연구 가설 조사 조사 단계에서 인공지능은 자신이 학습한 데이터를 바탕으로 근거를 제시해 연구 가설에 대한 객관적 조사를 탐색해 연구자에게 정보를 제공해 줄 수 있다.
또한 인공지능은 연구의 조직화 및 협업 체계에서 각 연구에서 탐색한 결과를 조직화 하는 과정을 도울 수 있고, 각 연구원들이 활용할 수 있는 데이터 셋을 제공할 수 있다. 이 과정에서 인공지능은 연구자들이 연구한 결과를 바탕으로 표준화 과정을 대신할 수도 있다. 나아가 최신 과학근거를 활용해 임상시험을 위한 기준을 제시해 줄 수도 있다. 최종적으로 인공지능은 모든 연구된 모든 자료를 학습해, 자신이 학습한 모든 데이터를 매번 연구자에게 제공해 줄 수 있다.
◆인공지능의 핵심은 자연어 이해를 통한 데이터 통합
인공지능의 자연어 이해 과정을 이용해 다양한 도메인의 통찰력을 얻을 수 있다. 신약 연구를 위한 자료는 Gene, chemical compounds, drugs, FDA Orange Book, Animal models, Plant Biology, Cells, Patients, Disease, Patents 등 다양하다.
한 분야에 관한 전문가가 되기도 굉장히 많은 시간이 걸리는데, 한 사람이 이 분야에 대한 전문지식을 쌓기란 현실적으로 불가능하다. 이러한 어려움을 극복해 줄 수 있는 도구가 인공지능이다. 이러한 데이터를 인공지능에 학습시켜 도출된 데이터를 최종 사용자인 연구자가 활용해 신약 개발 연구에 이용해 볼 수 있다.
그렇다면 자연어 이해 과정은 어떻게 이뤄지는 것일까? 왓슨의 인공지능이 주목 받은 것은 2011년 제퍼디 퀴즈쇼에서 퀴즈에 최적화된 인공지능이 인간을 누르고 우승한 사건이었다. 이 인공지능의 특화된 기능은 ‘자연어 이해’다.
인공지능의 자연어 이해 기능을 살펴보기 위해선, 검색엔진과 인공지능 각각에 질문하는 상황을 가정해 보자. 우리는 특정 정보를 찾기 위해 구글, 네이버 등 검색엔진을 사용할 수 있다. 이때 우리가 검색창에 질문내용을 입력하면, 검색엔진은 ‘키워드’를 바탕으로 우리 질문에 해당하는 문서를 찾아준다. 나열되는 순서는 인기도를 기준으로 한다. 우리는 검색엔진을 통해 제시된 여러 문서들을 일일이 들어가 원하는 정보가 맞는지 검색 문서를 직접 읽고 가장 적합한 문서를 통해 답변을 도출한다.
반면 인공지능은 이와 다르다. 우리가 인공지능을 통해 질문을 하면 마치 사람에게 질문하듯 우리의 말(자연어)로 질문하면 된다. 인공지능은 이 질문을 이해하고, 이 질문에 대한 ▲가능성 있는 대답 추론 ▲근거 분석 ▲신뢰도 계산을 전달한다.
◆인공지능 신약 개발 연구에 이용할 수 있는 분야 – ontology 확립, 논문 정보 제공 등
신약개발 연구에 인공지능을 활용할 수 있는 영역으로는 ▲ontology 확립 ▲논문 정보를 통한 연구 정보 제공이 있다.
한 가지 chemical에 대한 시판되는 약물은 매우 다양하다. 인공지능을 활용하면 같은 chemical인 다양한 브랜드의 약물을 하나로 묶어주는 ontology를 확립할 수 있다. 인공지능을 활용하기 이전에는 사람들이 일일이 관련 정보를 입력하는 과정을 거쳤다. 비단, 화합물 구조뿐만 아니라, 하나의 약물에 대한 다양한 부작용도 묶어주는 과정도 인공지능을 통해 가능하다.
인공지능이 논문 정보를 통합해 연구자에게 적합한 정보를 제공해 줄 수도 있다. 예를 들어, 자연어를 인지할 수 있는 인공지능은 “어떤 유전자 대장암을 악화시키는가?”라는 질문을 연구자로부터 받을 수 있다. 이때 인공지능은 자신이 학습한 논문 데이터를 바탕으로 탐색, 근거추론, scoring 과정을 거쳐 연구자가 원하는 답을 제시할 수 있다. 이러한 과정이 구현된 것이 Watson for discovery다.