2024.11.22 (금)

  • 구름많음동두천 20.9℃
  • 구름조금강릉 22.7℃
  • 흐림서울 21.7℃
  • 맑음대전 24.6℃
  • 맑음대구 25.7℃
  • 구름조금울산 23.8℃
  • 맑음광주 23.4℃
  • 구름조금부산 25.1℃
  • 맑음고창 23.7℃
  • 구름많음제주 23.0℃
  • 구름많음강화 21.1℃
  • 구름조금보은 22.0℃
  • 맑음금산 23.5℃
  • 구름조금강진군 24.4℃
  • 구름조금경주시 25.0℃
  • 구름조금거제 24.9℃
기상청 제공

기획

인공지능 활용한 신약개발 어디까지 와있나?

바이오 데이터 축적이 우선…정부 이점 간과해선 안돼

보건복지부는 20일 경제관계장관회의에서 2018년부터 2022년까지 추진할 ‘제2차 제약산업 육성∙지원 5개년 종합계획’을 발표했고, 앞서 18일 한국제약바이오협회는 2018년도 5대 중점과제를 발표했다. 두 안에 공통적으로 등장한 단어가 있다. ‘인공지능(Artificial Intelligence;AI)’을 활용해 신약을 개발하겠다는 것이다.  / 이에 메디포뉴스는 현재 AI를 활용한 신약개발이 어디까지 왔는지 살펴보고자 한다. 생명공학정책연구센터에서 발간하는 'BionINpro' 11월호에 실린 ‘빅데이터 및 인공지능을 활용한 신약개발 연구 동향’과 생물학연구정보센터(BRIC)에 실린 BRIC View 동향리포트 ‘임상시험 효율화를 위한 인공지능 기술의 적용’을 토대로 국∙내외에서 인공지능을 활용한 신약개발이 어디까지 왔는지 소개한다. [편집자 주]

◆ 빅데이터-인공지능 기술을 기반으로 FDA로부터 승인된 신약 아직 없다 
인공지능과 빅데이터를 활용해 신약을 개발하려는 움직임은 세계적인 추세다. 2016년과 2017년 사이 화이자와 IMB 왓슨, 사노피와 Genzyme-Recursion 등 다국적 제약사와 AI신약 벤처기업 사이에 빅데이터와 인공지능을 활용한 공동연구가 활발히 수행됐다. 

이들 기업이 인공지능과 바이오 빅데이터를 활용해 신약을 개발할 수 있는 부분으로는 ▲신규 타켓 발굴 ▲약물 가상 탐색 ▲신약 재창출(Drug Repositioning) ▲독성 및 부작용 예측 ▲약물 기전(drug mod-of-action) 탐색 ▲정밀의료를 위한 환자 세분화(patient stratification) 등이 있다.


그렇다면 인공지능과 빅데이터를 활용한 신약개발을 어디까지 왔을까? ‘빅데이터 및 인공지능을 활용한 신약개발 연구 동향’을 쓴 김완규 이화시스템생물학연구소 교수는 “빅데이터와 인공지능 기술을 기반으로 FDA에 승인된 신약은 아직 없다”고 전했다. 이어 “빅데이터-AI’에 대한 막연한 기대나 과장된 거품을 경계해야 한다”고 지적한다. 특히 인공지능 활용해 신약을 개발하려면 무엇보다 신약개발과 관련된 바이오 빅데이터 구축이 선행돼야 한다. 하지만 김 교수는 “신약개발 관련 바이오 빅데이터 축적은 소셜네트워크 등 다른 영역에 비해 느린 편이다”며 “제약사 입장에서는 생리활성 및 약물 스크리닝 데이터를 공유할 동기가 거의 없고, 인력과 비용을 들이면서까지 데이터를 수집해 표준화하고, 관리할 필요성을 현재로선 가지긴 힘들다”고 설명했다.

◆인공지능 활용한 임상시험 어떻게 이뤄지나?
동향 리포트‘임상시험 효율화를 위한 인공지능 기술의 적용’에서 정유채 서울대학교 융합과학기술대학원 연구원은 임상시험 절차에서 인공지능 기술 적용이 가능한 분야를 크게 5가지로 분류했다. 동향 리포트에 따르면 ▲신약개발 가속화 ▲임상시험 대상자 모집 ▲약물복용 여부 ▲데이터 수집과 분석 ▲환자의 정보보호 부분에서 기존방식대신 AI를 적용해 보다 신속하게 임상절차를 진행할 수 있다. 구체적인 내용은 아래 표를 통해 확인할 수 있다. 

실제로, 임상시험 AI기술을 활용하는 기업들도 있다. ‘Trial Prospector’는 진단정보 등을 분석해 종양 관련 임상시험에서 자동 매칭해주는 웹 기반 시스템을 만들었다. 이 시스템을 통해 임상시험 등재 기준을 판단할 수 있고, 관련 데이터들을 지속해서 관리한다. ‘Deep Patient’는 EHR(Electronic Health Record; 전자의무기록) 데이터로 비지도 학습 기법을 이용해 약 7만 여명의 환자의 임상현상을 관찰한 뒤 검증했다. 특히, Deep Patient에서 예측한 당뇨병, 정신분열증, 암 환자에 대한 임상이 일반 임상결과보다 더 정확하게 나타났으며, 이를 통해 머신러닝과 결합된 임상의사결정지원 시스템을 제공하고 있다.     

◆신약개발에 인공지능을 활용하는 것은 바이오 빅데이터 기반 가상탐색?
앞서 지적했듯 아직 바이오 빅데이터가 충분히 쌓여 있진 않지만, 현재 바이오 관련 데이터가 늘고 있다. 김 교수는 “신약개발에 직접 활용할 수 있는 대규모 유전체 데이터, 약물-타켓 정보, 화학유전체 데이터, 약물 스크리닝 데이터 등도 빠르게 축적되고 있다”고 언급한다. 이어 현재상황에서 ‘바이오 빅데이터에 기반 가상탐색’이 인공지능을 활용한 현실적인 방안이 될 수 있다고 김 교수는 주장한다. 

김 교수가 언급한 데이터 기반 가상탐색(Data-driven Virtual Screening; DDVS)은 우리가 선별해 내고자 하는 약물 구조 정보 외에도 다양한 바이오 빅데이터를 기반으로 기계학습, 인공지능 알고리즘을 통해 우리가 찾아내고자 하는 약물을 선별해 내는 것이다. 이처럼 DDVS가 최근 주목받고 있는 배경으로는 △기계학습의 재료가 되는 화합물의 활성 데이터가 일정 규모 이상 축적 △클라우드, GPU 등 고성능 컴퓨팅 인프라에 대한 접근 용이 △심층신경망(Deep Neural Network; DNN) 기술이 발전하면서 복잡한 문제 해결 성능의 증가 등을 꼽을 수 있다. 

하지만 DDVS는 아직 완성된 모델은 아니다. 김 교수의 설명에 따르면, DDVS 역시 대부분의 바이오 빅데이터와 마찬가지로 충분하지 못한 학습 데이터양과 부정확성의 문제는 있다. 

◆DDVS 활용방식1- fingerprint기반으로 한 심층신경망 학습시키는 방식 
Fingerprint란 화합물 구조의 특징을 이진법화한 벡터다. 약물 구조에 자주 나타나는 하부구조 세트를 정해놓고, 각 하부구조의 존재여부를 1과 0의 코드를 부여하면, 모든 화합물은 이진법 벡터, 즉 fingerprint로 표현될 수 있다. 이러한 fingerprint를 딥러닝 방식을 활용하면 화합물 간의 구조적 유사성을 ‘빠르고 효율적’으로 수행할 수 있다. 

약물 가상탐색에서 딥러닝을 최초로 도입한 것은 2015년 AI 신약벤처 Atomwise에서 개발한 AtoNet이다. Atomwise는 머크 등 다국적 제약사와 공동연구 프로젝트를 수행하고 있으며, 이 외에도 Kadurin는 심층신경망을 이용해 fingerprint 기반으로 항암 효과를 나타내는 화합물을 예측했다. 

◆DDVS활용방식2- 이미 축적된 약물 빅데이터를 통해 새로운 약물 마이닝 
PubChem Bioassay에는 올해 11월 기준 bioassay 125만 건과 화합물 활성 데이터가 약 2억 3천 만 건 이상 축적돼 있다. 이 같은 규모는 유전체 및 오믹스 데이터를 제외하면 가장 큰 규모의 바이오 빅데이터라고 김 교수는 설명한다. 김 교수의 설명에 따르면, PubChem의 데이터가 향후 인공지능을 활용한 데이터로서 가치가 큰 이유로 모든 화합물의 ‘raw data’를 가지고 있기 때문이다. 즉, 각 화합물의 positive 데이터와 negative 데이터를 모두 가지고 있어 인공지능을 활용해 화합물 간의 네트워크를 구성하고, 약물을 가상으로 탐색하는 데 용이하다는 것이다. 

이와 같이 이미 축적돼 있는 바이오 빅데이터를 활용해 새로운 약물을 찾아내는 ‘HEA(Hit Enriched Assay)’ 방식이 있다. HEA란 특정 약물 A라는 물질의 리간드(결합하는 물질)세트와 hit 화합물 간에 유의하게 겹쳐 관찰되는 assay(분석)을 의미한다. HEA를 이용해 약물 A와 결합부위와 유사한 여러 물질을 찾아낼 수 있다. 김 교수는 “이는 대규모 약물 스크리닝 데이터를 발굴해 효과적으로 약물 가상탐색법으로 활용할 수 있음을 의미한다”고 설명한다. 


인공지능보다 선행돼야 할 것은 데이터 축적이다. 축적된 데이터가 있어야지만 인공지능이 학습을 통해 신약을 찾아내든, 보다 효율적인 임상시험을 진행할 수 있다. 정부의 ‘인공지능을 활용한 신약 R&D’ 정책도, 한국제약바이오협회의 AI 신약개발지원센터도 이 점을 간과해서는 안 된다는 게 전문가들의 조언이다.  



관련기사