2024.11.23 (토)

  • 구름많음동두천 20.9℃
  • 구름조금강릉 22.7℃
  • 흐림서울 21.7℃
  • 맑음대전 24.6℃
  • 맑음대구 25.7℃
  • 구름조금울산 23.8℃
  • 맑음광주 23.4℃
  • 구름조금부산 25.1℃
  • 맑음고창 23.7℃
  • 구름많음제주 23.0℃
  • 구름많음강화 21.1℃
  • 구름조금보은 22.0℃
  • 맑음금산 23.5℃
  • 구름조금강진군 24.4℃
  • 구름조금경주시 25.0℃
  • 구름조금거제 24.9℃
기상청 제공

제약/바이오

인공지능 신약개발 플랫폼 구축의 어려움은?

플랫폼 구축 비용과시간, 제약사 혼자만 감당할 수 없어

“신약개발의 새로운 패러다임, 인공지능 측면에서 ▲인공지능 신약개발 플랫폼 구축에 소요되는 시간과 비용 ▲인공지능 신약개발 플랫폼 회사가 요구하는 비용 ▲인공지능 신약개발 플랫폼을 개발할 수 있는 인력 측면에서 인공지능을 이용해 discovery 단계에 적용하는 어려운 점이 있다”/우리나라에서 인공지능 플랫폼을 활용해 신약 후보물질 발굴에 선도적인 역할을 했던 크리스탈지노믹스 홍용래 상무가 7일 열린 패널토론 ‘AI기반 신약개발을 위해 우리는 무엇을 해야할까?’에서 한 발언이다./메디포뉴스는 패널토론회에서 언급된 인공지능 기반 신약개발의 현 상황을 전한다.[편집자주]



◆AI기반 신약개발을 할 수 있는 인력과 비용을 확보하는 어려움 
AI기반 신약개발 플랫폼을 구축하거나 기존의 AI 신약개발 플랫폼 회사에 지불해야 하는 비용이 상당하다는 지적이 이날 패널토론에서 나왔다. 

이와 관련해 홍 상무는 “인공지능 신약개발을 하는 외국 바이오 벤처기업은 신약후보물질을 발굴해 주는 대가로 제시하는 금액은 상당히 높은 금액이다. 현실적으로 우리나라 제약사에서 후보물질 발굴에만 높은 금액을 감당할 수 있는 곳은 많지 않다”고 지적했다. 대웅제약에서 인공지능 신약개발과 관련된 일을 총괄하고 있는 김재영 박사 역시 인력 확보의 어려움을 언급했다. 김 박사는 “우리가 직접 IT 분야에 속하는 인공지능 플랫폼을 구축하려다 보니 많은 시간과 인력이 소요된다. 대웅제약조차도 감당할 수 없을 정도의 IT 인프라 구축이 필요하다. 때문에 우리 역시 인공지능 신약개발과 관련된 자원을 가진 IT회사에 투자를 제안하기도 한다”고 말했다. 

그러나 김 박사는 AI기반 신약개발 초기부터 IT회사의 투자가 필요한 것은 아니라고 강조했다. 이에 대해 김 박사는 “각 제약사가 가지고 있는 small data라 할지라도 정확성이 높은 데이터라면 작은 시스템(인프라) 내에서도 시작해 좋은 결과를 얻을 수 있다”며 인공지능 인프라의 규모보다 양질의 데이터의 중요성을 강조했다. 머신러닝 전문가 대부분이 강조하는 “좋은 데이터는 어떤 알고리즘으로 돌려도 좋은 결과를 내 놓는다”라는 되새겨 볼 만하다. 

◆플랫폼에 대한 데이터 validation(타당성 검증)은 어떻게?
김 박사는 “AI기반 신약개발 플랫폼에 대한 validation(타당성 검증; 데이터가 부정확, 불완전, 불합리한지 확인하기 위해 사용되는 처리를 뜻한다)을 위해 ▲public data를 이용한 인공지능 학습 뒤 우리가 가진 증명 데이터를 기반으로 한 것 ▲데이터 정제(cleaning)과정을 거쳐 정확한 데이터 취합을 통한 데이터 질 향상 과정을 거친다”고 말했다. 

이와 관련해 김 박사는 “데이터 기반 validation을 확보하기 위해 학회 등에서 잘 정리된 데이터를 이용하고 있다. 이에 비해 정확성이 비교적 떨어지는 public data를 이용해 인공지능에 학습시킨 뒤 우리가 가진 증명 데이터를 기반으로 테스트 과정을 거친다. 방대한 양의 데이터 중에 데이터를 정제(clean) 과정을 거쳐 우리가 활용 가능한 데이터로 만드는 것이 중요하다”고 설명했다. 즉, 정확한 데이터와 부정확한 데이터 중 정확한 데이터만 취합해 데이터의 질을 높이는 것이 중요성을 강조한 것. 

이와 관련해 김 박사는 최근 딥러닝 기법 중 데이터의 질을 판별하는 알고리즘도 개발되고 있다고 전했다. 김 박사는 “데이터의 질을 판별하는 딥러닝 기법의 개념은 딥러닝 학습을 통해 일종의 garbage와 bias가 들어간 데이터를 분별한다는 것이다. 이 부분을 활용해 데이터의 validation 강화하는 방향으로 나아갈 수 있다”고 말했다. 

◆데이터 공유와 관련된 논의 시작해야 할 것 
김태순 신테카바이오 대표는 임상 데이터와 관련된 공유문제를 제기했다. 

이에 대해 김 대표는 “임상데이터가 신약개발과 관련해 중요하다. 같은 유전자 데이터라도 임상적 수준의 데이터가 (신약개발에 있어) 의미있는 것이다. 표준화 된 임상 데이터를 잘 모으는 것이 매우 중요하다”고 말했다. 이어 김 대표는 “미국과 유럽에서는 파킨슨병과 관련된 임상데이터를 대학병원에서 표준화해 공개하고 있다. 우리나라의 경우는 기업이 대학병원과 협업해 임상데이터 관련 표준화 작업을 한다 할지라도 대학병원에 관련 데이터를 모두 두고 나와야 하는 입장이다. 이와 관련한 논의를 이제는 시작해야 한다”고 주장했다. 

한편, 과학기술정보통신부는 화학연구소를 중심으로 하는 후보물질 발굴을 목적으로 인공지능과 빅데이터를 결합한 신약개발 플랫폼을 구축 사업을 준비 중이다. 이와 관련해 박장환 한국연구재단 박사는 “이번 지원사업 연구자로 선정되는 주체가 훌륭한 플랫폼의 형태를 제시해 줄 것이다. 정부의 이번 사업이 촉진제가 돼 이와 관련된 연구가 활성화 되길 바란다”고 말했다. 

양성일 보건복지부 보건산업정책 국장은 복지부 역시 이와 관련된 사업의 수요조사를 진행 중이라고 밝혔다. 양 국장은 “복지부에서도 인공지능기반 신약개발의 취지를 공감하고 있다. 아직 확정된 안은 없지만 올해 중기에 예산을 반영할 수 있도록 인공지능 신약개발 수요조사를 진행하고 있다. 과기정통부와 내용이 겹치지 않도록 복지부는 신약개발의 전임상단계부터 AI가 필요로 하는 연구자와 기업의 수요를 명확히 파악해 사업을 진행해 나가겠다”고 말했다. 

관련기사