고대안암병원 주형준 교수, 인공지능 한국어 의료 자연어 처리 기술 개발

2022-12-26 14:17:47

자체 개발한 BERT기반 의료특화 언어모델 적용… 몇 문장만 입력하면 정확한 진료과 추천
AI 기반 맞춤형 의료서비스의 핵심 기술 기대

고려대학교 안암병원 순환기내과 주형준 교수팀(순환기내과 주형준 교수, 김종호 교수, 언어학과 송상헌 교수, 한양대학교 김영민 교수, 가톨릭대학교 김유중 교수)이 인공지능으로 한국어 의료 자연어 처리기술을 개발했다. 이번에 개발된 기술은 몇 문장만 입력하면 적절한 진료과를 추천해주는 인공지능 기반의 기술이다.

연구팀은 올해 초 26,986개의 의학용어를 정리하고, 한국어 일반 자연어처리 모델인 KR-BERT를 기반으로 의학관련 지식(논문 및 기사 등) 통해 약 6백만 개의 문장과 약 1억 1천 6백만개의 단어를 학습시켜서 의료분야에 특화된 자연어처리 모델인 KM(Korean Medical)-BERT를 개발했다.

KM-BERT는 기존 일반 자연어처리 모델인 M-BERT, KR-BERT에 비해 의료분야 한국어 자연어처리 성능에 있어서 월등한 성능을 보여 국제학술지에 소개되면서 국제적인 주목을 받은 바 있다. 

이번 연구는 KM-BERT에 대한 후속 연구로서 실제 의료 및 헬스케어에 활용해봄직한 실질적인 업무에 KM-BERT를 적용했다. 질문자가 몇 문장을 입력하면, 인공지능이 질문자의 문장에서 핵심단어를 찾고 가장 적합한 진료과 3곳을 추천한다. 예를 들어, “중앙 갈비뼈 통증 숨 들이마쉴때랑 기침할 때 여기가 너무 아파요ㅠ 왜그런거죠..?”라고 입력하면, 인공지능이 학습한 내용을 기반으로 33.9%의 예측확률로 호흡기내과, 31.6%로 흉부외과, 9.8%로 가정의학과를 추천한다.


주형준 교수는 “양질의 데이터셋을 통해 완성도 높은 언어모델을 구축할 수 있었다”며, “이번 언어모델 개발과 고도화는 KM-BERT를 활용해 실제로 적용가능한 의료서비스 개발이 가능하다는 것을 보여줬다는 점에서 의미가 있으며, 앞으로 의료 및 헬스케어 분야에 여러 가지로 활용 가능할 것으로 기대한다”며 의료특화 한국어 자연어 모델 개발의 중요성을 강조했다.

한편, 이번 연구 ‘Predicting medical specialty from text based on a domain-specific pre-trained BERT’는 국제저명학술지 ‘International Journal of Medical Informatics’ 최신호에 게재됐으며, 연구팀은 관련 특허를 확보하는 등 연구개발과 실용화에 박차를 가하고 있다.


이형규 기자 kyu7179@medifonews.com
< 저작권자 © Medifonews , 무단전재 및 재배포금지 >
- 본 기사내용의 모든 저작권은 메디포뉴스에 있습니다.

메디포뉴스 서울시 강남구 논현로 416 운기빌딩6층 (우편번호 :06224) 정기간행물 등록번호: 서울아 00131, 발행연월일:2004.12.1, 등록연월일: 2005.11.11, 발행•편집인: 진 호, 청소년보호책임자: 김권식 Tel 대표번호.(02) 929-9966, Fax 02)929-4151, E-mail medifonews@medifonews.com