2024.11.26 (화)
개인정보 및 데이터 공유 없이도 대규모 모델 학습이 가능한 연합학습 AI 기술이 개발됐다. DGIST는 로봇및기계전자공학과 박상현 교수팀이 미국 스탠퍼드 대학팀과 협력해 여러 기관이 함께 사용할 수 있는 모델을 효율적으로 학습할 수 있어 의료 영상 분석 분야에 큰 기여를 할 수 있을 것으로 기대되는 AI 기술을 개발했다고 10일 밝혔다. 의료 분야에서 딥러닝 모델을 학습할 경우 데이터에 환자의 개인정보가 포함돼 있어 개인정보 침해에 대한 우려가 많았다. 이 때문에 각 병원의 데이터를 중앙 서버로 모으는 것이 힘들었고, 나아가 여러 병원에서 공동으로 사용할 수 있는 대규모 모델을 개발하기도 어려웠다. 이 문제를 해결하기 위해 연합학습은 데이터를 중앙서버에 수집하지 않고 각 병원이나 기관에서 학습한 모델만을 수집해 중앙서버로 전송해 학습한다. 그러나 중앙 서버로 모델을 여러 번 전송해야하는 어려움이 있다. 특히 환자 데이터를 안전하게 보관해야 하는 병원에서는 모델을 중앙 서버로 반복 전송하는 데 비용과 시간이 많이 들기 때문에, 모델 전송 횟수를 최소화해야할 필요가 있다. 이에 박상현 교수 연구팀은 이미지 생성과 지식증류 기술을 활용해 모델 전송 횟수를 최소화하