스탠퍼드 대학과 양질의 뇌 MRI 생성 모델에도 협업해…MICCAI에 논문 2편 게재

(왼쪽부터) DGIST 로봇및기계전자공학과 박상현 교수, 강명균 박사과정.
(왼쪽부터) DGIST 로봇및기계전자공학과 박상현 교수, 강명균 박사과정.

인공지능(AI)은 사회 전반에 혁신적인 변화를 불러왔으며, 특히 의료 산업에서 빠르게 발전하고 있다. 의료 분야에서 딥러닝 모델을 학습할 경우 데이터에 환자의 개인정보가 포함되어 있어 개인정보 침해에 대한 우려가 많았다.

이 때문에 각 병원의 데이터를 중앙 서버로 모으는 것이 힘들었고, 나아가 여러 병원에서 공동으로 사용할 수 있는 대규모 모델을 개발하기도 어려웠다.

이 문제를 해결하기 위해 연합학습((Federated Learning, FL)은 데이터를 중앙서버에 수집하지 않고 각 병원이나 기관에서 학습한 모델만을 수집해 중앙서버로 전송하여 학습한다.

그러나 중앙 서버로 모델을 여러 번 전송해야하는 어려움이 있다. 특히 환자 데이터를 안전하게 보관해야 하는 병원에서는 모델을 중앙 서버로 반복 전송하는 데 비용과 시간이 많이 들기 때문에, 모델 전송 횟수를 최소화해야할 필요가 있다.

여기에, DGIST(총장 국양) 로봇및기계전자공학과 박상현 교수팀이 미국 스탠퍼드 대학팀과 협력해 개인정보 및 데이터 공유 없이도 대규모 모델 학습이 가능한 연합학습 AI 기술을 개발했다. 이 기술은 여러 기관이 함께 사용할 수 있는 모델을 효율적으로 학습할 수 있어 의료 영상 분석 분야에 큰 기여를 할 수 있을 것으로 기대된다.

모델 개요
모델 개요

박상현 교수 연구팀은 이미지 생성과 미리 잘 학습된 네트워크를 활용해 실제로 사용하고자 하는 네트워크를 학습하는 기법인 지식증류(Knowledge Distillation) 기술을 활용하여 모델 전송 횟수를 최소화하면서 모델 성능을 유지하고 개선하는 방법을 개발했다. 이 방법은 기관에서 생성한 이미지와 모델을 활용하여 중앙 서버에서 모델을 학습하는 것인데, 생성된 이미지와 지식 증류를 통해 모델을 학습하는 과정을 개선했다.

연구팀은 해당 기술을 활용하여 현미경, 현미경영상, 피부경영상, OCT, 병리영상, X-ray영상, 안저영상에 대한 분류과업을 수행했다. 그 결과 기존 연합학습 기법과 비교했을 때 우수한 분류 성능을 나타내는 것을 확인했다.

DGIST 로봇및기계전자공학과 박상현 교수는 “이번 연구를 통해 데이터 및 개인정보를 공유하지 않고 학습에 참여한 모든 기관에서 범용적으로 작동하는 모델을 학습할 수 있다”며, “해당 기술이 여러 의료현장에서 대규모 인공지능 모델을 개발하는 비용을 획기적으로 줄일 수 있을 것으로 기대한다”고 말했다.

특히 본 연구는 미국의 스탠퍼드 대학교(Stanford University) 연구진과 공동 수행한 연구로 박상현 교수 연구팀은 사실적인 뇌 MRI를 생성하는 연구도 함께 수행했다.

(a)는 제안한 기법의 이미지 생성 결과이며, (b)와 (c)는 기존 원샷 연합학습 기법의 이미지 생성 결과이다. 제안한 기법이 다른 기법 대비 사실적인 이미지를 생성했다.
(a)는 제안한 기법의 이미지 생성 결과이며, (b)와 (c)는 기존 원샷 연합학습 기법의 이미지 생성 결과이다. 제안한 기법이 다른 기법 대비 사실적인 이미지를 생성했다.

이 연구를 통해 2D 뇌 MRI 슬라이드를 조건부로 입력받아 3D뇌 MRI를 생성하는 조건 확산 모델을 개발했다. 기존 뇌 MRI 생성모델과 비교해 적은 메모리만으로도 양질의 영상을 생성할 수 있어 의료 분야에 중요한 역할을 할 수 있을 것으로 기대된다.

한편, 이번 연구는 영상분석 관련 분야 글로벌 최상위 저널인 MICCAI(Medical Image Computing and Computer Assisted Intervention)에 '이미지 합성 및 클라이언트 모델 적응과 함께 지식 증류를 사용한 의료 데이터에 대한 원샷 연합 학습(One-shot Federated Learning on Medical Data using Knowledge Distillation with Image Synthesis and Client Model Adaptation-다운)'란 제목으로 지난 1일 게재됐으며, 사용된 코드는 깃허브(다운)를 통해 공개됐다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지