서울아산병원 남수정 교수, 고현정 교수 연구팀과 공동연구로 적은 정보만으로도 암 부위를 정확하게 탐지... 암 부위 탐지를 위해 정확하게 그려진 데이터셋 구축이 필요했던 딥러닝 모델 학습의 효율성 향상에 획기적 기여 예상돼

(왼쪽부터) DGIST 로봇및기계전자공학과 박상현 교수, 정재훈 석박사통합과정생, 필립치콘테 박사과정생.
(왼쪽부터) DGIST 로봇및기계전자공학과 박상현 교수, 정재훈 석박사통합과정생, 필립치콘테 박사과정생.

암이 존재한다는 데이터만으로 병리영상에서 암의 존재와 부위까지 정확하게 보여줄 수 있는 약지도학습(weakly supervised learning) 딥러닝 모델을 DGIST(총장 국양) 로봇및기계전자공학과 박상현 교수(인공지능 전공 겸직) 연구팀이 서울아산병원 남수정 교수, 고현정 교수 연구팀과 공동 개발했다.

기존 딥러닝 모델에서는 암 부위를 특정하기 위해서는 암의 위치가 정확하게 그려진 데이터셋 구축을 필요로 했으나, 이번 개발된 딥러닝 모델로 효율성이 향상되어 해당 연구 분야에 획기적으로 기여할 것으로 전망된다.

일반적으로 암의 위치정보를 나타내는 영역화 문제를 해결하기 위해서는 암 부위가 위치한 곳을 정확하게 표시해주는 작업을 진행해야하기에 오랜 시간이 소요되고, 그에 따라 비용이 증가하게 된다.

연구팀의 인공지능 모델 개요
연구팀의 인공지능 모델 개요

이러한 문제를 해결하기 위해 ‘영상 속 암의 존재 유무’와 같은 대략적인 정답만으로도 암 부위를 영역화 하는 약지도학습 모델이 활발하게 연구되고 있으나, 영상 하나의 크기가 기가바이트에 이르는 거대한 병리영상 데이터셋에 기존의 약지도학습 모델을 적용하면 성능이 크게 저하되는 문제가 발생한다.

그러나 이 문제를 해결하기 위해 병리영상을 패치들로 분할해서 활용하는 방안으로 성능을 높이려고 하지만, 분할된 패치들은 위치정보와 각 분할자료 간의 상관관계를 잃어버리게 되어 모든 정보를 활용할 수 없다는 한계를 갖게 된다.

이에 박상현 교수 연구팀은 슬라이드 단위의 암 유무 표시를 가진 학습데이터만으로 암 위치까지 정확히 분할해낼 수 있는 기법을 발견했다.

픽셀 상관관계 모듈(PCM)의 구조
픽셀 상관관계 모듈(PCM)의 구조

먼저 비지도 대조 학습(Unsupervised contrastive learning)을 통해 패치들로부터 유의미한 특징들을 효과적으로 추출하도록 네트워크를 학습시키고, 이를 이용하여 각 위치정보를 유지하면서 주요 특징들을 검출하게 하여 패치들 간 상관관계를 유지한 채 영상의 크기를 줄이는 병리영상 압축 기술을 개발했다.

이후 압축된 병리영상으로부터 클래스 활성 지도(Class activation map)를 활용하여 암일 확률이 높은 부위를 찾아내고, 픽셀 상관관계 모듈(Pixel correlation module, PCM)을 이용해 전체 병리영상 내에서 암일 확률이 높은 부분들을 모두 영역화 해낼 수 있는 모델을 개발했다.

여러 비교기법과 제안된 모델의 암 영역화 결과. 초록색은 정답 암 부위를 나타내고 노란색들은 각 모델에서 예측한 암 부위를 나타낸다. 기존의 약지도학습 기법들(DeepMIL, DSMIL, SEAM) 보다 제안된 모델(Ours)가 더 좋은 성능을 보이며, 정확한 정답을 활용해 학습한 지도학습 기법(UNet)과 비슷한 성능을 보이는 것을 확인할 수 있다.
여러 비교기법과 제안된 모델의 암 영역화 결과. 초록색은 정답 암 부위를 나타내고 노란색들은 각 모델에서 예측한 암 부위를 나타낸다. 기존의 약지도학습 기법들(DeepMIL, DSMIL, SEAM) 보다 제안된 모델(Ours)가 더 좋은 성능을 보이며, 정확한 정답을 활용해 학습한 지도학습 기법(UNet)과 비슷한 성능을 보이는 것을 확인할 수 있다.

새롭게 개발한 딥러닝 모델은 암 영역화 문제에서 슬라이드 단위의 암 유무 레이블을 가진 학습데이터만으로 최대 81 ~ 84의 Dice similarity coefficient (DSC) 점수를 보였으며, 기존에 제안된 패치단위 기법들이나 다른 약지도학습 기법들의 성능(DSC 점수: 20 ~ 70)을 크게 웃돌았다.

박상현 교수는 “이번 연구를 통해 개발한 모델은 병리영상의 약지도학습 영역화 성능을 크게 개선시켰으며 이를 통해 병리영상 분석이 필요한 다양한 연구들의 효율성 향상에 기여할 수 있을 것으로 기대된다.”며, “향후 관련 기술을 좀 더 개선한다면 다양한 의료영상 영역화 문제에도 범용적으로 활용될 수 있을 것”이라 말했다.

한편, 이번 연구 결과는 그 우수성을 인정받아 의료영상 분석 관련 분야 최상위 국제학술저널인 의료영상분석 저널(MedIA, Medical Image Analysis Journal)에 'Weakly supervised segmentation on neural compressed histopathology with self-equivariant regularization(보기)'란 제목으로 지난 5월 25일 게재되었다. 사용된 데이터 세트 및 모델은 현재, 깃허브(다운)를 통해 공개돼 있다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지