개발한 진단 모델의 정상-암 분류 성능 지표(AUROC)와 진단 정확도는 내부 검증 데이터의 경우 각각 96.0%, 91.0%였으며, 외부 검증 데이터의 경우 89.5%, 83.0%였다.

(왼쪽부터) 이비인후과 김철호 교수, 방사선종양학과 허재성 교수
(왼쪽부터) 이비인후과 김철호 교수, 방사선종양학과 허재성 교수

우리나라 전체 암 발생 10위인 구강암은 삶의 질을 크게 좌우하는 먹고 말하는데 필요한 혀, 볼 점막, 잇몸, 입술, 턱뼈 등에 생긴다. 진행성 병기에 발견될 경우 치료를 하더라도 심각한 합병증 및 후유증이 발생해 치료 예후가 나쁜 매우 까다로운 암 중 하나로 손꼽힌다.

여기에, 아주대학교병원(원장 한상욱) 이비인후과 김철호 교수, 방사선종양학과 허재성 교수 공동연구팀이 AI 학습용 데이터셋 사업의 일환으로 구축한 1만2400장의 구강내시경 이미지를 이용해, 구강암을 진단하는 인공지능 모델을 개발했다.

구강암의 진단은 비교적 간편하고 적은 비용의 구강내시경 검사를 통해 가능하지만, 내시경검사결과를 정확하게 판독할 수 있는 두경부암 전문의가 부족한 상태다. 연구팀이 개발한 진단 모델의 정상-암 분류 성능 지표(AUROC)와 진단 정확도는 내부 검증 데이터의 경우 각각 96.0%, 91.0%였으며, 외부 검증 데이터의 경우 89.5%, 83.0%였다.

설암 진단 알고리즘 개발 및 평가 개요(표:논문캡처)
설암 진단 알고리즘 개발 및 평가 개요(표:논문캡처)

특히, 연구팀은 이번 AI 진단 모델이 1차 의료기관의 구강암 진단 및 스크리닝을 높일 수 있는 보조도구로 사용 가능하다는 것을 입증했다.

정상-암 분류 성능 지표는 구강내시경 이미지를 보고 암과 정상을 얼마나 정확하게 구별하는지 평가하는 지표로 사용된 데이터는 한국정보통신기술협회(TTA)로부터 검증을 받았으며, 개발된 인공지능 모델은 구강암에 대한 일반화된 패턴을 도출해 높은 진단 성능을 보였다는 점에서 주목된다.

아울러 연구팀은 정확도와 실제 임상 적용 가능성을 확인하기 위해 '인공지능 모델', ''의사(일반의)', '두경부암 전문의' 총 3개 그룹으로 나눠 암 진단을 시뮬레이션한 결과, 민감도가 각각 81.1%, 77.3%, 91.7%였으며, 정확도는 84.7%, 75.9%, 91.2%로 두경부암 전문의, 인공지능 모델, 일반의(의사) 순으로 정확하게 구강암을 진단했다.

딥러닝 알고리즘에 대한 수신기 작동 특성 곡선 및 정밀도-재현율 곡선, 내부 검증 데이터 세트(A) 및 외부 검증 데이터 세트(B).
딥러닝 알고리즘에 대한 수신기 작동 특성 곡선 및 정밀도-재현율 곡선, 내부 검증 데이터 세트(A) 및 외부 검증 데이터 세트(B).

김철호 교수는 “구강암 환자의 경우 통증이 심해지기 전까지 병원을 방문하지 않아 치료시기를 놓치는 경우가 많다”며 “치료시기를 놓칠 경우 치료예후가 매우 불량한 구강암의 조기 진단을 위해 이번에 개발한 인공지능 모델을 탑재한 구강암 진단 및 관리 플랫폼 개발에 주력할 것”이라고 밝혔다.

허재성 교수는 “구강내시경 이미지는 기존의 CT, MRI 등의 표준화된 이미지와 달리 비정형성을 가지고 있어 인공지능 모델 개발이 어려웠으나, 데이터 전처리 과정에서 표준화 알고리즘을 적용하는 등 양질의 데이터 구축을 통해 실용화·상용화가 가능한 인공지능 모델을 개발했다”고 전했다.

한편, 이번 연구는 세계적 학술지인 사이언티픽 리포트(Scientific Reports)에 '내시경 영상을 이용한 설암 진단을 위한 딥러닝 모델(Deep learning model for tongue cancer diagnosis using endoscopic images-다운)'이란 제목으로 지난달 15일 게재됐다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지