박창민 교수팀, 실제 임상현장에서 진단 정확도 향상, 판독 대기시간 감소...응급실 내원 환자 1,135명 대상으로 AI 진단시스템 성능 검증

사진은 발열과 기침으로 응급실을 방문한 환자의 흉부 X선 영상 (좌측)이다. 우측 하부 폐의 폐렴 병변 (화살표)을 응급의학과 당직의사는 인지하지 못하였으나, 인공지능 시스템은 병변의 존재와 위치를 정확하게 식별(우측)했다(사진:서울대병원)
사진은 발열과 기침으로 응급실을 방문한 환자의 흉부 X선 영상 (좌측)이다. 우측 하부 폐의 폐렴 병변 (화살표)을 응급의학과 당직의사는 인지하지 못하였으나, 인공지능 시스템은 병변의 존재와 위치를 정확하게 식별(우측)했다(사진:서울대병원)

서울대병원 영상의학과 박창민, 황의진 교수는 2017년 1월부터 3월까지 응급실을 방문한 환자 1,135명을 대상으로 AI진단시스템의 흉부X선영상 판독능력을 검증했다.

일반적으로 응급실에서 촬영된 흉부X선 영상 판독을 위해서는 질병이 실제로 있는 환자 중에 검사 결과에서도 양성으로 나타날 확률로 환자를 환자로 감별할 수 있는 검사 능력인 판독민감도(sensitivity)는 당직 영상의학과의사의 66%에 머물렀으며, 또 촬영된 영상을 판독하는데 88분(중앙값)이 소요된다.

표:민감도는 {a/a+c} 로 계산한다. 민감도가 높을수록 c가 작다. 다시 말해, 실제 질병이 있는 환자가 검사에서 음성으로 나오는 경우가 적다. 검사능력이 우수하다는 뜻이다.(자료:서울대병원)
표:민감도는 {a/a+c} 로 계산한다. 민감도가 높을수록 c가 작다. 다시 말해, 실제 질병이 있는 환자가 검사에서 음성으로 나오는 경우가 적다. 검사능력이 우수하다는 뜻이다.(자료:서울대병원)

특히, 추가검사나 치료가 필요한 이상소견이 있는 영상은 114분(중앙값)이 소요됐다. 영상 판독결과를 기다리는데만 약 1~2시간이 지체되는 것이다.

반면 AI 진단시스템으로 판독했을 때 판독 민감도는 82 ~ 89%로 당직의사보다 높았으며, 당직의사가 AI 진단시스템 분석결과를 참고해 진단했을 때도 판독 민감도가 향상됐다.

이처럼 응급실에서 AI 진단시스템을 활용해 판독오류와 소요시간을 줄임으로써 진료지연을 개선할 수 있었다. 이번 연구는 실제 진료현장에서 AI 진단시스템 활용가능성을 입증한 것이다.

사실, AI를 활용한 진단보조도구가 성능이 우수하다는 것은 다른 연구에서 몇 차례 보고된 바 있다. 하지만, 대부분의 연구가 실험적 데이터로만 성능을 확인해, 실제 진료 현장에도 사용가능한지는 미지수였다.

박 교수는 “이번 연구는 인공지능이 실제 환자진료에 충분히 활용될 수 있음을 보여주는 하나의 이정표가 될 것”이라며 “추후 보다 고도화된 인공지능 시스템 개발, 성능검증과 더불어 인공지능 활용을 극대화하는 방안에 대한 연구를 이어갈 것”이라 밝혔다.  

한편, 이번 연구는 서울대학교병원과 서울시 산학연 협력사업의 지원으로 시행됐으며, 관련 분야 최고권위 학술지인 ‘방사선학(Radiology)’ 최신호에 게재됐다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지