대규모 국가검진 데이터 활용한 머신러닝 기반의 뇌동맥류 발병 위험도 분석

분당서울대병원 신경외과 김택균 교수
분당서울대병원 신경외과 김택균 교수

뇌동맥류는 뇌혈관 벽에 미세한 균열이 생기면서 뇌동맥의 일부가 혹처럼 비정상적으로 부풀어 오르는 혈관 질환이다. 뇌동맥류가 갑자기 터지면 뇌와 척수 사이 거미줄처럼 생긴 공간으로 혈액이 터져 나오는 지주막하출혈(Subarachnoid hemorrhage)을 일으키게 되는데, 이 경우 30~50%는 목숨을 잃게 되는 치명적인 질환이다.

최근에는 건강검진 시 뇌혈관 영상검사를 함께 시행하는 경우가 늘어나면서 미파열 상태의 뇌동맥류 진단이 급증하는 추세다.

하지만 질환 유무를 정확히 판별하기 위해서는 뇌혈관 조영술 및 뇌 MRI 등의 검사가 필요한데, 현재까지 뇌동맥류 선별검사 급여 적용은 제한적이기에 가족 내 뇌동맥류 환자가 두 명 이상 있거나 다낭성신증(콩팥에 다수의 낭종이 생기는 질환) 같은 유전적 질환이 있는 특별한 경우가 아닌 이상 선별 검사를 권유하지는 않고 있다.

그럼에도 불구하고 선별검사 권고 대상이 아닌 이들에게서 뇌동맥류가 훨씬 많이 나타나는 상황임을 고려했을 때, 개인별 뇌동맥류 발병 위험을 예측하여 적절한 선별검사가 제공될 필요성이 높아지고 있는 실정이다.

이 가운데 국내 연구진, 분당서울대병원 신경외과 김택균 교수 연구팀이 뇌동맥류 발병 위험을 예측하는 인공지능모델을 최근 개발해 주목받고 있다.

연구팀(제 1저자 분당서울대병원 신경외과 허재혁 연구원)은 2009년부터 2013년 사이에 국가건강검진을 시행 받은 약 50만 명의 검진데이터를 활용해 머신러닝 기반의 뇌동맥류 발병 위험 예측 모델을 개발했다.

뇌동맥류 발병 예측 모델은 연령, 혈압, 당뇨, 심장질환, 가족력 등 뇌동맥류 위험인자로 잘 알려진 요소들 외에도 체질량지수, 허리둘레, 혈액검사 수치 등 건강검진을 통해 확인할 수 있는 21가지의 요소들이 뇌동맥류 발병에 영향을 주는지를 분석했으며, 이에 대한 예측정확도를 높이고자 머신러닝 알고리즘을 적용했다.

각 위험 그룹에 따른 IA 발생, 5분위 위험별 연간 10만 명당 IA 발생률그룹: IA=내경 동맥류, LR=로지스틱 회귀 분석, RF=랜덤 포리스트, XGB=확장 가능한 트리 부스팅 시스템, DNN=심층 신경망
각 위험 그룹에 따른 IA 발생, 5분위 위험별 연간 10만 명당 IA 발생률그룹: IA=내경 동맥류, LR=로지스틱 회귀 분석, RF=랜덤 포리스트, XGB=확장 가능한 트리 부스팅 시스템, DNN=심층 신경망(표:논문 캡처)

연구팀은 로지스틱 회귀 (logistic regression. LR), 랜덤 포레스트 (Random fores, RF), 확장 가능한 트리 부스팅 시스템 (Scalable Tree Boosting System, XGB) 및 심층신경망(Deep Neural Network, DNN)을 포함한 머신러닝 알고리즘들을 국가검진 데이터에 적용하여 고전 통계 방법 대비 높은 예측력을 보이는 인공지능 모델을 구축했다.

이를 통해 뇌동맥류 발병 위험도를 다섯 단계로 분류해 예측 성능을 비교한 결과, 가장 낮은 위험도로 예측된 그룹의 발병률은 인구 10만 명 당 1년에 3.2명(3.2/100,000인년), 가장 높은 위험도로 예측된 그룹의 발병률은 161명(161/100,000인년)으로 나타나, 50배 높은 뇌동맥류 발병 위험을 보였다. 참고로 인년법(person-year method)이란 추적조사대상자의 인수와 관찰기간을 고려하여 분모를 설정하고 질병이상의 발생빈도를 측정하는 방법으로, 대상의 관찰기간이 상이할 때 사용한다. 주로 1인 1년간의 관찰을 1인년의 단위로 한다.

연구팀은 또한, 환자 개인별 위험 기여도를 평가해보니 남녀 모두 연령, 허리둘레, 혈압, 혈당이 증가할수록 뇌동맥류 발병 위험도 높아지는 것을 확인했다. 그러나 체질량지수, 고지혈증 위험인자는 남성보다 여성에게서 더 영향을 미치는 것으로 나타났다.

이번 연구의 교신저자인 신경외과 김택균 교수는 “이번 연구는 국가 단위의 대규모 검진 데이터를 바탕으로 일반 인구에서 어떤 집단이 뇌동맥류에 취약한 위험군인가를 판별해낸 연구라는 점에서 의의가 있다”며, “앞으로 환자들의 의료 이용기록 및 투약내역 등의 데이터를 보강해, 보다 개인화되고 정밀한 위험도 예측 모델을 구축할 예정”이라고 말했다.

이어 김 교수는 “이러한 데이터를 바탕으로 뇌동맥류 선별검사 지침이 새롭게 개정될 수 있다면, 뇌혈관 질환의 1차 예방에 있어 획기적인 개선을 이룰 수 있을 것으로 기대한다”고 덧붙였다.

한편, 이번 연구결과는 네이처 자매지인 권위 학술지 ‘사이언티픽 리포트(Scientific Reports)에 '머신러닝을 이용한 뇌동맥류 위험 예측(Prediction of Intracranial Aneurysm Risk using Machine Learning- 다운)'이란 제목으로 게재됐다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지