알고리즘은 다른 암에 쉽게 확대 가능하고 딥러닝 등 결과 해석이 어려운 다른 머신러닝 알고리즘과는 달리, 회귀 및 경로 분석 기반의 알고리즘으로 원인 분석 및 결과의 일관성을 중시하는 임상에서 선호하는 AI 솔루션을 제공할 것으로 기대된다.

건국대학교 박경식, 김성영_교수
건국대학교 의과대학 박경식, 김성영 교수

최근 인공지능(AI) 기반 의학의 관심이 크게 증가하고 다중오믹스(Multiomics) 데이터와 머신러닝을 활용한 예측 기술은 암 진단 및 치료의 혁신적인 미래의료 기술로 기대되고 있다. 그러나 예측 인자 및 모델이 연구자별, 센터별 그리고 분석 플랫폼 별로 상이해 보다 객관적이고 신뢰할 수 있는 모델의 발굴 및 검증 요구가 높아지고 있다.

또한 정밀의학은 모델의 정확도도 중요하지만 일관성과 해석력이 중요하다. 공개된 빅데이터를 이용해 연구자별, 센터별 차이를 교정해 보다 신뢰할 수 있는 결과를 도출하는 것이 중요하다. 머신러닝을 통한 모델링은 대부분 해석이 어려운 경우가 많아 예측의 정확도 뿐 아니라 모델의 해석력 또한 모델의 성능을 평가하는 데 매우 중요한 요소로 인식되고 있다.

이 가운데 국내 연구진 건국대학교(총장 전영재) 의과대학 김성영 교수 연구팀이 미국 메모리얼 슬로언케터링 암센터(MSKCC, Memorial Sloan-kettering Cancer Center) 연구진과 함께 새로운 형태의 암진단 도구로 생물경로 기반의 메타 분석(Meta Analytic)을 접목해 머신러닝 알고리즘을 이용해 높은 신뢰도로 암을 구별할 수 있는 인공지능 플랫폼을 개발했다.

의학 분야에서는 동일한 주제에 대한 다양한 연구결과를 통합해 결과의 일관성을 평가하고 통계적 정확성을 높이는 기법으로 메타분석연구가 활발하게 이루어지고 있다. 메타분석은 유사한 주제로 실시된 개별연구에 나타난 연구 추정치를 공통된 효과크기로 전환하여 실험결과를 객관적이고 일반화시키는 방법으로 근거중심의학의 핵심이 되는 통계기법이다.

메타분석 기반 머신러닝 기술 개요
메타분석 기반 머신러닝 기술 개요

연구팀은 암조직의 유전자 발현 및 관련 생물경로를 메타분석 기반의 알고리즘을 이용해 통합하고 이를 인공지능을 위한 학습재료로 사용하였으며, 머신러닝 알고리즘을 메타분석과 결합시켜 보다 강건한 모델(MLMA, machine learning-based meta-analytic methods)을 구축하였다.

유전체 빅데이터는 보통 ‘차원의 저주'라 불리는 고차원 문제에 직면하는데 연구팀은 비선형 주성분 분석과 생물경로를 이용한 차원축소 방법이 모델의 일반성과 해석력을 크게 끌어올리는 것을 확인했다. 이렇게 만들어진 알고리즘을 실제 암맹 갑상선암 샘플에 검증한 결과 거의 완벽한 분류 성능을 나타냈다. 갑상선암의 여러 아형을 테스트한 결과 높은 정확도로 이들 아형까지도 구분해냈다.

또한 노화관련 질환인 점을 고려하여 노화인자를 교정한 고위험군에서도 이 모델의 성능을 확인하였다. 유전체 발현 데이터는 연구자 및 수행기관, 분석플랫폼 별로 예측인자와 모델이 상이해 메타분석 및 생물경로 기반의 알고리즘은 보다 객관적이고 해석력이 뛰어나다는 설명이다.

실제 연구팀은 다중오믹스 분석을 통해 갑상선암 관련 생물경로의 조절인자를 찾아내 모델의 해석력을 극대화했다. 개발된 알고리즘은 갑상선암 이외의 다른 암으로도 쉽게 응용될 수 있다는 설명이다. 또한 회귀 및 경로 분석 기반의 알고리즘으로 원인분석 및 결과의 일관성을 중시하는 임상에서 선호될 것으로 내다보고 있다.

한편, 이번 연구는 건국대학교(교신저자 김성영 교수, 제1저자 박경식 교수, 공저자 김성훈 박사) 와 메모리얼 슬론 캐더링 암센터 오정헌 교수가 공저자로 수학 및 컴퓨터생물학 분야 국제학술지 브리핑스 인 바이오인포메틱스(Brief. Bioinform)에 '머신러닝과 결합된 개인화된 경로를 기반으로 한 갑상선 유두암의 정확한 진단(Highly accurate diagnosis of papillary thyroid carcinomas based on personalized pathways coupled with machine learning- 보기)'이란 제목으로 지난달 19일 게재됐다. 

 

아래는 김성영 교수와 인터뷰 내용이다. 

Q 연구를 시작한 계기나 배경은?

A 정밀의학은 모델의 정확도도 중요하지만 일관성과 해석력이 중요하다. 또한 공개된 빅데이터를 이용해 연구자별, 센터별 차이를 교정해 보다 신뢰할 수 있는 결과를 도출하는 것이 중요하다. 최신의 인공지능 알고리즘에 생물경로 기반의 메타분석을 접목해 보다 강건한 모델을 만들 수 있지 않을까 하는 생각에 연구를 시작하게 되었다.

Q 이번 성과, 무엇이 다른가?

A 다른 인공지능 알고리즘과 달리 인공지능 모델의 정확도 뿐 아니라 모델의 일관성 및 해석력에 많은 중점을 둬 예측 및 진단 뿐 아니라 암진행의 새로운 분자 생물학적 기전을 발굴하는 데 좋은 툴로 활용될 수 있다.

Q 실용화된다면 어떻게 활용될 수 있나? 그리고 실용화를 위한 과제는?

A 정밀의학 플랫폼의 훌륭한 레퍼런스로 활용될 수 있다. 새로운 암특이 생물경로 발굴해 신약발굴 단서 제공한다. 보다 강건한 모델링을 위해 희귀 타입의 종양 샘플 확보, 과도한 샘플 불균형을 고려한 모델링이 필요하고 임상의학자가 쉽게 접근할 수 있는 엔드유저 친화적 인터페이스 구축 등이 실용화를 위한 과제로 남아있다

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지