POSTECH 김상욱 교수팀, 기계 학습 이용해 유전자 돌연변이의 조직 특이적 발암 가능성 올바르게 예측...66가지 암 유형에 걸쳐 28,000개의 종양 샘플에서 축적된 데이터를 통해 암 드라이버 돌연변이를 탐지함으로써 지금까지의 주요 방법을 능가

김상욱 교수
김상욱 교수

2021년 통계청이 발표한 국내 사망 원인 1위는 암으로 인한 사망(26%)이다. 대다수 암의 경우 상당히 진행된 이후에야 그 증상이 나타나기 때문에 암 치료를 위한 골든 타임을 놓치기 쉽다. 

세계 보건 기구에 따르면 30% 이상의 암 환자가 조기 진단·조기 치료로 완치할 수 있다. 암을 초기에 진단하기 위해서는 조직에서 발견되는 돌연변이가 암을 일으킬 수 있는지에 대한 예측이 필요하다.

POSTECH(포항공과대학교, 총장 김무환) 생명과학과 김상욱 교수‧김동효 박사‧하도연 박사 연구팀은 환자의 유전자에 생긴 돌연변이가 조직 특이적으로 암을 일으킬 수 있는지 정확하게 예측할 수 있는 머신러닝 모델을 개발했다. 

암을 일으키는 돌연변이(드라이버 돌연변이)를 식별하는 것은 다양한 종양에 걸쳐 뚜렷한 병리학적 메커니즘을 밝히고, 환자별 치료 기회를 제공하는 데 중요하다. 연구팀은 암 유형별 드라이버 돌연변이를 식별하고 최첨단 성능을 갖춘 머신러닝(ML) 모델을 구성하기 위해 시퀀스 공진화 분석을 기반으로 새로운 기능을 고안했다. 특히, 66가지 암 유형에 걸쳐 28,000개의 종양 샘플에서 축적된 데이터를 통해 암 드라이버 돌연변이를 탐지함으로써 지금까지의 주요 방법을 능가했다.

모델 개요
모델 개요

연구팀은 단백질 서열 분석과 기계 학습을 통해 돌연변이의 발암 가능성을 예측하는 모델을 개발하고, 기존 모델과 비교해 높은 정확도와 민감성을 확보하는 데 성공했다. 또한, 지금까지의 연구들에서 사용되지 않은 단백질 서열 공진화 분석을 이용해 인공지능을 학습시켜 특정 암종을 일으킬 수 있는 단백질 잔기생화학 및 분자생물학에서 잔기(다당류, 단백질, 핵산의 중합체 사슬 내의 특정 단위체를 의미) 나 돌연변이를 찾아내는 데 성공했다.

연구를 통해 발견된 돌연변이들은 조직 특이적 단백질 상호작용 네트워크를 교란시켜 특정 암종을 유발할 수 있는 것으로 나타났다. 이 연구성과는 암 조기 진단 기술과 새로운 암 치료 타깃 발굴에 접목되어 효과적인 암 예방과 치료법을 찾는 데 도움이 될 것으로 기대된다.

김상욱 교수는 “이 기술을 이용하면 기존에 찾아낼 수 없었던 새로운 발암 유전자 변이를 찾아낼 수 있으며, 기존 기술과는 차별화된 암 진단 및 치료 전략을 세우는데 도움을 줄 수 있을 것"이라고 말했다.

한편, 이번 연구성과는 POSTECH 의료기기혁신센터, 인공지능대학원, 한국연구재단 중견연구지원사업의 지원을 받아 수행됐으며, 연구는 생물정보학 분야 권위지인 ‘브리핑스 인 바이오인포매틱스(Briefings in Bioinformatics)’에 '암을 식별하기 위한 진화 기반 기계 학습을 이용한 암 유형별 돌연변이 검출(An evolution-based machine learning to identify cancer type-specific driver mutations-보기)'이란 제목으로 지난해 12월 27일 게재됐다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지