효과 예측 정확도 최고 13% 향상 가능, 항생제 개발 시간 단축에도 기여...AMP-BERT의 미세 조정을 위한 코드 및 데이터세트 공개

모델의 예측 결과와 해석 결과. 모델이 예측을 정확히 할 뿐 아니라, 실제 항균 활성을 일으키는 아미노산 부분 구조들이 강조되어 예측하고 있는 것을 확인할 수 있다.
모델의 예측 결과와 해석 결과. 모델이 예측을 정확히 할 뿐 아니라, 실제 항균 활성을 일으키는 아미노산 부분 구조들이 강조되어 예측하고 있는 것을 확인할 수 있다.

최초의 항생제인 페니실린은 인간과 동물의 다양한 질병을 치료하는 데 새로운 지평을 열었지만 무분별한 항생제 오남용으로 인해 항생제 내성균이 출현하게 되었고, 이에 따라 새로운 항생제 플랫폼인 항균 펩타이드(Antimicrobial peptide, AMP)에 대한 연구가 주목받고 있다.

항균 펩타이드(AMP)는 생명체의 모든 영역에서 자연적으로 발생하는 작은 단백질로, 기존 항생제에 내성이 있는 균에서도 뛰어난 항균력을 가지며 새로운 내성균의 출현도 거의 유발하지 않아 차세대 항생물질로 각광받고 있다. 또한 박테리아, 바이러스 및 곰팡이에 의한 감염자나 암 환자 치료를 위한 실효성 있는 대안 치료제로 주목받고 있다.

일반적인 항균제 신약 개발은 실험실에서 배양한 미생물에 직접 항균제를 스크리닝하여 활성을 검증하기 때문에 시간과 비용이 많이 소요되는데, 이러한 문제를 해결하기 위해 최근에는 컴퓨터를 이용한 계산 모델 연구가 활발히 진행되고 있다.

여기에, 지스트(광주과학기술원, 총장 김기선) 전기전자컴퓨터공학부 남호정 교수 연구팀이 항균 기능을 갖는 펩타이드 분자를 빠르게 발굴해주는 인공지능(AI) 모델을 개발했다.

남호정 교수
남호정 교수

이를 통해 항생제 내성균 대유행 시대를 대비하기 위한 신약 개발 인공지능 플랫폼으로, 펩타이드 분자 기반의 항생제 개발 초기 단계에서 활용돼 신약 개발 시간을 단축하는 데 기여할 것으로 기대된다.

연구팀(이한솔 석박통합과정생, 이송연 박사과정생, 이인구 박사)은 항균 펩타이드 치료제 개발을 위한 펩타이드 분자의 항균 효과를 기존보다 정확하게 판별할 수 있는 인공지능 예측 기술(AMP-BERT: Prediction of Antimicrobial Peptide Function Based on a BERT Model)을 개발했다.

이한솔 석박통합 과정
이한솔 석박통합 과정

이번 연구는 현재까지 공개된 다양한 예측 모델들과 비교해 실험 조건에 따라 최소 2% 최대 13% 더 높은 항균성 예측 정확도를 보였다. 또한, 기존 연구들에서는 불가능했던 항균성 연관 주요 펩타이드 부분 서열 정보를 제공해 예측 결과의 해석성 기능을 더했다.

연구팀은 대규모 단백질 서열로 사전 학습된 BERT(Bidrectional Encoder Representation from Transformers) 신경망 모델에 입력한 문장 내의 각 단어를 학습하면서, 다른 위치에 있는 단어들의 맥락을 참고해 현재 단어의 문장 내 상대적 속성을 학습하는 과정인 셀프 어텐션(self-attention) 기술을 적용함으로써 앞선 연구들의 한계점을 보완하는 항균 펩타이드 활성 예측 모델을 개발했다.

특히 기존 항균 펩타이드 활성 예측 연구들에서는 사용되지 않던 대용량 단백질 데이터로 사전 학습된 모델을 항균 펩타이드 관련 서열 데이터로 미세 조정(fine-tuning)을 실행한 결과, 기존 관련 연구들보다 우수한 예측 정확도를 보였다.

AMP-BERT 연구 개요. 연구에 사용된 데이터, 모델의 상세 구조, 평가 및 분석 방법을 종합적으로 보여주고 있다.
AMP-BERT 연구 개요. 연구에 사용된 데이터, 모델의 상세 구조, 평가 및 분석 방법을 종합적으로 보여주고 있다.

또한 단백질 서열의 주요 특성을 탐지하는 어텐션 기술을 사용해 항균 효과와 연관된 아미노산 서열의 경향성을 찾았다. 이를 통해 제안된 모델이 항균 펩타이드 활성과 관련된 주요 부분 구조를 올바르게 탐지하고 있다는 사실을 확인함으로써 모델의 신뢰성과 해석성을 검증했다.

남호정 교수는 “이번 성과는 단백질 서열의 일반적인 특성과 항균 펩타이드의 특이적인 정보를 함께 훈련해 펩타이드 분자에 대한 항균 효과 예측의 정확도를 높이고, 항균 효과에 관여하는 주요 펩타이드 부분 서열을 제공해 주는 기술”이라며 “인공지능 모델로 다양한 항생제 후보 물질을 단기간에 발굴해 결과적으로 항생제 신약 개발 성공 가능성을 제고하는 데 기여하기를 바란다”고 말했다.

한편, 이번 연구는 한국연구재단 ‘중견연구자지원사업’사업의 지원을 받아 수행되었으며, 단백질 분야 저명 학술지 Protein Science에 'AMP-BERT: BERT 모델 기반 항균 펩타이드 기능 예측(AMP-BERT: Prediction of antimicrobial peptide function based on a BERT model -보기)' 제목으로 지난달 3일 게재되었으며, AMP-BERT의 미세 조정을 위한 코드 및 데이터 세트는 깃허브(다운)에서 공개적으로 사용할 수 있다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지