DNA 메틸화 부위를 예측하는 이 머신러닝 알고리즘은 전체 구조를 변경하지 않고 DNA의 활동을 변경할 수 있다. 알고리즘은 기존의 스크리닝 방법으로는 놓칠 수 있는 질병 유발 메커니즘을 식별할 수 있다.

연구원들은 기존 시퀀싱 방법으로는 찾을 수없는 메틸화 부위를 확인

DNA 메틸화(DNA methylation)는 일반적인 유기체적 진화와 세포적 변이를 위해 결정적 부분이다. DNA 메틸화는 안정적으로 세포에서 유전자 표현형을 변화 시킨다.

DNA 메틸화는 많은 주요 세포 과정에 관여하며 유전자 발현의 중요한 구성 요소로 메틸화의 오류는 다양한 인간 질병과 관련이 깊다.

이에 뉴저지공과대학(New Jersey Institute of Technology. NJIT)과 필라델피아 아동병원(Children's Hospital of Philadelphia, CHOP)의 연구원들은 DNA 메틸화 부위를 예측하는 데 도움이 되는 머신러닝 알고리즘을 개발했다. 이 과정은 전체 구조를 변경하지 않고 DNA의 활동을 변경할 수 있다. 알고리즘은 기존의 스크리닝 방법으로는 놓칠 수 있는 질병 유발 메커니즘을 식별할 수 있는 것이다.

게놈 시퀀싱 도구는 개별 유전자가 여전히 동일해 보이기 때문에 메틸화의 효과를 포착할 수 없다.

필라델피아 아동병원의 하콘 하코나슨(Hakon Hakonarson) 응용유전체(Applied Genomics) 센터 소장은 "이전에 게놈에서 메틸화 부위를 확인하기 위해 개발 된 방법은 주어진 시간에 특정 뉴클레오티드 길이 만 볼 수 있었기 때문에 많은 메틸화 부위를 놓쳤습니다."라며, "우리는 잠재적으로 질병을 유발할 수있는 게놈 전체에서 이러한 모티프를 식별할 수 있는 딥러닝 알고리즘을 사용하여 메틸화 부위를 식별하고 예측한 것입니다"라고 말했다.

참고로 뉴클레오티드(Nucleotide)는 긴 사슬 형태의 중합체를 이루어 DNA나 RNA와 같은 핵산을 형성한다. 뉴클레오티드는 DNA 및 RNA를 구성하는 기본단위이며 물질대사 과정 중 에너지 전달에도 관여한다.

메틸화의 마지막 숨겨진 레이어 표현에 대한 t-SNE 시각화(이미지:논문캡처)
메틸화의 마지막 숨겨진 레이어 표현에 대한 t-SNE 시각화(이미지:논문캡처)

 뉴저지공과대학 컴퓨터 과학자이자 이 연구의 선임 공동 저자 인 지웨이(Zhi Wei) 박사는 아동병원의 하콘 하코나슨과 그의 팀과 협력하여 메틸화 부위의 위치를 ​​예측할 수 있는 딥러닝 알고리즘을 개발하여 연구원들이 특정 인근 유전자에 대한 가능한 영향을 결정할 수 있도록 지원했다.

한편, 이 연구는 미국국립과학재단이 지원하는 슈퍼 컴퓨터에서 연구자, 엔지니어 및 학자의 생산성과 능력을 향상시키고 과학 및 공학에 대한 참여를 확대하여 개방형 과학적 발견을 가속화하는 XSEDE(eXtreme Science and Engineering Discovery Environment) 프로젝트를 통해 이루어졌으며, 연구 결과는 네이처 머신 인텔리전스(Nature Machine Intelligence) 저널에 '딥러닝을 통한 N6-아데닌의 DNA 메틸화 해석(Elucidation of DNA methylation on N6-adenine with deep learning- )'이란 제목으로 게재되었다 .

저작권자 © 인공지능신문 무단전재 및 재배포 금지