남덕우 UNIST 생명과학부 교수, “데이터는 이미 엄청나게 쌓여 있습니다. 어떤 분석 전략을 세우느냐에 따라 얼마든지 중요한 발견을 할 수 있고, 세포와 질병에 대한 이해도 높일 수 있어요.”

빅데이터로 질병 조절 마이크로RNA 발굴 시스템을 개발한 UNIST 연구진(왼쪽부터) 김진환 연구원, 남덕우 교수, 윤소라 박사, 하이 응우옌 박사(사진:UNIST)
빅데이터로 질병 조절 마이크로RNA 발굴 시스템을 개발한 UNIST 연구진(왼쪽부터) 김진환 연구원, 남덕우 교수, 윤소라 박사, 하이 응우옌 박사(사진:UNIST)

인간 유전체 서열이 해독된 후 ‘마이크로어레이(Microarray)’ 기술이 발전하면서 특정 조건에서 수만 개의 유전자가 발현하는 현상을 동시에 측정할 수 있게 됐다. 이 기술이 발전하면서 유전체 연구가 폭발적으로 성장했고, 지난 15년 넘는 시간 동안 백만 건을 훌쩍 넘는 ‘마이크로어레이 데이터’가 공공 데이터베이스에 저장됐다.

사람의 유전자가 세포 속에서 단백질을 만드는 '유전자 발현'에 대한 데이터는 인간 유전체 해독 이후 꾸준히 쌓여 있고, 누구나 접근해 활용할 수 있는데 이 자료들은 누구나 접근해 활용할 수 있다. 근래에는 마이크로어레이 대신 ‘RNA 시퀀싱(RNA sequencing)’이라는 발전된 기술이 도입됐지만, 현재까지는 축적된 자료가 많은 마이크로어레이를 활용한 유전자 발현 정보가 월등하다.

국내 연구진이 이 15년 이상 차곡차곡 쌓인 유전자 발현(gene expression) 공공 데이터베이스를 활용하는 새로운 분석 전략을 개발했다. UNIST(총장 정무영) 생명과학부의 남덕우 교수팀은 유전자 발현 데이터베이스를 가공해 암을 억제하는 마이크로RNA를 발굴하는 기술을 개발한 것이다. 연구팀은 이 데이터베이스에서 각종 질병과 조직 특성, 세포 분화, 약물처리 등 다양한 세포 조건에 따른 5000여 개의 데이터 세트를 가공해 ‘유전자 발현 빅데이터’를 수집했다. 또 마이크로RNA의 염기서열에 기반한 타깃 유전자(target gene) 집단의 정보를 함께 분석했다.

바이클러스터링 및 네트워크를 이용한 마이크로RNA 타깃 유전자 예측 정확도 측정: (a) 대상 마이크로RNA를 예측하는 민감도(세로축)를 보여주는 그래프. 왼쪽 상단에 배치될수록 민감도가 높다. (b) 상호작용하는 단백질의 수(가로축)에 따른 예측 민감도(세로축)를 나타내는 그래프. ©기존 결합서열 분석으로 예측한 경우(검정색)보다 결합서열과 바이클러스터링을 함께 활용한 경우(파란색) 예측도가 17% 높아졌고, 상호작용하는 단백질만 골라서 결합서열과 바이클러스터링을 함께 활용한 경우 예측도는 32%까지 향상됐다.
바이클러스터링 및 네트워크를 이용한 마이크로RNA 타깃 유전자 예측 정확도 측정: (a) 대상 마이크로RNA를 예측하는 민감도(세로축)를 보여주는 그래프. 왼쪽 상단에 배치될수록 민감도가 높다. (b) 상호작용하는 단백질의 수(가로축)에 따른 예측 민감도(세로축)를 나타내는 그래프. (c)기존 결합서열 분석으로 예측한 경우(검정색)보다 결합서열과 바이클러스터링을 함께 활용한 경우(파란색) 예측도가 17% 높아졌고, 상호작용하는 단백질만 골라서 결합서열과 바이클러스터링을 함께 활용한 경우 예측도는 32%까지 향상됐다.

그 결과, 459개의 ‘인간 마이크로RNA에 의한 조절 네트워크’를 예측하는 빅데이터 분석 시스템(BiMIR)을 구축할 수 있었으며(바로가기), 특히 ‘바이클러스터링(Biclustering)’이라는 양방향 군집화 분석을 통해, 마이크로RNA가 조절하는 ‘유전자 집단’과 관련 ‘세포 조건’을 동시에 제시해주는 새로운 접근법을 개발했다.

남덕우 교수는 “유전자 발현 빅데이터에 바이클러스터링 방법을 적용하면, 줄기세포나 특정 질병 등 다양한 세포 조건에서 일어나는 마이크로RNA 조절 네트워크를 더 정확하게 발굴할 수 있다”며 “가령 유방암이 어떤 유전자들의 발현과 연결돼 있고, 이들 유전자를 억제하는 마이크로RNA가 무엇인지 예측하게 되는 것”이라고 설명했다.

연구진은 실제로 유방암 발달에 중요한 신호전달 경로(PI3K/Akt signaling pathway)를 miR-29 등 적은 수의 마이크로RNA들이 집중적으로 ‘억제 가능함’을 발견했다. 이는 박지영 UNIST 생명과학부 교수와 공동연구해 실험으로도 검증됐으며, 남덕우 교수는 “이번에 발견한 것은 유방암에서 miR-29가 저하돼 PI3K/Akt 신호전달 경로를 ‘조절하고 있지 않음’”이라며 “miR-29의 발현을 높여주면 해당 경로의 타깃 유전자들과 경로 활성도가 현저히 저하되는 걸 실험적으로 확인했다”고 밝혔다.

유방암에 중요한 신호전달 경로와 이를 조절하는 마이크로RNA) (a) 살색은 세포의 경계 부분을 나타낸다. 유방암은 붉은 테두리로 표시된 유전자의 발현과 관련이 있는데, 이번에 개발한 알고리즘을 활용해 이들 유전자들의 발현을 조절하는 마이크로RNA를 정확하게 발굴했다. (b)는 유방암 유발 유전자와 관련이 깊다고 예측된 마이크로RNA 중 하나인 miR-29의 발현 여부와 환자 생존의 상관관계를 보여주는 기존 연구결과다. 그래프에서는 miR-29 발현이 높을수록 유방암 환자의 생존률이 높게 나타나 이 마이크로RNA가 작동하면 유방암이 활발해진다고 해석할 수 있다. (c-d) miR-29의 조절 대상인 유전자 9개의 발현량을 실험을 통해 검증한 결과다. 이 마이크로RNA가 켜진 경우 해당 유전자 발현량이 줄어든 것을 보여준다. miR-29가 대상 유전자 9개를 조절한다는 것을 확인시켜주는 결과다.
유방암에 중요한 신호전달 경로와 이를 조절하는 마이크로RNA) (a) 살색은 세포의 경계 부분을 나타낸다. 유방암은 붉은 테두리로 표시된 유전자의 발현과 관련이 있는데, 이번에 개발한 알고리즘을 활용해 이들 유전자들의 발현을 조절하는 마이크로RNA를 정확하게 발굴했다. (b)는 유방암 유발 유전자와 관련이 깊다고 예측된 마이크로RNA 중 하나인 miR-29의 발현 여부와 환자 생존의 상관관계를 보여주는 기존 연구결과다. 그래프에서는 miR-29 발현이 높을수록 유방암 환자의 생존률이 높게 나타나 이 마이크로RNA가 작동하면 유방암이 활발해진다고 해석할 수 있다. (c-d) miR-29의 조절 대상인 유전자 9개의 발현량을 실험을 통해 검증한 결과다. 이 마이크로RNA가 켜진 경우 해당 유전자 발현량이 줄어든 것을 보여준다. miR-29가 대상 유전자 9개를 조절한다는 것을 확인시켜주는 결과이다.

또한 미만성 거대 B세포 림프종이라는 질병의 발달을 억제하는 마이크로RNA도 예측해내 이 기법을 다른 여러 질병으로 확장할 수 있음을 보였다. 남 교수는 “BiMIR 데이터베이스를 통해서 누구나 마이크로RNA, 질병 등 세포 조건, 타깃 유전자 등에 대해서 마이크로RNA 조절 네트워크를 검색할 수 있다”며 “현재는 마이크로어레이 데이터 기반으로 만들었는데, RNA 시퀀싱 데이터도 충분해지면 더 다양한 세포 조건에서 더 정확한 네트워크 예측이 가능하다”고 덧붙였다.

한편 이번 연구는 윤소라 UNIST 생명과학부 박사가 제1저자로 참여했으며, 포스트게놈 다부처유전체사업 및 선도연구센터에서 지원받았다. 연구결과는 영국 옥스퍼드대학 출판사에서 발행하는 저명한 생물학 저널 ‘뉴클레익 에시드 리서치(Nucleic Acids Research, IF: 11.56)’ 3월 1일자 온라인판에 게재됐다.(논문명: Biclustering analysis of transcriptome big data identifies condition-specific microRNA targets 다운받기)

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지