도쿄대학 의과학연구소와 히타치의 슈퍼컴퓨터는 1.78페타플롭스의 연산 성능을 실현하고 인간 게놈 정보의 빠른 병렬 처리를 수행 프로그램에는 총 13,176 CPU 코어를 갖는 분산 메모리 형 서버와 AI에 의한 빠른 게놈 분석하는 프로그램용으로

슈퍼컴퓨터와 AI로 인간 '암 게놈' 해석 시간 80% 단축(사진:본지편집)

최근 인간 개개인의 체질, 병태(病態)에 있는 적절한 치료를 제공하기 위해서, 게놈 정보를 활용한 의료 발전이 혁신적으로 기대되고 있다.

특히 암 게놈 치료에서는 암세포의 게놈을 분석해 암의 원인이 된 게놈의 변이를 밝혀내 그 정보로부터 암의 취약점을 찾아내는 것과 효과가 기대되는 약제를 선택해 개인별 암의 특징에 맞는 보다 효과가 높은 치료를 제공하는 것을 목표로 하고 있다.

이에 도쿄대학 의과학연구소(Institute of Medical Science of the University of Tokyo, IMSUT) 인간 게놈 해석 센터와 히타치는 새로운 인간 게놈 해석용 슈퍼컴퓨터 시스템 '시로카네5(Shirokane5)'를 이용하여 암 게놈 의료에서 전체 게놈 자료 해석의 고속화를 위한 검증을 실시하고 분석 시간을 기존보다 약 80% 감소시키는데 성공했다고 10일 밝혔다.

또 방대한 인간 게놈 데이터에서 암의 원인이 된 게놈의 변이 부분을 검색부터 특정할 때까지 고속화하고 개개인의 체질, 병태에 따른 치료 방침을 신속히 제공하는 것과 게놈 해석정보를 활용한 개인화 치료 실현을 지원하는 것으로 일본이 최첨단 기술을 활용하여 사회문제를 해결하는 일명, '소사이어티5.0(Society)'에 공헌할 것이라고 밝혔다.

슈퍼 컴퓨터 시스템 Shirokane5 특징 및 개요

이번 검증은 시로카네 5와 게놈 데이터 분석프로그램을 이용해 게놈 해석을 고속으로 실행 가능한 환경에서 게놈을 분석해 도쿄대학 의과학연구소에서 지금까지 개발한 암 게놈 의료 워크 플로에 장착함으로써 기존 10시간 이상한 분석 시간을 약 80% 줄여 1시간 45분에서 해석에 성공한 것이다.

특히 혈액암(백혈병)은 주 단위, 때로는 하루사이에도 병태가 급격하게 악화하기도 하므로 단시간 내에 암의 원인이 된 게놈 변이를 특정해 효과적이라고 예측되는 치료 방침을 세우는 것이 치료의 효과를 높이는 열쇠가 된다. 또한 다른 암에서도 신속하게 게놈 해석으로 능동적인 대응으로 빠른 치료를 시작할 수 있게 함으로써 환자불안을 경감하고 치료효과를 높일 것으로 기대된다.

현재 게놈 연구에서 모든 게놈 정보를 이용한 성과가 속속 나오고 있지만 그 성과를 의료에 적용함에 있어 방대한 정보해석의 부담이 실현을 막는 장벽 중 하나였다. 본 검증을 통해 게놈 정보해석을 혁신적으로 단시간에 실시할 수 있게 하는 성과는 전게놈(genome-wide) 정보를 최대 활용한 미래의 암게놈 치료 실현에 크게 공헌할 것으로 기대된다.

또한 이번 검증은 시로카네5에 탑재되어 있는 GPU 80개 중 16개 만 사용했기 때문에 전 GPU을 가동시킨 경우 1년간 7만 검체의 전 유전체 데이터 해석이 가능하다고 한다. 이는 암세포와 정상 세포의 2개의 해석을 실시했던 암 게놈 치료에서 암 환자 수로 하면 약 3만 5천명의 전 유전체 데이터 해석이 가능하다는 것이다.

한편, 이번 검증에 사용된 고급 빅데이터 분석을 빠르게 처리하는 슈퍼컴퓨터 시로카네5는 1.78페타플롭스(Pflops=1초당 1천조번 연산 처리 성능)의 연산 성능을 실현하고 있다. 구체적으로는 인간 게놈 정보의 빠른 병렬 처리를 수행 프로그램에는 총 13,176 CPU 코어를 갖는 분산 메모리 형 서버와 AI에 의한 빠른 게놈 분석하는 프로그램용으로 엔비디아 테슬라(Tesla) V100 80기를 갖는 GPU 기반 서버, 그리고 인간 게놈 어셈블리 프로그램 등 대용량의 메모리를 필요로 하는 프로그램은 노드 당 3 TB의 메모리 용량을 갖는 대용량 메모리 서버를 탑재하고 있다.

또한 전력 소비의 효율화로 시로카네5는 환경 친화적인 시스템 운용으로 측정한 전력, 냉각 시스템의 각 팬의 전력 계산기의 동작 상태, 온도·습도 등의 다양한 정보를 수집하고 냉각 장치의 제어에 자동 피드백 시스템을 구성했다. 수집된 운영 정보에서 인간의 신경 회로망의 동작을 모방한 처리 모델을 이용해 학습시키고 최적화와 효율화한다. 이로 인해, 냉각 장치의 과도한 동작을 억제하고 소비 전력을 대폭 절감하고 있다.

아울러 뛰어난 보안 환경의 안정적 가동을 실현으로 인간게놈 소유자의 개인정보를 엄격하게 관리하기 위해 철저한 보안을 확보하고 연구자나 시스템 운용자가 소유자 개인을 특정 하는 일이 없도록 필요에 따라 익명화 절차를 밟고 있으며, 인간 게놈 정보를 취급하는 시스템 영역을 외부의 인터넷과 격리하고 인증에 생체 인증을 채용하는 등 높은 보안성을 확보하고 있다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지