딥러닝 학습시간 획기적으로 줄이는 컴퓨팅 기술 개발
딥러닝 학습시간 획기적으로 줄이는 컴퓨팅 기술 개발
  • 최광민 기자
  • 승인 2019.09.10 22:30
  • 댓글 0
이 기사를 공유합니다

ETRI, 국내 AI 컴퓨팅 인프라 발전에 마중물 역할 기대...초보 개발자도 쉽고 빠르게 AI모델 생성 가능한 환경도 구축
ETRI 연구진이 개발한 메모리박스를 서버에 장착 후 관련 논의를 하는 모습으로 왼쪽부터 안신영 책임연구원, 최용석 책임연구원(사진:ETRI)

한국전자통신연구원(ETRI) 연구진이 AI 딥러닝 학습시간을 획기적으로 줄이는 컴퓨팅 기술을 개발했다. 이 기술은 국내 AI 컴퓨팅 인프라를 향상시키고 AI 모델을 개발하거나 서비스를 구현하는데 큰 도움이 될 전망이다.

일반적으로 딥러닝은 컴퓨터가 사람처럼 생각하고 배울 수 있도록 하는 기술이다. 하지만 컴퓨터 역시 대규모 영상, 이미지, 음성 등의 데이터나 모델을 학습하는 데는 많은 시간이 걸린다. 이 기술을 적용하면 학습하는데 일주일이 걸리던 AI 모델을 같은 환경에서 단 1~2일 만에 학습할 수 있다. 이는 최대 4배 효율을 내는 셈이다.

이때 대규모 데이터를 처리하려면 여러 대의 컴퓨터를 활용해 학습 시간을 줄이는‘분산 학습’기술이 사용된다. 컴퓨터 하나로만 공부하지 않고 여러 대의 컴퓨터로 동시에 공부시켜 학습 분량을 분담해 시간을 단축시키는 기술이지만 분산 학습 기술도 대용량 모델을 여러 컴퓨터에서 동시에 실행하면 통신 병목 현상이 발생하는 한계가 있었다. 컴퓨터들 간 통신량이 많다 보니 특정 지점에서 성능이나 용량이 저하되는 현상이 나타나는 것이다.

ETRI 연구진이 개발한 딥러닝 대시보드에서 인공지능 모델 학습 후 속도를 측정하는 모습으로 왼쪽부터 임은지 책임연구원, 박유미 클라우드기반SW연구실장(사진:ETRI)
ETRI 연구진이 개발한 딥러닝 대시보드에서 인공지능 모델 학습 후 속도를 측정하는 모습으로 왼쪽부터 임은지 책임연구원, 박유미 클라우드기반SW연구실장(사진:ETRI)

이를 해결하는 방법 중 하나는 컴퓨터의 계산 및 처리 능력을 담당하는 중앙처리장치(CPU) 혹은 그래픽처리장치(GPU)의 성능을 높이는 것이다. 그러나 이 방법은 장비를 계속 업그레이드해야 하는 비용 부담이 크다. 반면 ETRI는 `메모리 박스(Memory BoxTM)' 라 불리는 공유기억장치를 개발해 분산 학습시 발생하는 통신 병목현상을 해소함으로써 학습 시간을 단축시켰다.

메모리 박스는 컴퓨터들 중간에 위치해 각 컴퓨터들이 학습한 것을 서로 공유하도록 돕고 통신량을 줄여준다. 일종의 가상 공유 메모리 역할을 수행하는 것이다.

공유 메모리 동작 개념도
공유 메모리 동작 개념도

특히, 이 기술을 이용하면 대대적인 장비 교체 없이 최소 투자로 동일한 환경에서 딥러닝 학습 시간을 대폭 줄일 수 있으며 하드웨어(HW)와 소프트웨어(SW) 형태를 모두 제공할 수 있어 수요자 맞춤형 기술 이전이 가능해 질 것으로 예상된다. 연구진은 8개의 GPU를 사용, 이를 통해 1,000가지 종류의 이미지 128만 장(Image Net Dataset)을 분류하는 모델을 1만 번 반복 학습하는 실험을 진행한 결과, 기존 서버 방식이 16분 23초가 걸린 반면 본 기술을 이용한 방식은 7분 31초가 걸렸다고 한다.

그동안 아마존, 구글, MS 등 글로벌 IT 기업들은 자사 소스코드를 공개하거나 대규모 컴퓨팅 자원을 클라우드 형태로 제공하며 개발자들을 유인하고 AI 컴퓨팅 인프라 시장의 점유율을 높여왔다. 이로 인해 AI를 연구하는 국내 기업이나 기관들은 외국 기업들의 서비스에 의존하거나 많은 비용을 들여 자체 서버를 구축해야 했다.

이에 ETRI 연구진은 국내 개발자들이 손쉽게 딥러닝 연구를 진행할 인공지능 컴퓨팅 환경을 제공하기 위해 `딥러닝 대시보드'도 개발했다. 대시보드는 그래픽 기반 개발 환경을 제공해 개발자들이 코드를 하나하나 입력할 필요가 없다. 덕분에 학습시간은 물론 모델 개발 시간을 단축시키는데도 도움을 준다. AI 개발에 주로 쓰이는 도구들도 지원해 대시보드상에서 개발한 그래픽 모델을 학습할 수 있다.

딥러닝 대시보드 개발 배경 설명
딥러닝 대시보드 개발 배경 설명

또한 해상도가 높은 의료 영상 분석이나 방대한 이미지 분석 등 딥러닝 및 인공지능이 필요한 다양한 산업 분야에서 활용이 가능하다. 특히, 컴퓨팅 환경이 열악한 중소기업, 학교, 스타트업에서도 ETRI 기술을 활용한다면 개발 시간과 비용을 대폭 절약할 수 있다.

현재 연구진은 본 기술과 관련된 논문 14편 및 13건의 특허도 출원된 바 있으며, 개발한 딥러닝 고속 처리 시스템 기술은 현재, 연구진은 두 개의 중소기업이 기술을 이전받아 연구소기업 설립을 추진 중이며 해당 기업을 통해 내년 상용화를 목표로 하고 있다.

한편, 이 기술은 과학기술정보통신부의 “대규모 딥러닝 고속처리를 위한 HPC 시스템 개발”사업의 일환으로 개발됐으며, 사업책임자인 ETRI 인공지능연구소 최완 책임연구원은“글로벌 기업이 독식하고 있는 인공지능 컴퓨팅 인프라 시장을 우리 기술로 대체하고 고난이도 딥러닝 기술과 독자적인 인공지능 슈퍼컴퓨팅 시스템을 개발하는데 도움이 되기를 바란다”고 말했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.