딥러닝의 압축 과정에서 발생하는 성능 저하를 개선한 이진 네트워크 구조 탐색용 딥러닝 알고리즘을 개발

GIST AI대학원 최종현 교수

23일부터 28일까지 온라인으로 개최된 세계 최고 수준의 컴퓨터 비전 학술 대회인 '유럽 컴퓨터 비전 학회 2020(16Th European Conference on Computer Vision, ECCV)'에서 지스트(광주과학기술원, 총장 김기선) AI 대학원 최종현 교수팀이 AI배포(Deployment)를 위한 딥러닝의 압축 과정에서 발생하는 성능 저하를 개선한 이진 네트워크 구조 탐색용 딥러닝 알고리즘을 개발 제시했다.

기존에 제안된 네트워크 구조 탐색 방식이 부동소수점 형식의 파라미터를 갖는 고정확도 딥러닝에서만 동작하고 이진 네트워크를 탐색할 때에는 동작하지 않았다. 이진 네트워크는 용량이 현저히 작고 속도가 빠른 장점이 있지만 성능이 좋은 네트워크 구조를 찾아내는 것은 쉬운 일이 아니다.

이진 뉴럴 네트워크 개요
이진 뉴럴 네트워크 개요

연구팀은 이러한 문제점을 해결하기 위한 네 가지 요소기술을 제안하고, 제안한 기법으로 탐색한 이진 네트워크가 기존에 제안된 이진 네트워크 보다 크기는 작고 정확도는 높은 네트워크를 찾아냄을 확인했다.

연구팀으로(왼쪽부터) 김다현 EECS 석사과정생(2020년 지스트대학 졸업), 쿠날 프라탑 싱(IIT Roorkee 학부생, 지스트 컴퓨터비전 연구실 인턴)(사진:GIST)

지스트 AI대학원의 최종현 교수는 시각인식을 위한 효율적인 지도학습 및 모델 구조 등을 연구하고 있으며, 다수의 논문을 컴퓨터 비전 분야 세계 최고 수준의 학회 및 저널 등에 발표하고 있다. 최 교수는 2015년에 메릴랜드대학교 칼리지파크 캠퍼스(University of Maryland, College Park)에서 박사학위를 받은 후, 시애틀의 앨런 인공지능연구소(Allen Institute for AI)에서 연구원으로 근무, 지스트에는 지난 2018년에 부임하여 컴퓨터 비전 연구실을 운영하고 있다.

한편, 해당 연구는 올해 초 삼성 휴먼테크 논문상을 수상하였으며, 논문명은 '이진 네트워크를 위한 아키텍쳐 구조 학습(Learning Architectures for Binary Networks- 다운)'이며, 코드와 모델은 깃허브(다운)에 공개돼 누구나 다운받을 수 있다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지