기존 PIM 반도체는 정수 단위만 연산이 가능하였으나, 이번 연구를 통해 세계 최초로 소수점(Floating-Point) 기반 연산(추론 및 학습 모두 가능)이 가능한 ...

유회준 교수는 “이번 연구는 한 개의 반도체에서 심층 신경망을 높은 압축을 유지한 상태로 추론 및 학습을 가능하게 하였으며, 특히 불가능이라 여겨졌던 소수점 연산이 가능한 인공지능 칩 기술을 개발했다는 점에서 의미가 크다"고 말했다.(사진:본지DB)
유회준 교수는 “이번 연구는 한 개의 반도체에서 심층 신경망을 높은 압축을 유지한 상태로 추론 및 학습을 가능하게 하였으며, 특히 불가능이라 여겨졌던 소수점 연산이 가능한 인공지능 칩 기술을 개발했다는 점에서 의미가 크다"고 말했다.(사진:본지DB)

인공지능(AI)이 게임에서 인간을 이길 정도로 똑똑해 졌으며, 백만명중에서 범법자를 3초만에 찾아내고 AI를 이용하여 질병 및 기타 건강 상태를 예측하고, 소셜 네트워크에서는 자살하려는 의도를 가진 사람을 찾아내기 시작했다.

또한 음악을 작곡하고 영화 대본을 작성하는 등 더 빠르고 똑똑한 인공지능을 위한 기반을 마련하고 다양한 분야에서 급속한 진전을 보였지만 여전히 갈 길은 멀다.

또한 인공신경망(Neural Network)이 더 심층적이고 복잡해짐에 따라 요구하는 사항은 다양해지면서 급속히 증가하고 있다. 뉴럴 네트워크 아키텍처(Neural Network Architecture)는 새로운 네트워크가 끊임없이 개발되고 새로운 응용 프로그램과 시장이 계속 출현하면서 수시로 변하고 있다.

저전력으로 고도의 프로그래밍이 가능한 고성능 범용 신경망 프로세싱 솔루션의 필요성은 더욱 커지고 있다.

이 가운데 KAIST(총장 이광형) 전기 및 전자공학과 유회준 교수 연구팀이 구글 딥마인드에서 개발한 바둑 인공지능 프로그램인 ‘알파고’에서 활용되었던 심층강화학습(Deep Reinforcement Learning, DRL)을 높은 성능과 전력효율로 처리할 수 있는 첨단 인공지능 반도체 기술을 개발했다.

 AI 모바일 칩 
 AI 모바일 칩 

심층강화학습 알고리즘은 정답이 주어지지 않은 상황에서 최적의 답을 빠르게 찾기 위해 여러 개의 신경망을 동시에 사용하는 특징이 있다.

하지만 신경망이 복잡하게 얽혀있고 대규모 데이터를 처리해야 하기 때문에 기존에는 대용량 메모리를 가진 다수의 고성능 컴퓨터를 병렬 활용해야만 구현 가능하였으며, 연산 능력이 제한적이고 사용되는 메모리가 적은 노트북, 스마트폰 등에서는 구현이 불가능하였다.

연구팀은 모바일 기기 등에서도 모든 심층강화학습 알고리즘을 처리 가능한 기존 대비 성능이 우수하고, 전력효율이 2.4배 높은 인공지능 반도체 기술인 ‘OmniDRL’을 개발하였다. ‘OmniDRL’는 Omni(모든) +DRL(심층 강화학습)의 합성어다.

구체적으로 심층신경망 데이터(가중치)에 대한 압축률 증가(연산에 불필요하거나 중복된 데이터 개수 감소), 데이터 압축 상태로 연산(기존 반도체는 압축 해제 필요), 연산 및 저장 기능이 통합된  SRAM(Static RAM) 기반의 PIM(Processing-In-Memory) 폰노이만 컴퓨터 구조를 탈피하여 프로세서-메모리 간 데이터 병목현상 및 전력소모 문제 해결한 반도체 기술을 사용하였다.

특히, 기존 PIM 반도체는 정수(Integer) 단위만 연산이 가능하였으나, 이번 연구를 통해 세계 최초로 소수점(Floating-Point) 기반 연산(추론 및 학습 모두 가능)이 가능한 기술을 개발하였다.

‘OmniDRL’을 심층 강화학습 알고리즘의 성능 비교 연구에 주로 활용되는 ‘인간형 로봇 적응 보행 시스템’에 적용한 결과, ‘OmniDRL’이 연결되지 않았을 때보다 7배 이상 빠른 속도로 적응 보행이 가능하였다.(아래 영상 참조)

유회준 교수는 “이번 연구는 한 개의 반도체에서 심층 신경망을 높은 압축을 유지한 상태로 추론 및 학습을 가능하게 하였으며, 특히 불가능이라 여겨졌던 소수점 연산이 가능한 인공지능 칩 기술을 개발했다는 점에서 의미가 크며, 향후 지능형 로봇 조종, 자율주행 드론, 게임 등 다양한 분야에 응용이 가능할 것으로 기대된다.”고 연구의 의의를 설명했다.

과기정통부 송경희 인공지능기반정책관은 “이번 연구는 반도체 분야의 새로운 패러다임인 인공지능 반도체 분야에서 국내의 연구결과를 국제적으로 인정받았다는 점에서 의미가 크다”고 말했다.

이어 송경희 정책관은 "과기정통부는 앞으로 지난해 착수한 1조원 규모의 인공지능 반도체 연구개발(R&D)을 지속 지원하는 한편, 내년부터 4,000억원 규모의 PIM 반도체 기술 개발 사업을 본격적으로 추진하는 등 인공지능 반도체 분야에 대한 투자를 지속 확대해 나갈 계획이다”라고 밝혔다.

한편, 이번 연구는 과기정통부 ‘혁신성장 연계 지능형반도체 선도기술 개발’ 사업의 지원(‘19∼’21년, 총 18억원)을 받아 수행되었으며, 지난달 14일부터 19일까지 개최된 반도체 분야 학회‘IEEE VLSI(Very Large Scale Intergrated Circuit) 기술 및 회로에 대한 심포지엄(VLSI Symposia)’에서 'OmniDRL: A 29.3 TFLOPS/W Deep Reinforcement Learning Processor with Dual-Mode Weight Compression and On-Chip Sparse Weight Transposer'이란 제목으로 200여 편의 발표 논문 중 우수 논문인 하이라이트 논문으로 선정되는 등 큰 주목을 받았다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지