인공지능 반도체 프로세서가 곧, 4차 산업혁명시대를 주도할 것으로 예상되기 때문이다.

바이두의 쿤룬 AI칩(사진:바이두)
바이두의 쿤룬 AI칩(사진:바이두)

바이두(Baidu Inc.)가 중국 최초 클라우드-투-엣지(cloud-to-edge) AI 칩 쿤룬(Kunlun)을  4일부터 5일까지 양일간 북경 베이징 컨벤션 센터에서 개최된 바이두 AI 개발자 컨퍼런스(BaiduCreate 2018)에서 선보였다. 쿤룬은 다양한 AI 활용 시나리오에 필요한 고성능 요건을 충족하는 제품이다. 이번에 발표된 제품은 학습용 칩 ‘818-300’과 추론용 칩 ‘818-100’으로 구성되었으며, 쿤룬은 데이터센터, 공공 클라우드, 자율주행차 등 클라우드와 엣지 시나리오에 모두 적용 가능하다. 

또한 쿤룬은 비용 효율적인 고성능 솔루션으로, AI 구현에 필요한 대규모 프로세싱 수요에 부합한다. 쿤룬이 사용하는 바이두의 AI 생태계는 검색 랭킹과 패들패들(PaddlePaddle)과 같은 오픈소스 딥러닝 프레임워크 프레임워크 등 AI 시나리오를 포함한다. 바이두는 이러한 AI 서비스와 프레임워크의 성능을 최적화하는 데 다년간 경험을 쌓았고 이를 바탕으로 세계적 수준의 AI 칩 설계에 필요한 전문성을 갖추었다. 

바이두는 2011년 딥러닝을 구현할 FPGA 기반 AI 가속기 개발에 착수했고, 데이터센터에 GPU를 도입했다. 수천개의 소형 코어로 구성된 쿤룬은 기존의 FPGA 기반 가속기보다 30배가량 빠른 컴퓨팅 능력을 지녔다. 이 밖에 주요 사양으로 삼성의 14nm 공정, 512 GB/s 메모리 대역폭, 260TOPS, 100와트 소비전력 등이 있으며, 쿤룬 칩은 일반적인 오픈소스 딥러닝 알고리즘을 지원하며 음성인식, 검색 랭킹, 자연언어 프로세싱, 자율주행, 대규모 추천 서비스 등 다양한 분야의 AI 애플리케이션을 지원한다. 

최근 AI 애플리케이션이 빠르게 확산하면서 컴퓨팅 파워의 필요성이 급격히 증가했다. 기존의 칩 제품은 구현할 수 있는 컴퓨팅 파워가 제한적이다 보니 AI 기술을 가속화하는 데 한계를 보이고 있는 가운데 이번 바이두의 가세와 기존 인텔의 로이히(Loihi), 엔비디아의 테슬라 P100(Tesla P100), 애플의 뉴런엔진(Neural Engine), 화웨이의 기린 970(KIRIN 970), 구글의 TPU(Tensor Processing Unit) 등 4차 산업혁명이란 새로운 황금기를 맞아 무한경쟁 시대로 이끌고 있는 글로벌 기업들은 기존보다 더 뛰어난 인공지능 칩 개발에 박차를 가하고 있다.

또한 일론 머스크의 테슬라가 자동운전을 위한 인공지능(AI) 칩을 개발하고 있는 등 수요자 중심으로 특화된 인공지능 칩 개발에 매진하고 있다. 이는 기존 반도체 칩 업체에 대한 또 다른 도전이지만 국내 역시, 현재 메모리 반도체 선두를 달리는 삼성전자·SK하이닉스에만 의존할 것이 아니라 설계와 생산, 메모리뿐만 아니라 비메모리(시스템) 등 반도체 산업 생태계를 확대할 필요가 대두되고 있는 시점이다. 인공지능 반도체 프로세서가 곧, 4차 산업혁명시대를 주도할 것으로 예상되기 때문이다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지