칩은 TSMC 28nm 공정의 20mm2 크기이며, 총 20만개의 뉴런에 대해 로컬 뉴런·시냅스 메모리가 장착된 196개의 뉴런 코어로 조직된다.

이는 대기시간이 중요한 호스트 프로세서의 AI 작업 부하를 해소하는GPIO(다용도 입출력)를 제공한다. 뉴런 코어 100% 활용시 칩은 불과 35mW 전력을 소비한다.

이미지:본지DB

최근 글로벌 IT기업들은 고성능 컴퓨팅, 서버 또는 엣지 애플리케이션 등 심층 학습과 추론에 특화된 새로운 인공지능(AI) 칩 개발에 무한 경쟁을 벌이고 있다. AI 애플리케이션 공간을 위해 초당 수백 테라(Tops)의 작업을 수행할 수 있는 칩을 기술적으로 제조하는 것은 가능하지만, 원하는 컴퓨팅 능력은 여전히 기대치를 밑돌고 있다.

이런 가운데 인간의 뇌를 모사한 인공지능 컴퓨팅 칩인 뉴로모픽(Neuromorphic) 칩은 기존의 반도체 칩이 갖는 전력 확보 문제를 해결할 수 있고 데이터 처리 과정을 통합할 수 있어 차세대 기술로 주목된다. 이 뉴로모픽 칩이 상용화의 첫발을 내딛었다.

프랑스 파리, 네덜란드 에인트호벤, 실리콘밸리 산호세에 사무소를 두고 있는 팹리스 반도체 스타트업 'GrAI 매터 랩(GrAI Matter Labs. 이하, GML)'이 뉴런플로우(NeuronFlow) 기술을 기반으로 한 초저지연 저전력 엣지 프로세싱에 최적화된 세계 최초의 AI 칩인 'GrAI 원(GrAI One)'을 23일(현지시각) 발표했다. 이 칩은 4분기에 샘플링을 시작할 예정이다.

GML의 파리 연구팀으로 원내는 CEO 잉골프 헬드(사진:GML홈페이지 캡처 및 편집)

이 칩은 응용프로그램 대기시간을 대폭 줄여준다. 예를 들어, 파일럿넷(PilotNet)과 같은 딥러닝 네트워크의 종단 간 대기시간이 마이크로초 단위로 감소된다.

또한 뉴런플로우는 동적 데이터 흐름 패러다임과 뉴로모픽 컴퓨팅(Neuromorphic computing)을 결합하여 프로그래밍 가능한 대규모 병렬 컴퓨팅 기술을 통해 이전에는 불가능했던 저전력 수준에서 멀티모달(multimodal) 센서 분석 및 동적 머신러닝을 클라우드 컴퓨팅 지원없이 사물 인터넷의 모든 엣지 디바이스에 AI를 제공한다고 한다.

칩은 TSMC 28nm 공정의 20mm2 크기이며, 총 20만개의 뉴런에 대해 로컬 뉴런·시냅스 메모리가 장착된 196개의 뉴런 코어로 구성된다. 이는 대기시간이 중요한 호스트 프로세서의 AI 작업 부하를 해소하는GPIO(다용도 입출력)를 제공한다. 뉴런 코어 100% 활용시 칩은 불과 35mW 전력을 소비한다.

또한 자사의 GrAI플로우(GrAIFlow) 소프트웨어 개발 키트의 지원을 받는다. 텐서플로(TensorFlow), 파이썬(Python), C++와 같은 업계 표준 프로그래밍 언어를 통해 기존의 프로그램 실행과 머신러닝 컴퓨팅 작업을 할 수 있다. 이 키트에는 컴파일러, 시뮬레이터, 디버거, 그래픽 에디터, 컴퓨팅 및 네트워크 API가 포함된다.

GrAI플로우는 현재, 아키텍처 평가 및 응용프로그램 프로그램을 위해 조기 액세스 고객들에게 제공되고 있다.

GML의 CEO 잉골프 헬드(Ingolf Held)는 “GrAI 원은 배터리 기반 기기에 알맞은 전력 소비 수준을 유지하면서 기존의 아키텍처보다 빠른 첨단 AI 응용프로그램 명령을 처리한다. 우리는 GrAI플로우를 통해 고객들에게 새로운 초저지연 사용 사례를 모색할 수 있는 기회를 제공함으로써 모든 엣지 디바이스의 혁신을 도모할 수 있게 도와준다”고 말했다.

한편, GML은 2016년 파리의 iBionext Start-up Studio에서 설립됐으며, 지난 4월 Series A 파이낸싱 라운드를 1500 만 달러(약 176억원)에 마감했으며, 현재 아이바이오넥스트(iBionext), 360캐피털 파트너스(360 Capital Partners), 3T 파이낸스(3T Finance) 등 대표적인 투자사의 지원을 받고 있다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지