1엑사 플롭스 뛰어넘는 국내 최대 규모 수준...한국어 초거대 언어모델 ‘KoGPT’ 성능 100배 향상 목표

카카오브레인(대표 김일두)이 구글에서 개발한 텐서 처리 장치인 ‘구글 TPU’를 활용해 1엑사 플롭스(컴퓨터의 연산 속도 단위/초당 100경 연산처리)를 뛰어넘는 국내 최대 규모의 딥러닝 슈퍼컴퓨팅 인프라를 도입했다.

이를 통해 한국어 특화 초거대 AI 언어모델 ‘KoGPT’ 의 연구 효율을 기존 대비 100배 이상 높인다는 목표다.

‘구글 TPU’는 구글 클라우드에서 사용할 수 있는 대용량 연산 인프라로 데이터를 빠르게 계산하고 가공할 수 있는 장치다. GPU(Graphic Processing Unit, 3D 그래픽 연산을 위한 전용 프로세서)를 여러 대 컴퓨터에 분할해 설치/사용하지 않고, GPU보다 빠르고 복잡한 연산을 갖춘 상위 시스템을 슈퍼컴퓨터 한 대에 구축해 활용한다.

높은 연산 처리 성능으로 AI 연구모델 연산 속도를 획기적으로 향상시킬 수 있고, 클라우드 방식을 활용함으로써 다수의 연구자들이 유연하게 시스템에 접속/사용이 가능해 연구 효율을 높일 것으로 기대된다..

구글 TPU(Tensor Processing Unit)은 언어, 번역, 포토, 검색, 어시스턴트 등 커스텀 머신러닝 ASIC이다
구글 TPU(Tensor Processing Unit)은 언어, 번역, 포토, 검색, 어시스턴트 등 커스텀 머신러닝 ASIC이다

최기영 구글 클라우드 코리아 사장은 “새로운 시대를 여는 한국어 초거대 AI 모델 개발에 구글 클라우드가 함께 할 수 있어 매우 의미 있게 생각한다”라며 “앞으로도 구글 클라우드의 강력한 AI 및 머신러닝 인프라를 기반으로 한국 기업과 연구 기관이 다양한 분야에서 혁신을 가속화할 수 있도록 적극 지원하겠다”라고 강조했다.

카카오브레인 김일두 대표는 “KoGPT를 비롯한 언어모델을 비롯해 향후 공개할 비전 모델 등 초거대 AI의 다양한 모델에 슈퍼컴퓨터를 활용함으로써 연구 효율을 크게 높일 것으로 기대된다" 며 "다양한 언어 모델을 준비해 오픈 소스화함으로써 국내외 AI 생태계를 구축하는데 기여하고자 한다” 고 밝혔다. 

한편, 60억개의 매개변수와 2000억개 토큰(token)의 한국어 데이터를 바탕으로 지난 18일 오픈소스로 공개한 ‘KoGPT’는 Open AI의 언어 모델 ‘GPT-3’를 고도화한 한국어 특화 버전이다.

추후 카카오는 한국어 뿐만 아니라 영어, 일본어 모델도 준비해 오픈소스화한다. 베트남어, 말레이시아어 등 동남아시아 언어도 준비해 더 많은 곳에서AI 기술의 혜택을 누릴 수 있도록 할 예정이다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지