한국시간 16일 오후 3시,라이브 스트림 'Baidu ERNIE Bot Press Conference' 통해 공개

"에니봇에서 어떤 기능을 사용할 수 있기를 원하십니까?"라는 트윗 이미지 캡처
"에니봇에서 어떤 기능을 사용할 수 있기를 원하십니까?"라는 트윗 이미지 캡처

오픈AI, 마이크로소프트, 구글, 메타 등 생성 인공지능(Generative AI) 이슈가 고조되는 가운데 중국 바이두(Baidu)가 오픈AI의 '챗GPT(ChatGPT)' 스타일의 인공지능 챗봇 '어니봇(Ernie Bot)'의 내부 테스트를 완료하고 16일 오후 2시(UTC+8, 한국시간 오후3시) 라이브 스트림 'Baidu ERNIE Bot Press Conference'를 통해 공개한다.

바이두는 어니봇 '어니'는 바이두의 오픈소스 딥러닝 플랫폼인 패들패들(PaddlePaddle)에서 개발되었으며 '지식 통합을 통한 향상된 표현'을 의미하며 2019년에 출시된 AI 대형언어모델과 그 세 번째 버전은 2020년 5월에 출시되었다. 이번 발표되는  어니봇은 2021년 더욱 진화된 '어니3.0(ERNIE 3.0)'을 기반으로 언어 이해, 언어 생성, 텍스트-이미지 생성 등의 작업을 수행할 수 있다. (아래는 공개될 실시간 바이두 유튜브 채널)

 

그러나 중국 규제 당국은 이미 중국 기술 기업들에게 AI 챗봇을 대중에게 공개하지 말 것을 요청한바 있으며, 반도체 부족으로 인해 기한을 맞추려는 바이두의 노력에 차질을 빚고 있어 '어니 봇'은 초기 단계에서는 사내 용으로 제한될 예정이라고 알려져 있으나 지켜볼 일이다.

ERNIE 3.0의 프레임워크 개요(논문 캡처)
ERNIE 3.0의 프레임워크 개요(논문 캡처)

한편, '어니3.0(ERNIE 3.0)'은 2021년 7월 5일 아카이브를 통해 '어니 3.0: 언어 이해 및 생성을 위한 대규모 지식 강화 사전 교육(Ernie 3.0: Large-scale knowledge enhanced pre-training for language understanding and generation-다운)'란 제목으로 공개됐다.

자동 회귀 네트워크와 자동 인코딩 네트워크를 융합하여 학습된 모델을 제로샷 학습, 퓨샷 학습 또는 미세 조정을 통해 자연어 이해 및 생성 작업 모두에 맞게 쉽게 조정된다. 일반 텍스트와 대규모 지식 그래프로 구성된 4TB 말뭉치에서 100억 개의 매개변수로 모델을 학습했다.

또한 이 모델은 54개의 중국어 자연어처리(NLP) 작업에서 최신 모델을 능가하며 영어 버전은 SuperGLUE 벤치마크(2021년 7월 3일)에서 1위를 달성하여 인간 성능을 +0.8% 능가했다(90.6% 대 89.8%).

 

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지