1,750억개 매개변수의 새로운 '브렌더봇 3'는 이전 모델 블렌더봇 2와 비교해 58배 크기로 대화 작업에서 31% 향상되었으며, 지식은 두 배나 되는 반면, 사실이 아닌 경우는 47% 더 축소됐다.

지금까지 대화형 언어 인공지능(AI)에 대한 기존의 공개 연구는 통제된 환경에서 주석자와의 인간 모델 대화에 초점을 맞췄다. 그러나 연구자가 연구 환경에서만 모든 대화 시나리오를 예측하거나 시뮬레이션 할 수는 없다.

AI 언어 인공지능 모델은 인간처럼 우리를 이해하고, 참여하며, 대화할 수 있는 진정한 지능형 AI 시스템과는 아직 거리가 멀다. 실제 환경에 더 적응할 수 있는 모델을 구축하기 위해서는 AI는 사람들과 함께 다양하고 광범위한 시각에서 학습해야 한다. 이것들은 아직 미해결 문제이며, 공동체에 의해 수행되어야 하는 새로운 연구가 지속적으로 필요하다.

그런 가운데 지난 몇 년 동안, 메타 AI는 블렌더봇(BlenderBot)과 그 후속 제품인 '블렌더봇 2'와 함께 더 스마트한 대화형 AI 시스템을 구축하는 데 흥미로운 진전을 이루었다.

메타의 블렌더봇(BlenderBot) 시리즈는 성격, 공감, 지식과 같은 대화 기술을 결합하여 장기 기억을 통합하고 의미 있는 대화를 수행하기 위해 인터넷을 검색하는 데 진전을 이뤘다.

여기에, 인터넷을 검색하여 거의 모든 주제에 대해 이야기할 수 있는 대화형 인공지능 새로운 버전인 1,750억개 매개변수의 '브렌더봇 3(BlenderBot 3)'을 5일(현지시간) 오픈소스로 공개했다.

 실시간 대화형 인공지능 '블렌더봇 3' 이미지(사진:메타)

실시간 대화형 블렌더봇 3는 메타AI의 이전 모델로 공개적으로 사용 가능한 OPT-175B(Open Pretrained Transformer-다운) 인공지능 언어 모델인 '브렌더봇 2(BlenderBot 2-)' 보다 58배 크기로 구축되었다. 

또한, 이전 블렌더봇 2와 비교해 대화 작업에서 31% 향상되었으며, 지식은 두 배나 되는 반면 사실이 아닌 경우는 47% 더 적다. 

일반적으로 거의 모든 대화형 AI 챗봇은 때때로 안전하지 않거나 편향되거나 공격적(폭언, 선정 등)인 발언을 모방하고 생성하는 것으로 알려져 있기 때문에 메타AI는 공개 이전까지도 대규모 연구를 수행하고 워크샵을 공동 주최하고 BlenderBot 3에 대한 보호 장치를 만들기 위한 새로운 기술을 적용했다고 밝혔다. 

특히, 블렌더봇 3는 현실 세계의 사람들과 상호 작용할 수 있도록 더 길고 다양한 대화와 다양한 피드백을 제공한다. 예를 들어, "좋아요" 또는 "싫어요" 아이콘을 클릭하면 BlenderBot 3은 각 채팅 메시지에 반응할 수 있다. 만약, "싫어요"를 선택하면 주제에서 벗어난 메시지인지, 무의미한 메시지인지, 무례한 메시지인지, 스팸 같은 메시지인지 등 메시지를 싫어한 이유를 설명할 수 있으며, 채팅 자체에서 피드백을 제출할 수도 있다.

스스로 개선하는 안전한 챗봇

블렌더봇3은 거의 모든 주제에 대해 말할 수 있다.(사진:메타)
블렌더봇3은 거의 모든 주제에 대해 말할 수 있다.(사진:메타)

사람들과 소통하는 BlenderBot 3의 능력을 향상시키기 위해 메타는 공개적으로 사용 가능한 많은 언어 데이터를 사용하여 훈련했다. 사용된 데이터 세트는 1,000개 이상의 대화 주제에 기반한 20,000개 이상의 사람들과의 대화로 구성된 하나의 새로운 데이터 세트를 포함했다.

BlenderBot 3은 건강한 요리법에 대해 이야기하는 것부터 도시에서 어린이 친화적인 편의 시설을 찾는 것에 이르기까지 사람들이 가장 중요하다고 생각하는 기술을 향상시키기 위해 대화를 통해 스스로 학습되도록 훈련되었다. 또, 챗봇의 반응이 불만족스러울 경우 피드백을 수집한다. 이 데이터를 통해 실수를 반복하지 않도록 모델을 개선할 수 있다.

이는 챗봇을 사용하는 모든 사람이 좋은 의도를 갖고 있는 것은 아니라는 점을 이해하고 도움이 되는 응답과 유해한 예를 구별하기 위해 메타는 두 가지 머신러닝 기술인 SeKeR(오픈 소스 검색 강화 언어 모델-다운)과 Director(지도 언어 모델링을 위한 생성기·분류기-다운)를 결합하여 상호 작용과 피드백을 통해 학습하는 새로운 학습 알고리즘을 적용해 시간이 지남에 따라 모든 사용자에게 보다 책임감 있고 안전한 모델을 구현한다.

그러나, 메타AI는 BlenderBot 3은 공개적으로 사용 가능한 인공지능 챗봇 생태계를 크게 발전시킬 수 있지만 아직 인간 수준은 아니며, 때때로 부정확하고 일관성이 없으며 주제에서 벗어날 수 있다며, 더 많은 사람들이 챗봇에 상호 작용함에 따라 이 피드백을 사용하여 모델을 개선하고 더 넓은 AI 커뮤니티에 도움이 되도록 데이터와 플랫폼을 지속적으로 개선할 것이며, 사용자에게는 안전하고 도움이 되는 방식으로 AI 시스템 구축에 박차를 가하는 데 도움이 되기를 기대한다고 밝혔다.

한편, 블렌더봇 3는 관련 연구 논문 '블렌더봇3: 책임감 있게 참여하는 방법을 지속적으로 학습하는 배치된 대화형 에이전트(BlenderBot 3: a deployed conversational agent that continually learns to responsibly engage-다운)', 코드(다운), 데이터 세트(다운) 및 모델 카드(다운)를 오픈 소스로 공개했다. 그러나, 실시간 대화형 AI '블렌더봇 3' 데모(프로토타입-보기)는 현재, 미국에서만 이용할 수 있다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지