뛰어난 성능과 사람처럼 구사하는 AI 챗봇 블렌더(이미지:본지)

페이스북 AI 리서치(Facebook AI Research, FAIR)가 현재까지의 어떤 모델보다 성능이 뛰어나고 더 인간적인 느낌을 줄 수 있는 새로운 인공지능(AI) 챗봇 ‘블렌더(Blender)’를 발표하고 이를 지난달 29일 오픈 소스로 공개했다.

오픈 도메인 챗봇을 구축하는 것은 머신러닝 연구에서 매우 어려운 영역이다. 이전 페이스북 AI 연구에서는 신경 모델을 파라미터의 수와 데이터 크기에 맞게 스케일링하면 개선된 결과를 얻을 수 있다는 것을 보여주었지만, 대화를 잘 하려면 대화 에이전트가 다양한 조건을 매끄럽게 혼합하는 여러 가지 기술이 필요하다.

즉, 질문과 답변 모두 상대방의 말을 듣고, 상황에 따라 지식, 공감과 사람에게 투사된 성격을 뜻하는 페르소나(Persona)를 적절하게 표현해야 한다.

이번 개발에서 페이스북 AI 연구팀은 대규모 모델들이 적절한 훈련 데이터와 발전 전략의 선택권이 주어졌을 때 이러한 기술을 학습할 수 있다는 것을 보여준 것으로 90M, 2.7B, 9.4B 매개변수 신경모델로 이러한 레시피의 변형을 만들고, 블렌더(Blender)라는 명으로 모델과 코드를 누구나 사용할 수 있도록 공개한 것이다.

특히, 모델이 포용성과 인간성 측정 면과 멀티턴 대화에서 기존 접근 방식보다 우수하다는 것을 보여줬다.

블렌더는 다양한 기술을 갖추고 있다. 추출된 대화에 대한 15 억 개의 교육 예제를 포함하여 챗봇을 만들기 위한 대규모 학습을 수행했다. 또한 열 단위의 모델 병렬 처리를 활용하여 신경 네트워크를 더 작고 관리하기 쉬운 조각으로 분할하면서 최대 효율을 유지할 수 있었다.

예제와 함께 코드로 크라우드 워커와 대화 로그로 9.4B와 대화하는 논문 작성자(왼쪽), 파라미터 모델(오른쪽) 사진은 아래 논문 '오픈 도메인 챗봇 구축을 위한 방법' 캡처
예제와 함께 코드로 크라우드 워커와 대화 로그로 9.4B와 대화하는 논문 작성자(왼쪽), 파라미터 모델(오른쪽) 사진은 아래 첨부 논문 '오픈 도메인 챗봇 구축을 위한 방법' 캡처

또한 이러한 바람직한 BST(Blended Skill Talk) 기술을 훈련하고 평가하기 위한 블렌딩(혼합) 기술을 학습했다. 여기에는 지식의 포용적 사용, 공감의 표시, 그리고 세 가지 모두를 매끄럽게 혼합할 수 있는 능력이 포함된다.

연구팀은 사람이 농담에서 진지한 태도로 바뀔 때 톤(억양)을 조정하는 등 시스템이 인지하고 작업 간에 전환 할 수 있어야 하기 때문에 이러한 기술을 구현하는 것은 매우 어려운 과제이나 연구팀의 새로운 BST 데이터 세트는 이러한 동작을 혼합(Blending)하고 나타내는 시스템을 구축하는 방법을 제시했다. BST로 모델을 미세 조정하면 봇의 대화 능력에 대한 인간 평가에 큰 영향을 미친다는 것을 확인했다고 밝혔다.

한편 이번 AI 챗봇 '블렌더'에 기반이 된 BST(Blended Skill Talk) 기술 연구 논문은 지난달 17일 아카이브를 통해 '대화 에이전트의 기술 혼합 능력 평가(Can You Put it All Together: Evaluating Conversational Agents' Ability to Blend Skills 다운)' 란 제목으로 발표됐으며, 개발된 '블렌더'에 관련된 연구 논문 또한 지난달 30일 아카이브를 통해 '오픈 도메인 챗봇 구축을 위한 방법(Recipes for building an open-domain chatbot 다운)'이란 제목으로 발표됐다. 이와 함께, AI 챗봇 '블렌더' 소스 코드는 대화 모델을 공유, 훈련 및 평가하기 위한 통합 플랫폼 ParlAI(보기)에 오픈 소스로 공개돼 있다.

관련기사

저작권자 © 인공지능신문 무단전재 및 재배포 금지