"행복하거나 흥분하거나 실망하거나 공감하는 어조로 반응"

아마존 AI 음성인식 플랫폼 '알렉사(Alexa)'가 사람과 비슷할 정도로 업그레이드 됐다. 알렉사는 사람과 같은 감정을 부여하고 보다 자연스럽고 직관적인 음성 환경을 만드는 기능 두가지가 추가돼 26일(현지시각)부터 제공되기 시작했다.

이에 따라 알렉사는 '감정'을 실어 행복하거나 흥분하거나 실망하거나 공감하는 어조로 더 사람같이 대응할 수 있게 된 것이다. 

또 뉴스 및 음악으로 시작하여 특정 유형의 콘텐츠에 더 적합한 '말하기 스타일'로 응답할 수 있다. 말하기 스타일은 특정 콘텐츠에 대한보다 즐거운 고객 경험을 창출하도록 큐레이션된 음성이다.

예를 들어, 알렉사의 목소리를 TV 뉴스 앵커나 라디오 진행자가 말하는 것과 같이 사람처럼 상황에 따라 억양(스타일)을 바꿔 말하게 된다.

알렉사에 추가된 감정 기능은 보다 자연스러운 소리를 낼 수 있는 아마존TTS(text to speech) 기술인 신경망TTS(Neural Text To Speech) 기술을 사용한다.

예를 들어 사소한 질문에 올바르게 대답하거나 게임에서 이겼을때는 알렉사가 행복하고 또는 흥분되는 소리로 응답하게 할 수 있는 것이다. 마찬가지로, 좋아하는 팀이 졌을때 알렉사는 실망과 공감의 목소리로 응답하게 할 수 있다. 

'감정' 부여 6가지 예를 들어본다. 

▷흥분(고강도)

▷흥분(중간 강도)

▷흥분(낮은 강도)

▷실망(고강도)

▷실망(중간 강도)

▷실망(낮은 강도)

추가된 새로운 '말하기 스타일' 작동 방식은 신경망TTS 기술을 사용했으며, 미국에서 뉴스와 음악의 두 가지 말하기 스타일을 사용할 수 있다. 호주에서는 호주 고유의 뉴스 연설 스타일을 활성화 할 수 있다.  

다음 예를 확인하여 표준 음색과 비교하면 된다. 

▷뉴스(미국) 표준 음성

▷뉴스(미국) 말하기 스타일 

▷뉴스(AU) 표준 음성

▷뉴스(AU) 말하기 스타일

▷음악(미국) 표준 음성

▷음악 (미국) 말하기 스타일 

참고: 자세한 내용 및 API는 다음을 참고하면 된다. 감정에 대한 내용은(바로가기),말하기 스타일은(바로가기)

저작권자 © 인공지능신문 무단전재 및 재배포 금지