이 기술은 지난해 출시된 딥러닝 기반으로 개발된 음성합성(DNN-TTS) 기술인 ‘Selyvy deppTTS’에 적용되어 고객들에게 선보일 예정

사람의 감정까지 표현하는 AI 음성합성(TTS) 기술(사진:아래 데모 영상 캡처)

AI 전문기업 셀바스 AI(대표 곽민철)이  AI 기술로 감정 표현이 가능한 음성합성(TTS text to speech) 기술을 새롭게 발표했다. 이 기술은 지난해 출시된 딥러닝 기반으로 개발된 음성합성(DNN-TTS) 기술인 ‘Selyvy deppTTS’에 적용되어 고객들에게 선보일 예정이다.

‘Selvy deepTTS’는 다양한 감정을 표현하는 감정합성 기술뿐 아니라 외국어 AI 학습을 통한 교차언어 학습 기술을 포함하고 있어 슬픔, 경쾌함, 행복, 차분함과 같은 다양한 감정 표현 및 외국어 발화도 가능하여 한국어, 영어, 중국어, 일본어 등을 유창하게 표현한다.

슬픔, 행복과 같은 감정뿐 아니라, ‘조금 슬프게’, ‘많이 슬프게’ 등과 같이 감정의 강도까지 조절할 수 있어 AI 화자가 영화, 드라마 더빙, 스마트 스피커, 뉴스, 교육 영상 등과 같은 다양한 콘텐츠의 각 상황에 어울리는 발화 및 감정 연기를 가능하게 한다.(아래는 다양한 감정을 표현이 가능한 감정합성 기술에 대한 자세한 데모 영상)

또한 외국어 학습을 통한 교차언어 학습 기술을 포함하고 있어, 한국어 화자 ‘마루’, ‘유진’, ‘혜진’ 은 영어를, 영어 화자 ‘Sarah’는 한국어를 구사할 수 있도록 상대방 모국어에 대한 상호 학습이 가능하도록 개발되었다.

기존의 음성합성 기술은 모국어 구사만 가능하여, 다국어 구사가 필요할 경우 해당 언어를 별도로 녹음하거나 다국어를 구사하는 다른 목소리의 화자를 사용해야했던 것에 반해 ‘Selvy deepTTS’에 적용된 교차언어 학습 기술은 AI 기반 다국어 학습만으로도 1명의 AI 화자가 다양한 언어를 사람처럼 자연스럽고 유창하게 발화할 수 있다.

셀바스 AI 음성합성팀 박태훈 팀장은 “당사 음성합성 기술은 어떤 텍스트를 입력해도 실시간 음성 합성음 출력이 가능하다. 음성기술 개발에 대한 전문성과 기술적 우위를 기반으로 Selvy deepTTS는 개인화된 음성 합성음 구현, 감정 및 스타일 표현, 다국어 발화가 가능해 다양한 산업에서 맞춤형 음성 기술을 적용해 나가는 중이다.”라고 밝혔다.

 

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지