사람의 목소리를 학습하여 실시간 음성합성이 가능하다. 따라서 실시간 커뮤니케이션 기술이 필요한 대화형 인공지능 서비스에 즉시 탑재하여 서비스 제공이 가능

일반적으로 딥러닝 음성합성을 위해서는 수초의 시간이 소요되는 반면 머니브레인은 실시간 음성합성이 가능하다. 따라서 실시간 커뮤니케이션 기술이 필요한 대화형 인공지능 서비스에 즉시 탑재하여 서비스 제공이 가능(사진:본지제작)
일반적으로 딥러닝 음성합성을 위해서는 수초의 시간이 소요되는 반면 머니브레인은 실시간 음성합성이 가능하다. 따라서 실시간 커뮤니케이션 기술이 필요한 대화형 인공지능 서비스에 즉시 탑재하여 서비스 제공이 가능(사진:본지제작)

대화형 인공지능 기술을 개발하는 스타트업 머니브레인(대표 장세영)이 사람처럼 자연스러운 딥러닝 기반 음성합성 기술을 3일 공개했다. 향후 인간과 가장 비슷하게 대화하는 인공지능 기술을 개발하는 것을 목표로 하고 있다고 한다.

음성합성 기술이란 문자를 음성으로(TTS, Text-To-Speech) 바꾸는 기술이다. 특히, 머니브레인은 딥러닝 음성합성 기술은 사람의 목소리를 학습하여 문맥에 따라 높낮이, 강세, 발음하는 방법을 습득하는 현존하는 가장 뛰어난 음성합성 기술이며, 우리가 흔히 듣는 기계음 방식의 음성합성 기술에 비해 자연스럽고 뛰어난 음성품질을 특징으로 한다고 밝혔다. (참고 머니브레인의 딥러닝 기반 TTS 샘플: 문재인 대통령(듣기), 손석희 아나운서(듣기)

일반적으로 딥러닝 음성합성을 위해서는 수초의 시간이 소요되는 반면 머니브레인은 실시간 음성합성이 가능하다. 따라서 실시간 커뮤니케이션 기술이 필요한 대화형 인공지능 서비스에 즉시 탑재하여 서비스 제공이 가능하다. 해당 기술은 광고, 오디오북, 교육 등 다양한 분야에 적용이 가능하며 글로벌까지 시장 확대가 용이한 기술이다. 머니브레인의 음성합성 기술은 홈페이지에서 직접 체험할 수 있다.

머니브레인 장세영 대표는 “국내 뿐 아니라 글로벌에서도 완성도 있는 딥러닝 기반 음성합성 기술을 보유한 기업은 극소수이며, 머니브레인의 딥러닝 기술이 글로벌 기업과 경쟁 가능한 수준으로 발전하여 다양한 비즈니스 영역에서 성과를 낼 것”이라고 말했다.

한편 머니브레인은 2017년 벤처캐피탈로부터 20억원을 투자 유치했고, 570여개 스타트업이 참여한 K-Global 스타트업 1위를 수상하기도 했다. 또 딥러닝 및 인공지능 기술 관련 57건의 국내외 특허를 출원했으며, 2019년 2월에는 신용보증기금 퍼스트펭귄 창업기업에 선정되어 3년간 15억원의 자금 지원받는다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지