빠르게 진화하는 인공지능(AI) 기술은 콜센터 운영 모델의 대 전환과 혁신적으로 다가와 기업에게는 비대면 고객 상담 채널의 효율화와 콜센터 운영 및 상담사 업무 효율을 높이고 고객에는 새로운 경험을 제공하고 있다.2000년도 초반 단어 중심 음성인식 엔진에서 현재, 자연어 인식 엔진까지 다양한 형태의 음성 인식솔루션을 개발해 온 리드스피커코리아(구. 보이스웨어)는 최근 국내 대형 금융사 인공지능(AI) 실시간 상담시스템 구축 참여를 통해 상용화가 가능한 높은 품질의 실시간 음성인식기가 성공적으로 개발되었음을 입증했다.리드스피커코리아
네이버가 짧은 녹음만으로 고품질의 합성음을 제작할 수 있는 클로바의 음성 합성 신기술 ‘NES(Natural End–to-end Speech Synthesis)’을 공개하고, 이를 기반으로 보이스 비즈니스 서비스를 제공한다.‘NES’는 40분 수준의 음성 데이터(약 400문장)로 실제 사람의 음성에 가까운 자연스러운 합성음을 제작할 수 있는 기술로, 40시간에서 100시간 정도의 음성이 필요했던 기존과 비교하여 쉽고 빠르게 음성 서비스를 개발할 수 있다는 것이 특징이다. 또한 특정 분야에 대한 제약 없이 사용할 수 있으며, 기본 목
가톨릭대학교 은평성모병원(병원장 권순용) 세계 최초로 음성으로 간호기록을 작성하는 인공지능 기반 간호전자의무기록(Voice Electronic Nursing Record) 시스템을 구축했다.은평성모병원 음성인식 전자의무기록 연구소(소장 이비인후과 김병국 교수, Voice Lab for EHR)가 10월 30일 열린 ‘CMC 디지털 트랜스포메이션 비전 선포식’에서 AI 음성인식 기반 '전자의무기록(EMR Electronic Medical Record)과 의료영상저장전송시스템(PACS Picture Archiving Commun
커넥티드카와 AI 기술을 결합한 대화형서비스가 자동차 분야에도 급속히 확대되고 있다.예컨대 국내외 출시되고 있는 대부분의 차량 시스템에는 아마존 알렉사(Alexa), 애플 시리(Siri)와 구글 어시스턴트(Google Assistant) 등과 같은 인공지능 에이전트가 기본으로 내장되어 있다. 차량 대화형서비스는 편의와 안전을 동시에 제공해야 한다. 대화형서비스가 ‘핸즈프리’를 가능케 해 스크린을 통한 서비스보다 차량 안전성을 높이는데 이견이 없다.그러나 대화형서비스도 근본적인 주의분산 문제의 해결책이 되지 못한다.운전 중에 대화형서
AI 전문기업 셀바스 AI(대표 곽민철)이 AI 기술로 감정 표현이 가능한 음성합성(TTS text to speech) 기술을 새롭게 발표했다. 이 기술은 지난해 출시된 딥러닝 기반으로 개발된 음성합성(DNN-TTS) 기술인 ‘Selyvy deppTTS’에 적용되어 고객들에게 선보일 예정이다.‘Selvy deepTTS’는 다양한 감정을 표현하는 감정합성 기술뿐 아니라 외국어 AI 학습을 통한 교차언어 학습 기술을 포함하고 있어 슬픔, 경쾌함, 행복, 차분함과 같은 다양한 감정 표현 및 외국어 발화도 가능하여 한국어, 영어, 중국어,
공학의 전유물로 여겨지는 인공지능(AI)을 학습시키는 일을 인문학이 맡게 돼, 새로운 직업군 탄생으로 이어질 지 주목되고 있다.전남대학교(총장 정병석)는 AI 음성인식 애플리케이션을 위한 말뭉치(CORPUS)를 수집하고 생성하는 실습 프로젝트에 1차적으로 국문학과를 비롯한 인문대 학생 50여명을 투입해 ‘동영상을 찾는 상황’과 ‘음악을 찾는 상황’을 가정해 인공지능(AI)과 연속해서 주고받을 수 있는 6만여건의 대화를 만들어 내기로 했다.‘AI 음성인식 기반 애플리케이션’은 자연어 처리 및 대화 패턴 데이터를 얼마나 많이 생성해서
현재 전 세계에는 시각 장애인이 3,600 만여명 있으며, 중증 내지 중증의 시력 장애가 있는 2 억 1800 만여명이 있다고 한다.구글이 세계 지도의 날인 10일(현지시각)부터 시력 장애가 있는 사람들이 이용할 수 있는 'Google지도'에서 사람들에게 보다 자세한 음성 안내와 도보 여행을 위한 새로운 유형의 구두 알림을 받을 수 있는 새로운 기능을 선보였다.이 기능은 시각 장애가 있는 사람이 A에서 B로 가는 데 도움이 될 뿐만 아니라 혼자 여행할 때 더욱 자신감과 보단 안전한 여정이 될 수 있도록 하며, 내가 가
미국 아마존닷컴과 자동차 제조업체 제너럴모터스(GM)는 25일(현지 시간) 아마존의 인공지능(AI) 스피커 ‘알렉사’를 GM의 신형 차량 등에 탑재키로 했다고 발표했다.아마존의 디바이스 부문 책임자인 데이브 림프 수석부사장은 이날 아마존의 시애틀 본사에서 진행된 기자회견에서 “아마존과 자동차 제조업체의 가장 흥미로운 조합이다”라고 의미를 강조했다.자동차를 운전하면서 알렉사에 특정 목적지까지의 경로를 듣거나 지정한 음악을 틀어달라고 할 수 있다. 스마트폰을 근거리무선통신 ‘블루투스’와 연결하면 핸들에서 손을 떼지 않고 통화도 가능하다
아마존, 마이크로소프트 등 글로벌 기술 기업들이 음성 지원 제품에 대한 새로운 프로그램 '음성 상호 운용성 이니셔티브(Voice Interoperability Initiative)'를 24일(현지시각) 발표했다. 핵심은 어느 회사의 음성 지원 제품이든 참여 기업들의 음성솔루션이 가동될 수 있도록 유연성을 제공하는 것이다.이번 음성 상호 운용성 이니셔티브는 아마존, 마이크로소프트, BMW, 세일즈포스(Salesforce), SFR, 소노스(Sonos), 하만(Harman), 스포티파이(Spotify), 사운드 유나이티드
구글 어시스턴트가 한국을 포함한 9개 국가에서 새로운 음성을 선보인다고 18일(현지시각) 구글 공식 블로그를 통해 발표했다.구글은 사용자가 구글 어시스턴트를 더욱 자신에게 맞게 사용할 수 있도록 구글 어시스턴트의 음성 선택권을 제공하기 위해 노력하고 있다. 특히 구글 어시스턴트 지원 가능 언어가 2017년 말 8개에서 현재 30개 이상으로 확대되는 등 구글은 가능한 많은 언어에서 새로운 음성을 지속적으로 개발해왔다.현재 미국에서는 존 레전드의 음성을 포함한 11개의 음성 중 원하는 음성을 사용할 수 있다. 18일 한국어를 비롯한 9
애플 시리(Siri), 아마존 알렉사(Alexa), 구글어시트턴트(Google Assistant) 등 대표적인 글로벌 3대 'AI 음성비서 플랫폼'이 앱으로 제공하는 인공지능(AI) 음성비서 서비스 가운데 구글 어시스턴트가 가장 똑똑하다는 조사 결과가 나왔다. 이 결과는 16일(현지시각) 미국 글로벌 투자회사 루프벤처스(Loup Ventures)가 발표한 내용이다.루프벤처스는 AI의 실제 사용 사례와 컴퓨팅 입력으로 음성의 출현을 더 잘 이해하려는 지속적인 노력의 일환으로 가장 일반적인 디지털 어시스턴트와 스마트 스피
네오사피엔스(대표 김태수)가 다양한 인공지능(AI) 음성을 사용해 텍스트를 음성 콘텐츠로 변환(TTS) 하는 AI음성 서비스 ‘타입캐스트(TypeCast)'를 오는 17일 ‘2019 국제인공지능대전’에서 선보인다. 네오사피엔스는 AI 감성 음성합성 기술에서 구글, 아마존 등과 같은 글로벌 IT기업들과 경쟁하고 있는 국내 대표적인 AI스타트업이다. 타입캐스트는 작가, 기자, 블로거 등 다양한 텍스트 콘텐츠를 보유한 유저들이 손쉽게 오디오를 생성할수 있도록 해주는 서비스이다. 자신의 컨텐츠에 적합한 배우를 선택하고 대사를 지정하
한국 사람의 감정에 대한 영상 정보, 한국어의 자연스러운 발성정보를 담고 있는 인공지능(AI)용 데이터가 개방된다. 이번 데이터 개방이 인공지능기술의 활용 스펙트럼을 넓히고, 관련 AI 서비스의 상용화를 촉진하는 계기가 될 것으로 전망된다.한국정보화진흥원(원장 문용식, 이하 NIA)은 250만개의 인공지능 학습용 데이터를 공개했다고 14일 밝혔다. 공개되는 데이터는 '감정, 상황, 대화내용을 담고 있는 복합 영상 데이터', '자연스러운 한국어 대화 음성 데이터', '한국어 챗봇용 대화 및 시나리오
인공지능(AI) 혁신을 선도하는 마인즈랩(대표 유태준)이 세계 최초로 음성 분리·필터(Voice Filter)기술을 구현했다. 여러 명의 발화가 동시에 겹쳐서 이루어질 때 화자별로 음성을 각각 분리할 수 있는 기술이다. 구글이 관련된 내용으로 논문을 공개한 바는 있으나 실제로 기술을 구현하여 오픈소스로 공개한 것은 마인즈랩이 처음이다.이번 마인즈랩 브레인팀이 개발한 음성 분리 및 필터 기술은 토론회나 회의에서처럼 다수의 화자가 겹쳐서 동시에 발화하는 음성이 있을 때 화자별로 음성을 각각 분리할 수 있는 딥러닝 기술로, 현존하는 가장
대화형 인공지능 기술을 개발하는 스타트업 머니브레인(대표 장세영)이 사람처럼 자연스러운 딥러닝 기반 음성합성 기술을 3일 공개했다. 향후 인간과 가장 비슷하게 대화하는 인공지능 기술을 개발하는 것을 목표로 하고 있다고 한다.음성합성 기술이란 문자를 음성으로(TTS, Text-To-Speech) 바꾸는 기술이다. 특히, 머니브레인은 딥러닝 음성합성 기술은 사람의 목소리를 학습하여 문맥에 따라 높낮이, 강세, 발음하는 방법을 습득하는 현존하는 가장 뛰어난 음성합성 기술이며, 우리가 흔히 듣는 기계음 방식의 음성합성 기술에 비해 자연스럽
인공지능(AI) 도입에 필요한 컨설팅과 맞품형 솔루션을 제공하는 AI기술 기업 에이아이더(대표 김수화)는 인공지능 음성 복제 솔루션 '와이즈클로닝 봇(Wise Cloning-Bot)'을 출시했다고 29일 밝혔다.와이즈클로닝 봇은 AI로 사람의 음성을 복제하는 서비스를 제공하는 것으로 봇은 집대성 된 음성 정보를 전이학습(Transfer Learning)하며, 특정 사람의 목소리 특성의 파라미터를 딥러닝 기술로 추출하고 패턴화해 인식 및 합성하며, 텍스트는 개인의 음색과 억양을 학습하는 AI 알고리즘을 통해 음성으로 재
콜센터 자동 ARS 음성처럼 로봇 같이 어색한 기계 음성을 실제 사람의 목소리처럼 만들 수는 없을까? 인공지능 전문기업 마인즈랩(대표 유태준)은 자사의 인공지능(AI) 서비스 플랫폼 마음에이아이(maum.ai)에서 AI 음성 생성 서비스를 12일 오픈했다. 마인즈랩이 자체 개발을 마치고 이번에 오픈한 AI 음성 생성 서비스를 통해 사용자는 최소 20분, 최대 1시간 이내의 음성 데이터만을 가지고도 실제 인물의 목소리와 90% 이상 유사한 목소리를 만들 수 있다.글로벌 최고 수준의 딥러닝 알고리즘을 기반으로 한 마인즈랩의 AI 음성생
KT(회장 황창규)는 한국남부발전(대표 신정식, 이하 남부발전), 우리항공(대표 박선기), 싱크스페이스(대표 송철호)와 함께 KT 광화문East 빌딩에서 ‘지능형 드론을 활용한 보안 인프라 강화 등 안전한 스마트 발전 환경 조성을 위한 공동협력’ MOU를 체결했다고 12일 밝혔다.이번 협약으로 네 회사는 드론을 포함한 AI, IoT 등 ICT 기술을 바탕으로 ▲지속적이며 안정적인 드론 운용 인프라 개발 ▲지능형 드론 개발 ▲AI, IoT, 광인프라 등을 활용한 융합 보안 영역 발굴을 통해 안전한 스마트 발전환경 조성에 앞장설 예정이
최근 웨어러블 기기에서 스마트 조명에 이르기까지, 전자제품과의 상호작용 방식으로서 음성 컨트롤의 소비자 선호도가 점차 높아지고 있다. 소비자 요구 충족을 위해 다양한 크기와 디자인의 제품들을 개발하는 과정에서 개발자들은 최종 애플리케이션의 각기 다른 BOM(Bill of Materials)과 폼 팩터 요건 충족을 위한 확장성 문제에 어려움을 겪는다.마이크로칩테크놀로지는 자회사인 마이크로세미(Microsemi Corporation)를 통해, 원거리 음성 픽업(far-field voice pick up) 기능 탑재 및 다중 마이크 어레
네이버의 인공지능 플랫폼 클로바(Clova)가 탑재된 스마트 스피커와 클로바앱에서 배우 유인나 씨의 목소리를 통해 다양한 서비스를 만나볼 수 있게 됐다. 네이버 클로바는 자체 연구개발한 음성합성기술 nVoice의 HDTS(Hybrid Dnn Text-to-Speech) 기술을 활용하여, 이달 29일부터 클로바를 통한 모든 음성 답변을 유인나 씨의 목소리로 접할 수 있도록 지원하고 있다.특히, 이번에 활용된 HDTS의 기술은 단순히 녹음한 음원을 제공하는 방식이 아닌, 단 4시간의 녹음으로 사람의 목소리와 가깝게 자연스러운 합성음을