AI 음성 전문 기업 네오사피엔스(대표:김태수)가 웅진씽크빅 단행본사업본부와 함께 “영리한 아이가 위험하다’, ‘군주론’ 총 2권의 오디오북을 AI 성우 낭독본으로 제작해 17일 공개했다.“영리한 아이가 위험하다”는 극심한 경쟁에 시달리는 현대 사회 속 영리한 아이들이 겪는 문제를 설명하고 부모의 올바른 역할을 제시하는 지침서이며, ‘군주론’은 저자의 신랄하고 냉철한 정치론으로 현대에 이른 지금까지도 깊은 교훈을 주는 현실 정치의 경전으로 알려져 있다.양사는 음성 콘텐츠 수요가 높아지는 추세에 따라 오디오북 시장의 발전 가능성에 주
일본 도시바는 음성인식 인공지능(AI)을 활용해 온라인 수업에서 강사의 목소리를 자동으로 자막 처리하는 음성자동자막시스템 '토스크라이브(ToScLiveTM)'를 개발했다고 10일 발표했다.이 음성자동자막시스템은 발화 내용을 약 85%의 정확도로 인식할 수 있고, 용어를 미리 등록해두면 정확도는 더 높아질 것이라고 밝혔다.이번 개발은 코로나19 확산에 따라 비대면 온라인 수업을 도입하는 학교가 늘어나면서 음성의 자동 자막 처리 기능에 대한 요구도 커지고 있는데 따른 것으로 보인다. 시스템은 교사의 강의 음성을 실시간 자
20년 이상 음성기술을 전문적으로 개발해 온 음성전문기업 리드스피커코리아(대표 이종석)는 인공지능(AI) 기술을 적용한 딥뉴럴네트워크(DNN Deep Neural Neteork) HQ(High Quality) Micro(Auto DB)를 개발 완료했다고 8일 밝혔다.‘Auto DB’는 기존의 음성합성기에 인공지능(AI) 기술을 적용해 음질은 한층 더 높이고 음성합성기의 개발기간은 단축시킨 획기적인 제품으로 기존의 음성합성기는 연결합성기(USS : Unit Selection Synthesis)와 통계기반 파라미터 합성기(SPSS St
아마존 알렉사는 기존의 스마트 홈 스킬(Smart Home Skill)과 커스텀 스킬(Custom Skill)을 결합하는 새로운 방법인 멀티 케이퍼빌리티 스킬(Multi-Capability Skills 이하,MCS)을 28일(현지시간) 공개했다.이제 스마트 홈 장치 개발자는 장치에 대한 스마트 홈 기능과 사용자 지정 기능을 모두 사용할 수 있는 단일 기술로 배포하고 유지 관리할 수 있으므로 유지 관리가 간소화 되고 원활한 고객 경험을 제공할 수 있게 된다.MCS를 사용하면 고객이 두 가지 별도의 기술을 활성화하고 호출할 필요 없
애플이 캐나다 온타리오에 위치한 워털루 대학의 머신러닝 및 AI 스타트업 인덕티브(Inductiv)를 지난 27일(현지시간) 인수했다고 불룸버그 등 주요 외신이 보도했다. 또 애플은 이번 계약이 “때로는 소규모 기술 기업을 구매하고 일반적으로 우리의 목적이나 계획을 논의하지는 않는다”고 덧붙였다. 이번 인덕티브 인수로 지난 몇 년 동안 애플이 인수한 12개 기업 중 하나로 추가됐으며, 이미 인덕티브의 엔지니어링 팀은 최근 몇 주 동안 머신러닝 및 데이터 과학자 등이 애플에 합류해 시리(Siri) 작업을 수행했다고 전했다.인덕티브는
네이버가 네이버 뉴스 기사 ‘본문 읽기’ 서비스에 오상진 전 아나운서의 목소리를 기반으로 개발한 AI 앵커를 적용했다.이번에 선보이는 기존 네이버 뉴스 기사 본문 읽기 서비스에 적용되었던 UTS(Unit-selection Text-to-Speech)[i] 기반 서비스와 비교하여, 목소리의 자연스러움을 평가하는 MOS (Mean Opinion Score) [ii]지표가 30% 이상 높아졌다. 특히, 뉴스 읽기 분야에 전문화된 목소리의 특성에 집중해 만들어진 합성음인 만큼, 실제 앵커가 기사를 전달하는 목소리 톤(tone)과 높낮이까지
신한은행이 AI 음성봇 ‘쏠리’을 활용해 빠르고 정확하게 고객상담을 지원하는 ‘인공지능(AI) 상담서비스’를 처리한다고 25일 밝혔다.기존에는 상담사와 연결되기까지 평균 2~3분 가량의 ARS 음성 안내를 들어야 했으나 ‘AI 쏠리’ 도입으로 약 40초만에 전문 상담사와 연결이 가능하며 거래내역 팩스 신청, 자동이체 등 간단한 업무는 모바일 뱅킹 등으로 고객이 쉽게 처리할 수 있도록 알림톡을 보내준다.‘AI 상담서비스’는 고객 전화 문의를 가 응대해 대기시간 없이 필요한 내용을 바로 안내하고, 더 구체적인 정보가 필요해 고객이 직원
인공지능 성우 서비스 ‘타입캐스트(typecast)’가 5월 초 누적 가입자 수 3만 명을 기록했다.퀄컴(Qualcomm)과 KAIST 출신의 음성 분야 인공지능 전문가 팀이 설립한 스타트업 네오사피엔스(대표 김태수)에서 운영하는 ‘타입캐스트’는 전문 성우의 목소리를 활용한 AI 음성 생성 기술을 기반으로, 50여 개의 다양한 음성을 실시간 오디오 콘텐츠로 변환해 주는 서비스다.텍스트로 된 문장을 입력 창에 작성한 후 성별, 연령, 콘텐츠 분위기 등에 따라 이용자가 원하는 타입의 성우를 캐스팅하여 편집하면 전문 성우가 녹음한 것과
알리바바가 자사의 인공지능(AI) 음성인식 플랫폼 '티몰 지니(Tmall Genie)'의 스마트 스피커를 중심으로 한 차세대 기술 개발과 AI 및 IoT 플랫폼을 업그레이드 하기 위해 100억 위안(약 1조 7,230억원)을 투자할 계획이라고 20일 밝혔다.특히, 스마트 스피커를 통한 컨텐츠를 확장하고 스마트 홈 장치를 실행하는 새로운 기술을 개발할 계획이라고 밝혔다.알리바바는 2017 년 최초의 티몰 지니 스마트 스피커를 출시한 이후 꾸준한 클립으로 음성 어시스턴트 및 스마트 스피커 기술에 대한 투자를 꾸준히 늘려
마인즈랩(대표 유태준)이 구독형 인공지능 상담서비스 'FAST 대화형 AI'를 본격적으로 시작했다고 7일 밝혔다.FAST 대화형 AI 서비스는 클라우드 기반 콜센터 솔루션으로 근무 장소에 제한을 받지 않고, 환경 변화에 손쉽게 대응을 할 수 있도록 한 새로운 방식의 CS서비스로 최근 신종 코로나바이러스 감염증(코로나 19) 확산에 따른 콜센터 재택근무에 필요성이 커지는 가운데 재택 콜센터 구축 및 운영이 가능한 것이 특징이다.FAST 대화형 AI 서비스는 고객은 사람 상담원과의 대화, 챗봇·음성봇과의 상담을 통해 필요
일본 도쿄에 본사를 둔 대화 형 AI 제품 및 서비스 스타트업인 코토바 디자인(COTOBA Design)이 오픈 소스 용 핵심 소프트웨어를 오픈소스로 3일 공개했다.이 회사의 이름을 딴 플랫폼은 코토바 에이전트(COTOBA Agent) OSS로 파이썬 3(Python 3)으로 작성된 대화 상자 설명 언어 처리 엔진이다. 인공지능 생성 언어(AIML, Artificial Intelligence Markup Language)을 사용하여 상호 작용을 구축하기 위한 프로그램이 포함되어 있다.AIML은 자연어 소프트웨어 에이전트를 작성하기
[인공지능신문 정한영 기자] 구독형 인공지능(AI) 플랫폼 기업 마인즈랩(대표 유태준)은 클라우드 기반 회의록을 본격적으로 maum.ai에 오픈했다.클라우드 기반으로 운영되는 마음회의록 서비스는 인공지능 플랫폼 마음AI (maum.ai)에 접속하여 간단한 회의정보 입력과 회의록 파일 업로드만으로 화자가 분리된 텍스트화 된 회의록 파일을 받아볼 수 있다.마인즈랩에 따르면 마음회의록은 클라우드 시스템 내 바로 접속하여 녹음버튼 한번으로 실시간 녹음된 파일을 업로드할 수 있어 즉각적으로 회의 내용을 문서화하여 공유할 수 있는 것이 특징이
[인공지능신문 박현진 기자] NTT 테크노크로스(NTT TechnoCross Corporation)와 일본 최대 콜센터 기업 TMJ는 컨택센터에서 고객의 소리(Voice of Customer. 이하, VOC) 분석 정확도 향상을 목적으로 음성 빅데이터 솔루션 '예지 음성 마이닝(ForeSight Voice Mining)'를 활용한 실증 실험을 2 일부터 시작했다.이 실증은 TMJ가 위탁하는 컨택센터를 대상으로 약 200 시간의 통화 음성을 음성 인식 기술을 통해 텍스트 화 시키는 VOC 분석으로 모든 음성 데이터를 정
아마존이 알렉사 프리젠테이션 언어(이하, APL)를 사용하여 알렉사 기술에 대한 복합적인 경험을 빠르고 일관되게 디자인할 수 있도록 알렉사 디자인 가이드(Alexa Design Guide)에 있는 2 개의 새로운 알렉사 디자인 시스템 툴킷(Alexa design system toolkit)을 21일(현지시간) 공개했다.이 툴킷은 어도비 DX(Adobe XD) 및 스케치(Sketch)와 같은 무한대 디자인 캔버스 프로그램을 위해 설계되었다. 툴킷에는 코드 지원 알렉사 스타일 및 레이아웃 패키지를 나타내는 라이브러리가 포함되어 있다.이
네이버가 목소리 녹음 없이도 동영상에 AI 보이스를 입힐 수 있는 ‘클로바더빙’을 10일 출시했다.‘클로바더빙’은 텍스트 입력을 통해 합성음을 생성하고 동영상에 더빙할 수 있는 서비스로, 사람이 직접 목소리를 녹음하고 후속 작업하는 번거로움을 줄여 누구나 쉽게 더빙 콘텐츠를 제작할 수 있다.또한 성인과 아이, 남성과 여성, 기쁨과 슬픔 등 다양한 개성을 가진 21종의 보이스를 제공한다. 사용자의 취향과 동영상 테마, 더빙 내용 등 상황에 따라 적절한 보이스를 선택할 수 있다. 이외에도 AI 보이스의 속도·볼륨 조절 기능과 웃음소리,
아마존 AI 음성인식 플랫폼 알렉사는 16일(현지시간)부터 자동화 된 기술 배포 프로세스를 통해 몇 분 내에 라이브 기술을 업데이트할 수 있게 되었다. 새로운 자동 인증 워크 플로우를 통해 몇 분 안에 라이브 스킬의 슬롯 값과 샘플 발화를 업데이트할 수 있는 것이다.슬롯 값을 빠르게 업데이트 하면 콘텐츠 또는 모델 업데이트를 사용자에게 즉시 제공하여 스킬과 더 잘 연결될 수 있다. 샘플 발화 업데이트는 발화들이 잘못된 의도로 매핑되고 있다는 것을 발견하면 발화의 올바른 의도로 매핑하는 데 특히 유용하다.제한된 슬롯 값 또는 샘플 발
페이스북의 AI 리서치(FAIR)가 지난 13일(현지시간) 온라인 음성 인식을 위한 추론 프레임 워크 'wav2letter@anywhere' 를 오픈 소스로 공개했다.이 릴리스는 FAIR의 이전 릴리스 인 wav2letter 및 wav2letter ++를 기반으로 한다.Wav2letter@anywhere는 온라인 추론을 위해 훈련된 심층신경망(DNN) 모듈을 구성해야 하는 연구원, 생산 엔지니어, 개발자, 학생 등을 대상으로 하는 다중 스레드 및 다중 플랫폼 라이브러리이다.'온라인 음성 인식'은 입력
내달 7일부터 10일까지 美 라스베이거스에서 열리는 세계 최대 가전전시회 ‘CES 2020’에서 QA(Question Answering) AI 스타트업 포티투마루(42Maru, 대표 김동환)가 로봇, 홈디바이스 등에 대화 AI를 제공하는 ‘딥 시맨틱 QA 플랫폼(Deep Semantic QA 플랫폼)’을 선보인다.대화 AI는 CES 주요 트렌드인 ‘로봇의 발전’을 이끄는 핵심 기술이다. 특히 사용자 소통이 중요한 리테일·돌봄·교육 로봇에서는 대화 AI는 제품 완성도를 결정한다.딥 시맨틱 QA 플랫폼은 사용자 질문을 정확히 이해하고
중국 쑤저우에서 16일부터 19일까지 열린 GTC 차이나에서 엔비디아(CEO 젠슨 황)가 실시간 대화형 AI를 지원하는 추론 소프트웨어의 최신 버전인 엔비디아 텐서RT 7(NVIDIA TensorRT™ 7)을 발표했다.이는 전세계 개발자들이 대화형 AI 애플리케이션을 제공하는데 사용되어, 그간 인간과 AI간 상호작용에 걸림돌이 됐던 추론 레이턴시(지연시간)를 크게 개선할 것으로 기대된다.엔비디아 텐서RT 7은 엔비디아의 7세대 추론 소프트웨어 개발 키트로, 보다 스마트한 인간과 AI간 상호작용을 가능케 해, 음성 에이전트(voice
아마존 AI 음성인식 플랫폼 '알렉사(Alexa)'가 사람과 비슷할 정도로 업그레이드 됐다. 알렉사는 사람과 같은 감정을 부여하고 보다 자연스럽고 직관적인 음성 환경을 만드는 기능 두가지가 추가돼 26일(현지시각)부터 제공되기 시작했다.이에 따라 알렉사는 '감정'을 실어 행복하거나 흥분하거나 실망하거나 공감하는 어조로 더 사람같이 대응할 수 있게 된 것이다. 또 뉴스 및 음악으로 시작하여 특정 유형의 콘텐츠에 더 적합한 '말하기 스타일'로 응답할 수 있다. 말하기 스타일은 특정 콘텐츠에 대