머리 움직임, 립싱크, 표정 등 분리 제어 성공해 기존보다 고품질 가상인간 구현 가능해져

장세영 대표는 "세계 최고 권위의 학회에서 AI 휴먼 기술력을 입증할 수 있게 되어 매우 기쁘다”며, “앞으로도 학술적인 연구와 함께 사용자들이 더욱 편리하게 사용할 수 있는 AI 휴먼 서비스 고도화를 통해 생성 AI 분야 글로벌 선도 기업으로 발돋움해 나갈 것”이라고 말했다.
장세영 대표는 "세계 최고 권위의 학회에서 AI 휴먼 기술력을 입증할 수 있게 되어 매우 기쁘다”며, “앞으로도 학술적인 연구와 함께 사용자들이 더욱 편리하게 사용할 수 있는 AI 휴먼 서비스 고도화를 통해 생성 AI 분야 글로벌 선도 기업으로 발돋움해 나갈 것”이라고 말했다.

인공지능(AI) 전문 기업 딥브레인AI(대표 장세영)는 자사 인공지능연구소의 더 나은 AI 휴먼 서비스를 위한 AI 관련 연구 논문  2편이 오는 6월 4일부터 10일까지 그리스에서 열리는 세계 최고 권위의 '2023 IEEE 음향, 음성 및 신호 처리에 관한 국제 회의(ICASSP 2023)'에 채택됐다

올해로 48주년을 맞이하는 ICASSP 2023은 국제전기전자협회 신호처리학회가 주최하는 음향·음성·신호처리 분야 세계 최대 규모의 국제 학회다. ICASSP의 올해 주제는 ‘인공지능 시대의 신호처리’로, 작년 대비 2배에 가까운 6천 편 이상의 논문이 제출되어 역대 최대 경쟁률을 기록했다.

학회 이미지
학회 이미지

이번에 ICASSP에서 채택한 딥브레인AI의 논문은 각각 영상 합성과 음성 합성을 다룬 연구 2건이다.

먼저, 영상 합성 논문은 기하 변환 병목을 통해 머리 움직임, 립싱크, 표정을 분리 제어하는 기술인 ‘디스코헤드(DisCoHead)’를 다룬 내용이다. 머리와 얼굴의 신체 부위를 세분화하여 상반신 이미지가 원하는 음성과 영상을 자연스럽게 따라가도록 컨트롤하는 방법을 소개한다. 

딥브레인AI에서 세계 최초로 성공한 이 기술은 상반신의 자세와 발화 동작 및 비발화 표정을 자유롭게 조절 가능해 기존 방식보다 훨씬 자유도가 높은 고품질의 가상 인간을 제작할 수 있다.

AI 휴먼 관련 논문 2편 이미지
AI 휴먼 관련 논문 2편 이미지

음성 합성 논문에서는 중국어 문자소-음소 변환을 위한 콘텍스트 모델링 기법을 다뤘다. 본 연구는 중국어 병음 변환 시 인접한 문자들 사이의 관계를 강조하여 다음자의 병음 변환 정확도를 향상시키는 ‘문맥 강화 기법(Reinforcer)’을 제안한다. 딥브레인AI는 본 연구를 통해 학습한 병음 변환 모델을 자사 중국어 음성합성 서비스에 적용해 음성합성의 품질을 한 단계 높일 예정이다.

이 밖에도 딥브레인AI는 AI 영상합성 분야에서 국내외 148건의 지적 재산권을 출원 또는 등록했으며, 국제 컴퓨터 비전 학회(ICCV) 2021과 인터스피치(Interspeech) 2021에 딥페이크 탐지와 음성 합성 관련 논문을 등재하는 등 더 나은 AI 휴먼을 제공하기 위한 연구 수행 및 기술 개발에 지속적인 노력을 기울이고 있다.

장세영 딥브레인AI 대표는 "세계 최고 권위를 지닌 학회에서 당사의 AI 휴먼 기술력을 다시 한번 입증할 수 있게 되어 매우 기쁘다”며, “앞으로도 학술적인 연구와 함께 사용자들이 더욱 편리하게 사용할 수 있는 AI 휴먼 서비스 고도화를 통해 생성 AI 분야 글로벌 선도 기업으로 발돋움해 나갈 것”이라고 말했다.

한편, 딥브레인AI는 누구나 쉽게 사용 가능하고, 비즈니스에 편리함을 제공하는 대화형 인공지능 구현을 목표로 다양한 생성 AI 기술 및 서비스를 제공하고 있으며, 최근에는 글로벌 시장조사기관 CB 인사이트(CB Insights)가 선정한 ‘글로벌 250대 제너레이티브 AI(Generative AI, 생성형 인공지능) 스타트업’ 중 엔터프라이즈 AI 아바타 분야 유망 기업 명단에 이름을 올린 바 있다. 

저작권자 © 인공지능신문 무단전재 및 재배포 금지