말투 뿐만 아니라 말하는 얼굴 표정도 실제와 같아

사람의 목소리와 얼굴을 똑같이 합성.. 국내 최초 AI 뉴스 앵커(사진:머니브레인)
사람의 목소리와 얼굴을 똑같이 합성.. 국내 최초 AI 뉴스 앵커(사진:머니브레인)

AI 스타트업 머니브레인(대표 장세영)이 사람의 목소리와 얼굴을 똑같이 합성해 국내 최초로 'AI 뉴스 앵커'를 탄생시켰다.

이 기술은 뉴스 앵커의 영상을 AI 기술로 학습해 실제 뉴스 앵커와 똑같은 말투, 억양 등의 목소리 뿐만 아니라 영상으로 말하는 얼굴, 표정 및 움직임까지 합성할 수 있도록 개발됐다.

머니브레인은 얼굴 특징 추출과 피부합성, 감정표현 등을 위해 첨단 인공지능 기술을 적용했다고 설명했다. 또 영상과 음성을 결합해 딥러닝 훈련 과정을 거쳐 실제 사람을 닮은 인공지능 영상으로 제작했다는 것이다. 

특히 이 AI 영상합성 기술은 중국의 오벤, 일본 AI 스타업 스펙티, 미국 등 4곳에서만 성공한 기술적 난이도가 높은 딥러닝 기술이다. 이번 머니브레인 기술은 중국에 비해 자연스러운 얼굴 움직임을 구현했고, 미국의 오바마 합성과 다르게 별도의 영상 보정없이 순수 딥러닝 기술만으로 구현한 세계 최초의 기술이다.(아래는 AI 아나운서 시연 영상)

앞으로는 몇 시간만 AI가 동영상을 학습하면 직접 카메라 앞에서 사람이 촬영을 하지 않아도 AI가 영상을 자동으로 만들어내는 세상이 올 것으로 기대된다.

이 기술을 활용한 서비스로 AI 뉴스 아나운서, AI 한류스타, AI 영어회화 등 사람의 얼굴로 대화하는 모든 분야에 쓰일 수 있다. 곧 AI와 얼굴을 보면서 얘기하는 영화 속 상상이 현실로 이루어 질 것으로 예상된다. 

온라인 커머스에도 활용될 수 있다. 최근 온라인 쇼핑몰에서는 매출 촉진을 위해 상품 소개 영상을 대량 제작하고 있지만, 수천만개에 이르는 상품을 모두 영상으로 제작하는 것은 현실적으로 불가능하다. (아래는 머니브레인 인공지능 문재인 대통령 AI 얼굴 영상합성 영상)

이런 경우 AI 영상합성 기술이 해결책이 될 수 있다. 간단한 제품소개 내용과 이미지를 입력하면 유명 연예인이 상품을 홍보하는 영상을 손쉽게 만들 수 있기 때문이다.

이 기술을 개발한 AI 스타트업 머니브레인의 장세영 대표는 “얼굴 영상합성 기술은 세계 수준에 근접한 한국의 몇 안되는 AI 기술"이라며, "중국과 미국의 AI 기술 회사와 경쟁하고 있는 젊은 AI 스타트업들에 더 많은 투자가 이루어 졌으면 좋겠다”고 말했다.

한편 AI 분야는 전세계의 많은 기업과 국가들의 가장 중요한 화두다. 한국에서도 이처럼 세계에 내놓을 수 있는 AI 기술들이 개발되고 있다. 이를 뒷받침하기 위한 인력, 정책, 투자 등 많은 관심과 국가적인 지원이 필요한 시점이라는 게 전문가들의 공통되된 지적이다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지