원하는 동작을 텍스트로 입력하면 그에 맞는 자연스러운 모션을 생성하고, 취향에 따라 모션 수정까지 하는 모델

FLAME 모션 생성 예: 텍스트-모션 합성 및 텍스트 기반 모션 편집 개요(움직임은 왼쪽에서 오른쪽으로 흐른다) 상단, 명령어 "사람은 앞으로 걸어가서 무언가를 집으려고 몸을 숙인다."생성 이미지, 중·하단, "사람이 공을 드리블합니다."라는 메시지에 구현된 이미지(녹색: 기준 모션. 파란색: 텍스트 기반 모션 편집)로 모델은 상체 부분(하체는 고정)을 편집할 수 있다.(이미지:논문캡처)
FLAME 모션 생성 예: 텍스트-모션 합성 및 텍스트 기반 모션 편집 개요(움직임은 왼쪽에서 오른쪽으로 흐른다) 상단, 명령어 "사람은 앞으로 걸어가서 무언가를 집으려고 몸을 숙인다."생성 이미지, 중·하단, "사람이 공을 드리블합니다."라는 메시지에 구현된 이미지(녹색: 기준 모션. 파란색: 텍스트 기반 모션 편집)로 모델은 상체 부분(하체는 고정)을 편집할 수 있다.(이미지:논문캡처)

카카오브레인(대표 김일두)이 지난 7일(현지시간)부터 14일까지 미국 워싱턴 DC에서 개최된 세계 최고 인공지능(AI) 권위의 전미인공지능학회(Association for the Advancement of Artificial Intelligence. 이하, AAAI) 2023’에서 고려대학교 최성준 교수 연구실과 공동 연구개발한 텍스트 기반 모션 생성 AI 모델 ‘플레임(FLAME)’을 발표했다. 

이번 연구는 초거대 AI를 활용해 인간의 움직이는 모션을 생성할 수 있는 신규 모델이다.

카카오브레인, 고려대 최성준 교수 연구실은 원하는 동작을 텍스트로 입력하면 그에 맞는 자연스러운 모션을 생성하고, 취향에 따라 모션 수정까지 하는 모델의 ‘플레임: 자유 형식 언어 기반 모션 합성 및 편집(FLAME: Free-form Language-based Motion Synthesis & Editing-다운)’란 제목의 연구 논문은 학회서 높은 평가를 받아 구두 발표(Oral Session) 대상자로 선정됐다.

‘FLAME’은 ‘초대형 언어 모델(LLM, Large language models)’을 기반으로 연구개발한 모션 생성 모델로 비슷한 시기에 발표된 ‘동작 확산 모델(MDM, motion diffusion model)’보다 상세하고 복잡한 문장을 입력해도 완성도 높은 모션을 만들어 내는 것이 특징이다.

AAAI 2023 개최 이미지
AAAI 2023 개최 이미지

최성준 교수는 “국내 생성 모델 분야에서 탁월한 성과를 보여주고 있는 카카오브레인 팀과 공동 연구할 수 있다는 점에서 좋았고, 연구 결과도 높은 평가를 받아 만족스럽다”며, “여러 기업들이 텍스트 기반 이미지 또는 비디오 생성에 집중하고 있는 가운데, 텍스트 기반 모션 생성 연구를 계속 이어나가 차별화된 연구 결과를 만들 것"이라고 말했다.

카카오브레인 김일두 대표는 “‘FLAME’의 우수한 연구 결과를 글로벌 AI 학회 ‘AAAI’를 통해 공개할 수 있게 돼 영광스럽다”며, “게임, 애니메이션, 영화 등의 제작 과정에서 모션 캡처를 통한 수작업만 가능했던 영역에 ‘FLAME’ 기술이 도입된다면, 작업 자동화는 물론 업무 효율성 증진에도 큰 기여를 할 것”이라고 말했다.

한편, 카카오브레인은 국내 최초 미술품 종합거래 플랫폼 ‘아트투게더’와 공동 기획한 ‘Karlo’s Moment 전시회’를 지난 12월 카카오 판교 아지트에서 진행, 자사의 AI 아티스트 ‘칼로(Karlo)’와 극사실주의 화가 ‘두민’ 작가의 작품을 전시했다. 작품 중 온라인으로 판매한 ‘칼로’의 작품 5 점과 ‘두민 작가-칼로’ 협업 작품 2 점이 모두 판매됐으며, 수익금 전액은 카카오창작재단에 전달됐다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지