에디파이 스케치-투-이미지
에디파이 스케치-투-이미지

엔비디아가 비주얼 콘텐츠 제공업체를 위해 새로운 이미지 제어 기능인 3D 생성형 AI를 발표했다. 엔비디아 '에디파이(NVIDIA Edify)'는 비주얼 생성 인공지능을 위한 멀티모달 아키텍처로, 새로운 차원으로 나아가고 있다.

3D 애셋 생성은 에디파이가 개발자와 비주얼 콘텐츠 제공업체에 제공하는 최신 기능 중 하나로, 개발자는 AI 이미지 생성을 더욱 창의적으로 제어할 수 있다.

멀티미디어 콘텐츠와 데이터 제공업체인 셔터스톡(Shutterstock)은 에디파이 아키텍처 기반으로 만들어진 API(애플리케이션 프로그래밍 인터페이스)에 대한 얼리 액세스를 제공한다. 에디파이 아키텍처는 크리에이터가 텍스트 프롬프트나 이미지를 사용해 가상 장면의 3D 오브젝트를 빠르게 생성할 수 있도록 한다.

셔터스톡 3D AI 생성기를 사용해 생성한 애셋을 평면 이미지로 렌더링하고 배열한 이미지. (이미지:셔터스톡)
셔터스톡 3D AI 생성기를 사용해 생성한 애셋을 평면 이미지로 렌더링하고 배열한 이미지. (이미지:셔터스톡)

비주얼 콘텐츠 크리에이터이자 마켓플레이스인 게티이미지(Getty Images)는 상업적으로 안전한 생성형 AI 서비스에 맞춤형 미세 조정 기능을 추가해 기업 고객이 각자의 브랜드 가이드라인과 스타일에 맞는 비주얼을 생성할 수 있도록 지원할 예정이다. 또한 이 서비스에는 고객이 생성된 이미지를 더욱 세밀하게 제어할 수 있는 새로운 기능이 추가된다.

엔비디아 GTC에서 발표된 추론용 마이크로서비스 모음인 엔비디아 NIM을 통해 개발자는 게티이미지와 셔터스톡에서 사전 훈련된 에디파이 모델을 API로 테스트해 볼 수 있다. 또한 엔비디아 DGX 클라우드에 구축된 AI 파운드리인 엔비디아 피카소(Picasso)를 통해 에디파이 아키텍처를 사용해 자체 생성형 AI 모델을 훈련하고 배포할 수 있다.

엔비디아와 어도비(Adobe)는 에디파이를 기반으로 한 새로운 3D 생성 AI 기술을 수백만 명의 파이어플라이(Firefly)와 크리에이티브 클라우드(Creative Cloud) 크리에이터에게 제공하기 위해 협력하고 있다.

라이브 스트리밍 플랫폼인 비.라이브(Be.Live)는 엔비디아 피카소 파운드리 서비스를 사용해 실시간 생성형 AI를 제공함으로써 비주얼을 자동으로 생성하고 시청자에게 인터랙티브한 경험을 제공한다. 신뢰할 수 있는 비주얼 생성형 AI를 개발하는 기업을 위해 맞춤형 종합 플랫폼을 제공하는 브리아(Bria)는 추론 기능을 실행하기 위해 피카소를 채택했다. 또한 크리에이티브 스튜디오 큐브릭(Cuebric)은 몰입형 가상 환경을 구축하기 위해 피카소 기반 생성형 AI 애플리케이션을 개발해 영화와 콘텐츠 제작을 향상시킨다.

셔터스톡의 3D AI 서비스는 얼리 액세스로 제공된다. 해당 서비스를 통해 크리에이터는 세트 드레싱(set dressing)과 아이디어 구상을 위해 가상 오브젝트를 생성할 수 있다. 이 기능을 사용하면 장면 프로토타입 제작에 필요한 시간을 대폭 단축할 수 있어 아티스트들은 영웅 캐릭터와 오브젝트 제작에 더 많은 시간을 할애할 수 있다.

크리에이티브 전문가는 이 도구를 사용해 텍스트 프롬프트나 참조 이미지에서 애셋을 빠르게 생성하고 인기 있는 3D 포맷들 중에서 선택해 파일을 내보낼 수 있다. 에디파이 3D 기반 서비스에는 생성된 콘텐츠를 필터링하는 안전 장치도 내장되어 있다.

상업적으로 안전한 이 모델은 셔터스톡의 라이선스 데이터로 훈련됐다. 셔터스톡은 생성 기술 훈련에 사용된 콘텐츠에 대한 지적재산권 보호를 위해 수십만 명의 아티스트에게 보상금을 지급했으며, 추가로 수백만 명에게도 지급이 이루어질 것으로 예상된다.

이번 GTC에서 HP와 셔터스톡은 디자이너들에게 무한한 프로토타입 옵션을 제공하는 에디파이 3D를 사용해 사용자 맞춤형 3D 인쇄를 개선하기 위한 협업을 선보인다.

셔터스톡의 3D AI 생성기를 사용하면 컨셉을 빠르게 반복해 디지털 애셋을 만들 수 있다. 이를 HP가 자동화된 워크플로우를 통해 3D 인쇄가 가능한 모델로 변환시킬 수 있으며, HP 3D 프린터는 이러한 모델을 실제 프로토타입으로 변환시켜 제품 디자인에 영감을 불어넣는다.

마텔(Mattel)은 디자인 아이디어 프로세스를 가속화할 수 있는 셔터스톡의 3D 생성 AI 기능을 활용하고 있다. 장난감 디자이너는 AI 도구를 사용해 간단한 텍스트 설명만으로 신제품에 대한 아이디어를 시각화할 수 있다. 고충실도 콘셉트 디자인 제작에 대한 기술적 장벽을 낮춤으로써 디자이너는 더 폭넓은 아이디어를 탐색하고 더 빠르게 반복 작업을 수행할 수 있다.

또한 셔터스톡은 텍스트나 이미지 프롬프트에서 생성된 360 HDRi 환경을 사용해 경량의 3D 장면을 조명하는 에디파이 기반 도구를 구축하고 있다.

3D 콘텐츠 제작을 위한 선도적인 3DEXCITE 애플리케이션을 통해 다쏘 시스템(Dassault Systèmes)은 CGI 스튜디오 카타나(CGI studio Katana)와 함께 엔비디아 옴니버스(Omniverse)를 기반으로 한 워크플로우에 셔터스톡의 생성 360 HDRi API를 통합하고 있다. 엔비디아 옴니버스는 오픈USD(OpenUSD) 기반 3D 워크플로우와 애플리케이션 개발을 위한 컴퓨팅 플랫폼이다.

액센츄어 송(Accenture Song)은 세계 최대의 기술 기반 크리에이티브 그룹이다. 이들은 마케팅 목적으로 컴퓨터 지원 설계 데이터에서 고퀄리티 방어 차량(high-fidelity Defender vehicles)을 생성하기 위해 옴니버스 플랫폼을 사용하고 있다. 액센츄어 송은 에디파이의 생성형 AI 마이크로서비스와 결합해 대화형 프롬프트를 통해 영화 같은 인터랙티브 3D 환경을 제작할 수 있게 됐다. 그 결과 사실적으로 생성된 환경과 방어 차량의 디지털 트윈이 조화를 이루는 완벽한 몰입형 3D 장면이 탄생했다.

게티이미지는 사용자가 생성한 콘텐츠에 대한 면책을 제공하는 상업적으로 안전한 생성형 AI 서비스를 통해 제공되는 기능을 지속적으로 확장하고 있다.

지난 1월 열린 국제가전전시회(CES)에서 게티이미지는 창의적인 캔버스를 확장하는 아웃페인팅과 이미지에 오브젝트를 추가, 제거 또는 교체하는 인페인팅을 위한 에디파이 기반 API를 출시했다. 이러한 기능은 이제 Gettyimages.com과 iStock.com에서 모두 이용 가능하다.

5월부터 게티이미지는 에디파이 기초 모델을 기업의 브랜드와 시각적 스타일에 맞게 조정하는 서비스도 제공할 예정이다.

이 서비스는 코드 없이 셀프 서비스 방식으로 제공된다. 이를 통해 기업은 독점적으로 보유된 데이터 세트를 업로드해, 자동으로 생성된 태그를 검토한 후, 미세 조정된 작업을 제출하고 결과물을 검토하고, 운영 환경에 배포해 활용할 수 있다.

맞춤형 미세 조정 도구의 일부로, 게티이미지는 생성형 AI의 가장 큰 과제 중 하나인 이미지 출력을 보다 세밀하게 제어할 수 있는 API 모음을 출시할 계획이다.

개발자는 곧 스케치(Sketch), 뎁스(Depth), 세그멘테이션(Segmentation) 기능에 액세스할 수 있으며, 이를 통해 사용자는 AI의 이미지 생성을 안내하는 스케치를 제공하고, 뎁스 맵을 통해 참조 이미지의 구도를 복사하고, 이미지의 일부를 분할하여 캐릭터나 물체를 추가, 제거 또는 수정할 수 있다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지