'달리 3(DALL-E 3)'로 생성된 이미지(이미지:오픈ai)
'달리 3(DALL-E 3)'로 생성된 이미지(이미지:오픈ai)

미드저니(Midjourney), 스테이블리티 AI(Stability AI) 등 이미지 생성 AI 경쟁이 가열되고 있는 가운데 오픈AI(OpenAI)가 21일(현지시간) 텍스트-이미지 생성 및 변환 도구인 달리(DALL-E)의 업그레이드 버전 '달리 3(DALL-E 3)'을 공개했다.

DALL·E 3은 현재, 연구용 프리뷰 단계에 있으며, 10월부터 유료버전인 챗GPT 플러스(ChatGPT Plus) 및 기업 고객에게 API를 통해 제공될 예정이다. 특히, 이 도구는 AI 챗봇인 챗GPT를 사용하여 프롬프트 작성의 수고를 혁신적으로 덜어준다. 즉, 챗GPT가 몇 단어 정도의 짧은 프롬프트를 더 설명적으로 만들어 DALL-E 3 모델에 요구하는 것이다.

챗GPT에서 시연 화면
챗GPT에서 시연 화면

그러나, DALL-E 2와 기존 DALL-E 모델에서와 마찬가지로 무료 웹 도구를 언제 출시할지 또는 출시할 계획인지에 대해서는 밝히지 않았다.

오늘날 대부분의 최첨단 AI 기반 이미지 생성 도구는 이미지에 대한 설명인 프롬프트를 받아 사실적인 것부터 환상적인 것까지 다양한 스타일의 이미지로 변환한다. 하지만 올바른 프롬프트를 만드는 것은 쉽지 않은 일이기 때문에 '프롬프트 엔지니어링'이 하나의 전문 분야로 자리 잡고 있다.

(왼쪽부터 DALL-E 2와 DALL-E 3 비교 생성이미지 ) 프롬프트:"성운이 폭발하는 것처럼 묘사된 농구 선수의 덩크슛"을 표현한 유화 작품 
(왼쪽부터 DALL-E 2와 DALL-E 3 비교 생성이미지 ) 프롬프트:"성운이 폭발하는 것처럼 묘사된 농구 선수의 덩크슛"을 표현한 유화 작품 

DALL·E 3는 챗GPT 통합만이 DALL-E 3의 새로운 기능은 아니다. 특히 긴 프롬프트를 처리할 때 더욱 정확하게 프롬프트를 반영하는 고품질 이미지를 생성할 수 있으며, 텍스트나 사람의 손과 같이 기존에 이미지 생성 모델에서 문제가 되었던 콘텐츠도 잘 처리한다.

이 외에도 DALL-E 3에는 알고리즘 편향을 줄이고 혐오 컨텐츠 생성 방지 기능과 안전성을 개선하는 새로운 메커니즘이 탑재되어 있다. 예를 들어, DALL-E 3는 현재, 활동하고 있는 아티스트의 스타일로 이미지를 요청하거나 유명 인물을 묘사하는 요청을 거부한다.

OpenAI는 일부 경쟁업체와 함께 저작권이 있는 아티스트의 저작물을 생성 AI 이미지 모델 학습에 사용했다는 혐의로 소송을 당하고 있는 가운데 이에 대안으로 DALL-E 3에서는 현재, 활동 중인 아티스트는 자신의 작품 중 일부 또는 전부가 차세대 오픈AI 텍스트-이미지 모델 학습에 사용되지 않도록 선택할 수 있다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지