오픈AI, 이미지 생성 AI ‘DALLE 3’ 발표..챗GPT와 통합, 프롬프트 창에서 입력하면 바로 이미지 뚝딱!

미드저니(Midjourney), 스테이블리티 AI(Stability AI) 등 이미지 생성 AI 경쟁이 가열되고 있는 가운데 오픈AI(OpenAI)가 21일(현지시간) 텍스트-이미지 생성 및 변환 도구인 달리(DALL-E)의 업그레이드 버전 '달리 3(DALL-E 3)'을 공개했다.

DALL·E 3은 현재, 연구용 프리뷰 단계에 있으며, 10월부터 유료버전인 챗GPT 플러스(ChatGPT Plus) 및 기업 고객에게 API를 통해 제공될 예정이다. 특히, 이 도구는 AI 챗봇인 챗GPT를 사용하여 프롬프트 작성의 수고를 혁신적으로 덜어준다. 즉, 챗GPT가 몇 단어 정도의 짧은 프롬프트를 더 설명적으로 만들어 DALL-E 3 모델에 요구하는 것이다.

그러나, DALL-E 2와 기존 DALL-E 모델에서와 마찬가지로 무료 웹 도구를 언제 출시할지 또는 출시할 계획인지에 대해서는 밝히지 않았다.

오늘날 대부분의 최첨단 AI 기반 이미지 생성 도구는 이미지에 대한 설명인 프롬프트를 받아 사실적인 것부터 환상적인 것까지 다양한 스타일의 이미지로 변환한다. 하지만 올바른 프롬프트를 만드는 것은 쉽지 않은 일이기 때문에 '프롬프트 엔지니어링'이 하나의 전문 분야로 자리 잡고 있다.

(왼쪽부터 DALL-E 2와 DALL-E 3 비교 생성이미지 ) 프롬프트:"성운이 폭발하는 것처럼 묘사된 농구 선수의 덩크슛"을 표현한 유화 작품

DALL·E 3는 챗GPT 통합만이 DALL-E 3의 새로운 기능은 아니다. 특히 긴 프롬프트를 처리할 때 더욱 정확하게 프롬프트를 반영하는 고품질 이미지를 생성할 수 있으며, 텍스트나 사람의 손과 같이 기존에 이미지 생성 모델에서 문제가 되었던 콘텐츠도 잘 처리한다.

이 외에도 DALL-E 3에는 알고리즘 편향을 줄이고 혐오 컨텐츠 생성 방지 기능과 안전성을 개선하는 새로운 메커니즘이 탑재되어 있다. 예를 들어, DALL-E 3는 현재, 활동하고 있는 아티스트의 스타일로 이미지를 요청하거나 유명 인물을 묘사하는 요청을 거부한다.

정한영 기자 hyjung@aitimes.kr

다른기사 보기

상단영역

본문영역

오픈AI, 이미지 생성 AI ‘DALLE 3’ 발표..챗GPT와 통합, 프롬프트 창에서 입력하면 바로 이미지 뚝딱!

기사 댓글 0

비회원 로그인