지난 4월까지 일어난 최신 정보가 반영...최대 128,000개의 토큰지원으로 단일 프롬프트에 300페이지 이상의 텍스트에 해당하는 내용을 넣을 수 있다. 이는 이전 버전 8,000천 토큰보다 훨씬 더 긴 대화와 복잡한 작업을 수행

이날 발표에 나선 샘 알트만의 키노트 스피치 모습(발표 영상 갈무리)
이날 발표에 나선 샘 알트만의 키노트 스피치 모습(발표 영상 갈무리)

오픈AI(OpenAI)가 현지시간 6일, 개발자를 위한 첫 컨퍼런스인 '데브 데이(Dev Day)'를 열고 최신 정보로 무장한 챗봇 ‘GPT-4 터보(GPT-4 Turbo)’를 공개하고 개발자가 챗GPT(ChatGPT)의 사용자 정의 버전을 만들 수 있는 기능을 포함하여 새로운 인공지능 툴과 일련의 업데이트를 공개했다.

특히, 이날 새로 공개한 'GPT-4 터보(미리보기)'는 2021년 이후에 일어난 일에 대해서는 답할 수 없었던 이전 버전과 달리, 지난 4월까지 일어난 최신 정보가 반영돼있으며, 최대 128,000개의 토큰지원으로 단일 프롬프트에 300페이지 이상의 텍스트에 해당하는 내용을 넣을 수 있다. 이는 이전 버전 8,000천 토큰보다 훨씬 더 긴 대화와 복잡한 작업을 수행할 수 있다.

'GPT-4 터보'는 텍스트 생성 모델에서 JSON 모드재현 가능한 출력이 가능해졌다. 특정 형식 생성(예 "항상 XML로 응답")과 같이 지침을 주의 깊게 따라야 하는 작업에서 이전 모델보다 더 나은 성능을 발휘한다. 또한 모델이 유효한 JSON으로 응답하도록 보장하는 새로운 JSON(JavaScript Object Notation) 모드도 지원하며, 비전과 텍스트-투-스피치와 같은 새로운 모달리티가 포함되어 이미지를 이해하고 자연스러운 소리를 내는 오디오를 생성할 수 있다.

새로운 API 매개변수를 '응답-형식(response_format)'으로 사용하면 모델이 구문적으로 올바른 JSON 개체를 생성하도록 출력을 제한할 수 있다. JSON 모드는 함수 호출 외부에서 Chat Completions API에서 JSON을 생성하는 개발자에게 유용하다.

이날 오픈AI가 공개한 새로운 '어시스턴트 API(Assistant API-보기)'는 코드 해석기 및 검색과 같은 새로운 기능과 함수 호출(모델과 도구)을 제공하여 이전에 직접 수행해야 했던 많은 무거운 작업을 처리하고 고품질 AI 앱을 구축할 수 있도록 해준다. 현재 Assistants API는 베타 버전(유료)으로 모든 개발자가 사용할 수 있다.

어시스턴트 플레이그라운드를 사용하여 코드 없이 고품질 어시스턴트를 만든다(그림:오픈AI)
어시스턴트 플레이그라운드를 사용하여 코드 없이 고품질 어시스턴트를 만든다(그림:오픈AI)

아울러, 최근 챗GPT 플러스(ChatGPT Plus) 및 기업(Enterprise) 등 유료 사용자에게 출시된 비전, 이미지 생성 AI 모델 '달리 3(DALL·E 3)'를 이미지 API를 통해 dall-e-3모델로 지정하여 앱과 제품에 직접 통합할 수 있으며, 이전 버전의 DALL·E와 마찬가지로 API에는 개발자가 응용 프로그램을 오용으로부터 보호할 수 있도록 조정 기능이 내장되어 있다.

아울러, 새로운 텍스트 음성 변환(TTS) 모델(보기)로 개발자는 텍스트 음성 변환 API를 통해 작성된 블로그 게시물 내레이션, 여러 언어로 음성 오디오 생성 스트리밍을 사용하여 실시간 오디오 출력 등에서 인간 수준의 음성을 생성할 수 있다.

새로운 TTS 모델은 선택할 수 있는 6가지 사전 설정 음성과 2가지 모델 변형을 제공한다 tts-1. 실시간 사용 사례에 최적화되어 있으며 품질에도 최적화되어 있다. 유료버전으로 입력 1,000자당 0.015달러부터 시작된다.

마지막으로 비전(Vision)이 포함된 GPT-4 Turbo는 이미지를 Chat Completions API의 입력으로 받아들여 캡션 생성, 실제 이미지 세부 분석, 그림이 포함된 문서 읽기 등의 사용 사례를 지원한다.

예를 들어, BeMyEyes(시각장애용 어플)는 이 기술을 사용하여 시각 장애가 있거나 시력이 낮은 사람들이 제품 식별이나 매장 탐색과 같은 일상 업무를 수행할 수 있도록 돕는다. 가격은 입력 이미지 크기에 따라 다르다. 예를 들어 1080×1080 픽셀의 이미지를 GPT-4 Turbo로 전달하는 데 드는 비용은 0.00765달러다.

이날 마이크로소프트(Microsoft) 사티아 나델라(Satya Nadella) CEO도 알트만 CEO와 함께 무대에 올랐다.
이날 마이크로소프트(Microsoft) 사티아 나델라(Satya Nadella) CEO도 알트만 CEO와 함께 무대에 올랐다.

이날 오픈AI의 샘 알트만(Sam Altman) CEO는 “우리는 사람들에게 더 나은 도구를 제공하면 놀라운 일을 해낼 것이라고 믿습니다"라며, "결국에는 컴퓨터에 필요한 것을 요청하게 될 것이며 컴퓨터가 이러한 모든 작업을 대신 수행해 줄 것입니다.”라고 말했다.

이어 그는 "사람들이 코딩 없이 이러한 챗봇을 구축할 수 있게 하면 접근성이 향상되고 모든 사람들에게 주체가 제공됩니다"라며, "점진적 반복 배포가 자율 AI를 안전하게 만들기 위한 OpenAI의 접근 방식입니다"라고 덧붙였다.

한편, 이날 마이크로소프트(Microsoft) 사티아 나델라(Satya Nadella) CEO도 알트만 CEO와 함께 무대에 올라 "OpenAI가 마법 같은 것을 구축했으며 궁극적으로 오픈AI와 파트너십은 AI의 혜택을 모든 사람에게 널리 전파하는 것"에 관한 것이라고 말했습니다. 이에 알트만은 “우리는 기술 분야에서 최고의 파트너십을 갖고 있다고 생각하며 인공지능을 함께 구축하게 돼 기쁘다”고 말했다.(아래는 이날 발표 영상)

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지