바드는 더욱 창의적인 작업을 위해 전 세계 대부분의 국가에서 이미지를 무료로 생성하고 대규모의 창의적인 프로젝트부터 소규모의 일상적인 업무에 이르기까지 모든 분야에서 더욱 유용하고 접근 가능한 AI 협업 도구가 될 것!...

로고 이미지
로고 이미지

구글 대화형 생성 인공지능(Generative AI) '바드(Bard)'에서 현지시간 1일부터 한국을 비롯한 대부분의 국가에서 멀티모달로 진화, 이미지를 생성할 수 있으며 모든 언어, 국가 및 지역에서 바드에서 GPT-4를 뛰어넘은 정교한 멀티모달 추론 기능을 갖춘 모델인 '제미나이 프로(Gemini Pro)'를 사용할 수 있다.

지난해 12월, 영어 버전의 바드에 제미나이를 도입하여 더욱 향상된 이해, 추론, 요약, 코딩 능력을 부여했다. 이제 40개 이상의 언어와 230개 이상(보기) 국가 및 지역에서 제미나이를 사용할 수 있게 됐다. 더 많은 사람들이 더 빠르고 강력한 인공지능 능력을 갖춘 '바드'의 새로운 경험을 제공한다.

먼저, 바드에서 더욱 창의적인 작업을 위해 전 세계 대부분의 국가에서 이미지를 무료로 생성할 수 있다. 이 새로운 기능은 품질과 속도의 균형을 맞추고 고품질의 사실적인 출력을 제공하도록 설계된 업데이트된 이미지2(Imagen 2-보기) 모델을 통해 구현된다. "서핑 보드를 타는 개 이미지 만들기"와 같은 설명만 입력하면 원하는 아이디어를 실현하는 데 도움이 되는 광범위한 맞춤형 시각 자료를 생성한다.

생성 이미지 예
생성 이미지 예

특히, 구글 AI 원칙(보기)에 따라 이미지 생성은 책임감을 염두에 두고 설계되었다. 예를 들어, 바드ㄹ로 만든 시각적 요소와 인간의 원본 예술 작품을 명확하게 구분하기 위해  구글의 AI 생성 콘텐츠를 워터마킹하고 식별하는 도구인 SynthID(보기)를 사용하여 생성된 이미지의 픽셀에 디지털 식별이 가능한 워터마크를 삽입한다.

학습 데이터의 안전과 기술적 보호와 투자로 폭력적이거나 공격적이거나 성적으로 노골적인 콘텐츠를 제한하는 것을 추구합니다. 또한 이름이 지정된 인물의 이미지가 생성되지 않도록 설계된 필터를 적용합니다. 우리는 모델의 안전과 개인 정보 보호를 개선하기 위해 새로운 기술에 계속 투자할 것입니다.

학습 데이터의 안전을 위한 기술적 보호 장치와 폭력적이거나 모욕적이거나 성적으로 노골적인 콘텐츠를 제한한다. 또한 특정 인물의 이미지가 생성되지 않도록 설계된 필터를 적용하고 있다. 

한편, 구글은 이번 업데이트를 통해 '바드(사용하기)'는 대규모의 창의적인 프로젝트부터 소규모의 일상적인 업무에 이르기까지 모든 분야에서 더욱 유용하고 전 세계적으로 접근 가능한 AI 협업 도구가 될 것이라고 밝혔다. 

제미나이는 구글이 자체 설계한 학습부터 추론까지 모든 AI 워크로드의 성능과 비용을 최적화시키는 TPU(Tensor Processing Units-보기) v4 및 v5e를 사용하여 AI에 최적화된 인프라에서 대규모로 학습했다. 그리고 이를 가장 안정적이고 확장 가능한 훈련 모델이자 가장 효율적으로 서비스할 수 있는 모델로 설계됐다.

TPU에서 Gemini는 이전의 작고 성능이 떨어지는 모델보다 훨씬 빠르게 실행된다. 맞춤 설계된 AI 가속기는 검색, 유튜브(YouTube), Gmail, 구글 지도, 구글 플레이, 안드로이드 등 수십억 사용자에게 서비스를 제공하는 구글 AI 기반 제품의 핵심이다. 또한 전 세계 기업이 대규모 AI 모델을 비용 효율적으로 교육할 수 있도록 지원한다.

또한 구글은 최첨단 AI 모델 학습을 위해 설계된 가장 강력하고 효율적이며 확장 가능한 TPU 시스템인 Cloud TPU v5p를 발표(보기)했다. 이 차세대 TPU는 Gemini의 개발을 가속화하고 개발자와 기업 고객이 대규모 생성 AI 모델을 더 빠르게 훈련하도록 지원하여 새로운 제품과 기능이 고객에게 더 빨리 도달할 수 있도록 돕는다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지