일론 머스크(Elon Musk) CEO(사진:본지DB)
일론 머스크(Elon Musk) CEO(사진:본지DB)

구글이 GPT-4 넘고, 인간 전문가 능가한 최초의 AI 모델이라며, 생성 AI 판을 바꾼다는 '제미나이' 출시 이슈 속에 7일(현지시간), 스페이스X(SpaceX), 테슬라(Tesla)의 CEO 일론 머스크(Elon Musk)가 자신의 X(트위터) 계정을 통해 대화형 생성 AI 챗봇인 '그록(Grok)'을 출시한다고 밝혔다.

그는 이날 출시에 대한 자세한 내용을 공개하지 않고 "미국의 X의 프리미엄 플러스(Premium+) 가입자"를 위해 출시하고 웹과 앱 iOS 및 안드로이드 버전에서 Grok을 찾을 수 있다고 말했다.

머스크 X 계정 갈무리
머스크 X 계정 갈무리

한편, 일론 머스크는 7월 12일, AI 스타트업 'xAI'를 공식 출범한지 약 4개월 만인 지난달 3일 머스크는 자신의 엑스(X) 계정에 "내일 xAI가 첫 번째 AI를 선별된 그룹에 공개할 것"이라며, "이는 몇 가지 중요한 측면에서 그것은 현존하는 최고의 인공지능"이라고 밝히고 자신의 X계정에 그의 첫 번째 작품인 대화형 생성 AI 챗봇인 '그록(Grok)'에 대한 출시와 정보를 일부 공개했었다.

당시 머스크는 다른 AI 모델에 비해 Grok의 "엄청난 장점"은 X에 "실시간으로 액세스"할 수 있다는 점으로 다른 AI보다 많은 장점과 이점이 있으며 "풍자를 좋아하며" 응답에 "약간의 유머"를 갖도록 설계되었다고 언급했다. 

그록 로고 이미지
그록 로고 이미지

Grok을 구동하는 엔진은 설립후 지난 4개월 동안 개발한 개척 대형언어모델(LLM)인 Grok-1이다. 이 모델은 질의 응답, 정보 검색, 창의적 글쓰기 및 코딩 지원을 포함한 자연어 처리(NLP) 작업을 수행한다.

또한 머스크는 xAI를 설립 발표한 후 330억 개의 매개변수의 프로토타입 LLM(Grok-0)을 학습했다. 이 초기 모델은 표준 LM 벤치마크에서 메타의 라마 2(LLaMA 2-70B) 기능에 근사하지만 학습 리소스는 절반만 사용한다.  지난 2개월 동안 훨씬 더 강력한 최첨단 언어 모델인 Grok-1으로 이어지는 추론 및 코딩 기능을 대폭 개선하여 MMLU(Massive Multitask Language Understanding)과 휴먼에벌(HumanEval) 코딩 작업에서 63.2%, 73%를 각각 달성했다고 밝혔다.

4 가지 표준 머신러닝 벤치마크를 통한 평가 결과(출처:xAI)
4 가지 표준 머신러닝 벤치마크를 통한 평가 결과(출처:xAI)

Grok-1을 통해 달성한 기능 향상을 이해하기 위해 수학과 추론 능력을 측정하도록 설계된 ▷GSM8k: 중학교 수학 단어 문제(Cobbe 외. 2021), 연쇄 사고 프롬프트 사용. ▷MMLU: 다분야 객관식 문제(Hendrycks 외. 2021), 맥락에 맞는 5지선다형 예제 제공. ▷휴먼에벌: 파이썬 코드 완성 과제(Chen 외. 2021), 제로 샷으로 평가 ▷수학: LaTeX로 작성된 중학교 및 고등학교 수학 문제(Hendrycks 외. 2021), 고정된 4샷 프롬프트가 표시된다) 등 4 가지 표준 머신러닝 벤치마크를 사용하여 일련의 평가를 수행했다.

결과적으로 이러한 벤치마크에서 Grok-1은 챗GPT-3.5와 인플렉션(Inflection-1)을 포함한 동급의 다른 모든 모델을 능가하는 강력한 결과를 보여주었으며 GPT-4와 같이 훨씬 더 많은 양의 훈련 데이터와 컴퓨팅 리소스로 훈련된 모델을 능가했었다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지