최신 업계 벤치마크에서 오픈소스 모델을 능가하고, 대부분의 벤치마크에서 GPT-3.5를 뛰어넘는 수준으로, 독점 모델을 오픈소스 모델로 대체하는 추세가 고객 기반 전반에 걸쳐 가속화될 것...

사진은 알리 고드시(Ali Ghodsi) 데이터브릭스 공동창립자 겸 CEO의 발표 모습
사진은 알리 고드시(Ali Ghodsi) 데이터브릭스 공동창립자 겸 CEO의 발표 모습

업계 선도적인 데이터 및 인공지능(AI) 기업 데이터브릭스(Databricks)가 표준 벤치마크에서 모든 오픈소스 모델을 능가하는 범용 대형언어모델(LLM) DBRX를 오픈소스로 공개했다. DBRX는 모든 기업을 위해 맞춤형 고성능 LLM의 학습과 튜닝을 보편화한다.

조직은 DBRX를 통해 더 이상 소수의 폐쇄형 모델에 의존하지 않아도 된다. DBRX는 오늘부터 바로 사용 가능하며, 전 세계 조직은 비용 효율적으로 자체 맞춤형 LLM을 구축, 교육 및 서비스할 수 있다.

알리 고드시(Ali Ghodsi) 데이터브릭스 공동창립자 겸 CEO는 “데이터브릭스는 데이터와 인공지능을 보편화하겠다는 사명 아래 모든 기업에 데이터 인텔리전스를 제공하여 그들이 보유 중인 데이터를 이해하고 이를 활용하여 자체적인 AI 시스템을 구축할 수 있도록 지원하고 있다"고 말했다.

이어 그는 "이번 DBRX 출시는 이러한 노력의 결과물이다”라며 “새롭게 선보인 DBRX는 최신 업계 벤치마크에서 오픈소스 모델을 능가하고, 대부분의 벤치마크에서 GPT-3.5를 뛰어넘는 수준으로, 우리는 독점 모델을 오픈소스 모델로 대체하는 추세가 고객 기반 전반에 걸쳐 가속화될 것으로 기대하고 있다"고 강조했다.

아울러, "뿐만 아니라, DBRX는 전문가 혼합 아키텍처를 사용하기 때문에 초당 토큰 전송 속도가 매우 빠르며 비용 효율적이다. 이러한 점에서 DBRX는 오픈소스 LLM의 새로운 기준을 제시하며, 기업이 자체 데이터를 기반으로 맞춤형 추론 기능을 구축할 수 있는 플랫폼을 제공해 준다”고 말했다.

오픈소스 모델의 업계 벤치마크를 능가하는 DBRX는 언어 이해, 프로그래밍, 수학 및 논리와 같은 표준 업계 벤치마크에서 메타의 라마(Llama 2) 70B 및 '미스트랄 AI(Mistral AI) 8x7B와 같은 기존 오픈소스 LLM보다 뛰어난 성능을 제공한다.

DBRX는 언어 이해(MMLU), 프로그래밍(HumanEval) 및 수학(GSM8K)벤치마크에서 기존 오픈소스 모델보다 뛰어난 성능을 제공한다.(출처:데이터브릭스)
DBRX는 언어 이해(MMLU), 프로그래밍(HumanEval) 및 수학(GSM8K)벤치마크에서 기존 오픈소스 모델보다 뛰어난 성능을 제공한다.(출처:데이터브릭스)

또한, DBRX는 다음 벤치마크에서 GPT-3.5의 성능을 능가한다.

DBRX는 언어 이해(MMLU), 프로그래밍(HumanEval) 및 수학(GSM8K)벤치마크에서 GPT 3.5보다 뛰어난 성능을 제공한다.
DBRX는 언어 이해(MMLU), 프로그래밍(HumanEval) 및 수학(GSM8K)벤치마크에서 GPT 3.5보다 뛰어난 성능을 제공한다.

모델 평가와 성능 벤치마크에 대한 보다 자세한 정보, 그리고 DBRX가 SQL과 같은 내부 사용 사례에서 GPT-4 품질 대비 어떤 경쟁력을 제공하는지에 대한 자세한 정보는 모자이크 리서치 블로그(아래 참조)에서 확인할 수 있다.

효율적인 오픈소스 LLM의 새로운 기준을 제시한 DBRX

데이터브릭스는 효율성을 위해 메가블록스(MegaBlocks-논문) 오픈소스 프로젝트에 기반한 전문가 혼합(MoE, mixture-of-experts) 아키텍처로 DBRX를 최적화했다. 이로 인해 DBRX는 다른 주요 LLM대비 최대 2배 높은 컴퓨팅 효율 등 최고의 성능을 갖추고 있다. 또한 DBRX는 주어진 시간에 360억 개의 매개변수만 사용한다.

하지만 모델 자체는 1,320억 개 파라미터이므로 속도(토큰/초) 대 성능(품질) 측면에서 두 마리 토끼를 모두 잡을 수 있다.

또한, DBRX는 모든 기업이 커스터마이징할 수 있는 투명한 생성형 AI로 오픈소스 모델의 새로운 기준을 제시한다. 최근 미국 VC 기업 안드레센 호로위츠가 발표한 조사 결과(보기)에 따르면 AI 리더의 약 60% 가 오픈소스 사용을 늘리거나 미세 조정된 오픈소스 모델이 폐쇄형 모델의 성능과 거의 일치할 경우, 오픈소스로 전환하는데 관심을 보이는 것으로 나타났다.

데이터브릭스는 2024년 이후에는 상당수의 기업이 폐쇄형에서 오픈소스로 전환할 것으로 예상되며, 데이터브릭스는 DBRX가 이러한 추세를 더욱 가속화할 수 있을 것이라고 확신한다고 밝혔다.

DBRX 로고 이미지
DBRX 로고 이미지

데이터 인텔리전스 플랫폼에서 엔터프라이즈급 기능 제공

DBRX는 데이터브릭스 모자이크 인공지능의 통합 툴링과 결합되어, 고객이 데이터와 지적 재산에 대한 제어권을 유지하면서도 안전하고 정확하며 관리 가능한 생산 품질의 생성형 AI 애플리케이션을 신속하게 구축 및 배포할 수 있도록 지원한다.

고객은 데이터 관리, 거버넌스, 리니지 및 모니터링 기능이 내장된 데이터브릭스의 데이터 인텔리전스 플랫폼의 다양한 이점을 누릴 수 있다.

한편, DBRX는 이미 생성 AI 기반 제품에 통합되고 있으며 SQL과 같은 애플리케이션의 초기 출시는 GPT-3.5 Turbo를 능가하고 GPT-4 Turbo에 도전하고 있다. 오픈형 모델과 GPT-3.5 Turbo on RAG 작업 중에서도 선도적인 모델이기도 하다.

DBRX는 깃허브(GitHub-다운)와 허깅 페이스(Hugging Face-다운)에서 연구 및 상업적 용도로 모두 무료로 사용 가능하다. 기업은 이제 데이터브릭스 플랫폼에서 DBRX와 상호 작용하고, 검색 증강 생성(RAG) 시스템에서 긴 문장(context) 기능을 활용하며, 자체 고유 데이터에서 맞춤형 DBRX 모델을 구축할 수 있다.

기본 모델(DBRX Base-다운)과 미세 조정 모델(DBRX Instruct-다운)은 허깅 페이스(Hugging Face)에서 사용할 수 있다. 현재, 데이터브릭스 고객은 API를 통해 DBRX를 사용할 수 있으며, 자체 DBRX 클래스 모델을 처음부터 사전 학습하거나 이를 구축하는 데 사용한 것과 동일한 도구를 사용하여 체크포인트 중 하나에서 계속 학습할 수 있다.

모자이크 AI 리서치 화면 갈무리
모자이크 AI 리서치 화면 갈무리

또한, AWS와 구글 클라우드(Google Cloud)뿐만 아니라, 애저 데이터브릭스(Azure Databricks)를 통해 마이크로소프트 애저(Microsoft Azure)에서도 직접 사용할 수 있다. DBRX에 대한 보다 자세한 정보는 모자이크 AI 리서치(보기) 블로그에서 확인할 수 있다. 데이터브릭스는 오는 4월 26일 한국시간 오전 12시에 DBRX 웨비나를 개최할 예정이다.

이번 데이터브릭스의 'DBRX' 공개에 따른 업계 주요 리더들은 아래와 같이 언급했다.

란 구안(Lan Guan) 액센츄어(Accenture) 최고 AI 책임자는 “액센츄어는 파운데이션 모델 커스터마이징 서비스를 통해 고객별 요구사항에 따라 오픈소스 모델을 맞춤화하는 고급 기술로 생성형 AI 솔루션 구현에 앞장서고 있다"며, "보다 정교한 오픈소스 모델은 기업의 모든 측면에서 고객을 위한 의미 있는 결과를 도출하도록 새로운 기회를 열어줄 수 있다"고 말했다.

더크 그로네벨트(Dirk Groeneveld) 앨런 인공지능 연구소(Allen Institute for Artificial Intelligence, AI2) 수석 소프트웨어 엔지니어는 "우리는 AI의 변곡점에 서 있으며, AI를 더 잘 이해하고 의미 있는 혁신을 추진할 수 있는 연구원, 엔지니어 및 기술자 커뮤니티의 역할이 요구되고 있다. 이에 AI2 팀은 개방형 모델을 개발해 생성형 AI를 발전시키는 데 전념하고 있다. DBRX와 같은 새로운 모델이 업계의 투명성, 접근성 및 협업 향상에 긍정적인 변화를 가져다줄 것이라고 기대한다"고 말했다.

마이크 오루크(Mike O'Rourke) 나스닥(NASDAQ) AI 및 데이터 서비스 총괄은 "데이터브릭스는 나스닥의 가장 중요한 데이터 시스템 부문의 핵심 파트너로서 협력하고 있다. 데이터 관리와 인공지능 활용을 선도하는 기업인 만큼, 이번 DBRX 출시에 기대도 크다. 나스닥이 생성형 AI의 사용을 확대하는 가운데, DBRX의 강력한 모델 성능과 유리한 경제적 효과는 우리가 추구하는 혁신의 모습에도 부합한다"고 말했다.

미셸 카타스타(Michele Catasta) 리플릿(Replit) AI 부문 부사장은 "리플릿은 10억 명의 차세대 소프트웨어 개발자를 위해 코딩에 대한 접근을 대중화하겠다는 목표로 데이터브릭스의 모자이크 AI 팀과 긴밀히 협력해 맞춤형 LLM을 구축해 왔다. 강력한 DBRX 오픈소스 모델의 출시로 조직 자체 데이터에 맞춤화된 안전한 생성형 AI 모델의 채택이 가속화될 것으로 예상한다"고 말했다.

첸광 주(Chenguang Zhu) 줌(Zoom) GenAI 사이언스 부문 총괄은 "줌은 LLM의 힘을 활용하여 줌 AI 컴패니언(Zoom AI Companion)과 같은 새로운 플랫폼을 구현해 왔다”며 “핵심 사용 사례에서 맞춤형 생성형 AI 모델의 교육 및 제공을 보다 신속하고 비용 효율적으로 실행하고, DBRX의 잠재력을 확인할 수 있기를 기대한다”고 말했다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지