소형언어모델(SLM) ‘솔라’ 내달 31일까지 무료로 공개...간단한 API 호출로 대화형 모델과 GPT-4 뛰어넘는 번역 특화 모델 등 2종류 지원

업스테이지, 자체 언어모델 ‘솔라’ API 공개 이미지
업스테이지, 자체 언어모델 ‘솔라’ API 공개 이미지

매개변수의 수가 60억(6B) 내지 100억(10B) 개로 줄여 학습을 위한 소요 비용이나 시간을 절감할 수 있으며, 미세조정(Fine-Tuning)으로 정확도를 높이고 다른 애플리케이션과 통합하기도 쉬운 모델을 '경량화 대형언어모델(smaller Large Language Model, sLLM)' 또는 소형언어모델(Small Language Model. 이하, SLM)이라고 한다.

특히, 특정 분야에서는 미세조정과 고품질의 데이터 학습을 통해 기존 LLM과 맞먹는 성능을 보여주는 것도 장점으로 빅테크를 뛰어넘은 세계 최고의 SLM을 무료로 사용해볼 수 있다.

업스테이지(대표 김성훈)는 인공지능 챗봇, 대화형 시스템, 문서 생성과 같은 다양한 자연어 처리(NLP) 작업과 생성AI 모델의 기본이 되는 자사의 사전학습 언어 모델 ‘솔라(Solar)’ 베타 버전을 22일 출시하고 내달 31일까지 해당 모델을 무료로 공개한다.

간단한 API 호출을 통해 일반 대화형 모델과 번역 특화 모델 등 2종류 모두 써볼 수 있다(보기). 

솔라는 지난 12월 허깅페이스 ‘오픈 LLM 리더보드’에서 알리바바, 미스트랄AI 등 빅테크 모델을 제치고 1위를 차지한 세계 최고 SLM이다. 작지만 강력한 성능과 GPT-3.5 대비 2.5배 이상 빠른 속도가 특징이다. 프롬프트 당 최대 4,000 토큰을 입력할 수 있으며, 향후 베타 버전을 필두로 ‘믹스트랄 8x7B’ (32,000 토큰), ‘라마 2’ (16,000 토큰) 등 빅테크 모델을 크게 뛰어넘는 64,000 토큰까지 처리 규모를 확대한다.

또한, 함께 공개하는 번역 모델은 기계번역 평가의 바로미터로 여겨지는 메타의 ‘플로레스(Flores)’ 벤치마크 테스트에서 GPT-4, 딥엘(DeepL) 등의 모델보다 높은 점수를 기록했다. 특히, 단순 문장 번역을 넘어 전후 문맥을 종합해 의미를 추론하고, 대화의 맥락과 흐름까지 기억할 수 있어 정확도를 극대화했다. 한-영 및 영-한 번역을 제공하며, 최대 32,000개의 토큰을 처리할 수 있다.

솔라 베타 테스트는 22일부터 3월 31일까지 5주간 진행된다. 업스테이지 홈페이지에서 간단한 등록만 하면 해당 기간 동안 솔라를 무료로 사용할 수 있다. 특히, 별도의 구축 작업 없이 API 호출만으로 손쉽게 도입이 가능해, 기존에 생성형 AI를 활용 중이거나 도입을 고민하던 기업 모두에게 최적의 선택지를 제공할 예정이다.

아울러, 업스테이지는 솔라 생태계 확장과 기업들의 생성형 AI 혁신을 지원하고자 특별한 이벤트를 준비했다. 솔라 베타 버전을 활용한 기업들을 대상으로 창의성, 기술 혁신성 등 다양한 부문을 평가해 최대 10곳의 우수 사례를 선발, 한화로 총 3억여 원 상당의 API 크레딧을 증정한다. 이벤트 참여는 업스테이지 홈페이지를 통해 별도 응모할 수 있다.

향후 업스테이지는 글로벌 무대에서 확인한 범용 모델의 기술력과 GPT-4를 뛰어넘는 번역 도메인에서의 성과 등을 필두로 ‘목적별 특화(purpose-trained)’ 언어 모델 고도화에 박차를 가한다. 이를 통해 금융, 보험, 의료, 교육 등 다양한 영역의 기업 맞춤형으로 적용할 수 있는 SLM을 주력으로 글로벌 시장을 공략한다는 구상이다.

업스테이지 김성훈 대표는 “많은 분들이 세계 1위의 SLM 업스테이지 솔라를 써보실 수 있도록 베타 버전을 공개하게 되어 기쁘다”라며 “앞으로 업스테이지는 GPT-4를 뛰어넘는 번역 특화 모델 등 다양한 도메인에 맞춤형으로 적용할 수 있는 모델을 개발, 국내를 넘어 글로벌 생성형 AI 생태계 확장에 힘쓸 것”이라고 밝혔다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지