‘허깅페이스 오픈 LLM 리더보드’에서 세계 1위에 올라...70B 매개변수로 구성된 경량 모델로 오픈AI의 GPT-3.5 성능 추월, 글로벌 톱 생성 AI 모델로 자리매김

김성훈 대표(가운데)는 “업스테이지의 생성 AI 모델이 챗GPT를 능가하는 성능으로 세계 최고 수준의 기술력을 확인하게 되어 기쁘다”고 전했다(왼쪽부터,이활석 CTO, 김성훈CEO, 박은정CSO/사진:본지DB).
김성훈 대표(가운데)는 “업스테이지의 생성 AI 모델이 챗GPT를 능가하는 성능으로 세계 최고 수준의 기술력을 확인하게 되어 기쁘다”고 전했다(왼쪽부터,이활석 CTO, 김성훈CEO, 박은정CSO/사진:본지DB).

국내 대표 AI 스타트업 업스테이지(대표 김성훈)는 자사가 개발한 생성 AI 모델이 세계 최대 머신러닝 플랫폼 허깅페이스의 ‘오픈 LLM(Large Language Model) 리더보드’ 평가 점수에서 72.3점을 획득, 챗GPT의 기반인 GPT-3.5 성능을 뛰어넘고 8월 1일 부로 최종 1위를 차지하는 쾌거를 이뤄냈다.

허깅페이스 오픈 LLM 리더보드는 오픈소스 생성 AI 모델의 바로미터로 꼽힌다. 전 세계 500여개의 오픈 모델들이 추론과 상식 능력, 언어 이해 종합능력 및 환각현상(할루시네이션) 방지 등 4가지 지표의 평균 점수로 경쟁, 공신력 있는 순위가 매겨진다.

앞서 지난 달 업스테이지가 허깅페이스를 통해 공개한 30B(300억) 매개변수 모델은 평균 67점을 획득, 같은 날 발표된 메타의 ‘라마(LLaMA) 2’ 70B(700억) 모델을 추월하고 국내 대형언어모델 최초 1위에 올랐었다.

이에 업스테이지는 더 많은 데이터로 최신 라마 2 70B 매개변수 기반으로 파인튜닝한 모델을 내놓으며 글로벌 1위 굳히기에 나섰다. 그 결과, 새롭게 공개된 업스테이지 70B 모델은 리더보드 평가에서 72.3점을 기록, 라마2 발표 이후 순위를 차지한 미국 스테빌리티(Stability) AI의 ‘스테이블 벨루가2’ 모델(71.4점)을 뛰어넘고 세계 1위를 재탈환한 것이다.

사진은 허깅페이스 오픈 LLM 리더보드 순위에서 업스테이지의 모델이 1위를 차지한 모습
사진은 허깅페이스 오픈 LLM 리더보드 순위에서 업스테이지의 모델이 1위를 차지한 모습

특히, 업스테이지의 최신 모델은 챗GPT의 기반이 되는 GPT-3.5의 벤치마크 평가(71.9점) 점수를 넘기는 이변을 연출했다. 허깅페이스 리더보드 기준 생성 AI 모델의 대명사 격인 GPT-3.5의 점수를 능가한 사례는 업스테이지가 최초로, 토종 스타트업이 개발한 소형 LLM이 글로벌 빅테크 기업의 초거대 모델과 견주어도 충분한 경쟁력이 있다는 것을 증명했다.

또한 업스테이지는 AI 올림픽으로 불리는 ‘캐글(Kaggle)’ 경진대회와 국제 학회 논문상 등을 휩쓴 최고의 인력을 투입, 두 달여 만에 GPT-3.5를 상회하는 모델을 개발했다. 

최초의 한국어 자연어이해(NLU) 평가 데이터셋 ‘클루(KLUE)’를 구축하고, OCR 세계대회인 ICDAR에서 4개종목 우승, 그리고 130만 이용자를 돌파한 국내 대표 멀티모달 생성 AI 서비스 ‘아숙업(AskUp)’ 운영으로 축적된 프롬프트 엔지니어링 및 파인튜닝 노하우 등 업스테이지만의 차별화된 기술 자산을 총 결집한 결과다.

업스테이지는 이를 발판으로 세계적인 경쟁력을 인정받은 자사의 AI 모델 상용화를 통해 본격적인 ‘프라이빗(Private) AI’ 시장 개척에 나선다. 프라이빗AI는 기업 내부 데이터만 학습해 정보 유출을 막고 잘못된 정보를 생성하는 환각 현상을 방지하는데 특화된 솔루션으로, 보안 이슈 등으로 생성 AI 도입을 주저하는 기업들에게 매력적인 대체재로 각광받고 있다.

기업들은 글로벌 톱 수준의 업스테이지 LLM 기반의 프라이빗 AI를 도입함으로써 최신 생성 AI 기술을 손쉽게 구축하고 활용할 수 있을 전망이다. 특히, 업스테이지는 최소 수천억이 넘는 매개변수로 구성된 빅테크 기업의 거대 LLM보다 경량화된 모델 사이즈로 더욱 뛰어난 성능을 제공, 도입 및 운용 비용도 크게 절감할 수 있다.

업스테이지의 김성훈 대표는 “업스테이지의 생성 AI 모델이 챗GPT를 능가하는 성능으로 세계 최고 수준의 기술력을 확인하게 되어 기쁘다”며 “앞으로 업스테이지는 압도적인 기술력을 바탕으로 국내외 프라이빗AI 시장 지배력 강화에 박차를 가할 것”이라고 말했다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지