사용 가능한 모델에는 개발자가 독점 데이터로 커스터마이징을 간소화할 수 있도록 형식이 지정된 라마 2, 스테이블 디퓨전 XL, 미스트랄 등과 같은 선도적인 커뮤니티 모델이 포함...새로운 네모트론-3 8B 모델은 한국어를 비롯한 영어, 독일어, 일본어 등 50개 이상의 언어를 지원

엔비디아 NGC 카탈로그 갈무리
엔비디아 NGC 카탈로그 갈무리

지난해 말부터 오픈 소스로 공개된 대형 언어 모델(LLM, Large Language Models) 환경은 기업에게 마치 뷔페와 같다. 생성 AI 애플리케이션을 구축하는 개발자에게는 이러한 방대한 양이 부담스러울 수 있다. 호환성, 보안, 모델 훈련에 사용되는 데이터 등 고유한 프로젝트와 비즈니스 요구 사항을 탐색해야 하기 때문이다.

이에, 엔비디아가 기업을 위한 맞춤형 생성형 AI 모델 개발 가속화를 지원한다고 15일(현지시간) 발표했다. 이를 통해 개발자는 새로운 엔비디아 AI 파운데이션 모델(NVIDIA AI Foundation Models)을 통해 브라우저에서 직접 실험하고, 엔비디아 AI 파운데이션 엔드포인트(AI Foundation Endpoints)에서 애플리케이션 테스트와 고유한 비즈니스 데이터로 커스터마이징할 수 있다.

엔비디아 AI 파운데이션 모델은 엔터프라이즈급 사전 훈련된 모델의 엄선된 모음으로, 개발자가 엔터프라이즈 애플리케이션을 위한 맞춤형 생성형 AI 모델을 즉시 시작할 수 있도록 지원한다.

엔비디아 AI 파운데이션 모델을 브라우저에서 직접 간편한 사용자 인터페이스 또는 API를 통해 경험할 수 있다. 이러한 모델들은 엔터프라이즈 애플리케이션 내에서 성능을 테스트하기 위해 엔비디아 AI 파운데이션 엔드포인트에서 직접 액세스할 수 있다.

사용 가능한 모델에는 개발자가 독점 데이터로 커스터마이징을 간소화할 수 있도록 형식이 지정된 라마 2(Llama 2), 스테이블 디퓨전 XL(Stable Diffusion XL), 미스트랄(Mistral)과 같은 선도적인 커뮤니티 모델이 포함된다.

아울러 최고의 처리량과 가장 낮은 지연 시간을 제공하고 모든 엔비디아 GPU 가속 스택에서 대규모로 실행될 수 있도록 엔비디아 텐서RT-LLM(TensorRT-LLM)으로 최적화됐다. 예를 들어, 텐서RT-LLM으로 최적화된 라마 2 모델은 엔비디아 H100에서 거의 2배 빠르게 실행된다.

새로운 네모트론-3 (Nemotron-3) 8B 파운데이션 모델 제품군은 헬스케어, 통신, 금융 서비스를 포함한 광범위한 산업 분야에서 오늘날 가장 진보된 엔터프라이즈 채팅과 Q&A 애플리케이션을 제작할 수 있도록 지원한다.

이 모델은 안전하고 프로덕션용 생성형 AI 애플리케이션을 구축하는 고객을 위해 출발점이다. 이는 엄격하게 소싱된 데이터세트를 기반으로 학습되며, 훨씬 더 큰 모델과 비슷한 성능으로 작동하므로 엔터프라이즈 배포에 이상적이다.

네모트론-3 8B 모델의 다국어 기능은 핵심적인 차별화 요소이다. 기본적으로 영어, 독일어, 러시아어, 스페인어, 프랑스어, 일본어, 중국어, 한국어, 이탈리아어, 네덜란드어 등 50개 이상의 언어를 능숙하게 지원한다.

특히, 비즈니스 기능 전반에 걸쳐 생성형 AI를 활용하는 기업에는 고유한 애플리케이션에 맞게 맞춤형 모델을 제작할 수 있는 AI 파운드리가 필요하다.

엔비디아의 AI 파운드리는 엔비디아 AI 파운데이션 모델, 엔비디아 네모(NeMo) 프레임워크와 툴, 엔비디아 DGX 클라우드(DGX Cloud) AI 슈퍼컴퓨팅 서비스 등 세 가지 요소로 구성됐다. 이 세 가지 요소를 함께 사용해 맞춤형 생성형 AI 모델을 제작할 수 있는 엔드투엔드 엔터프라이즈 제품을 제공한다

커스터마이징된 모델을 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어를 통해 엔터프라이즈급 보안, 안정성과 지원과 함께 가속 컴퓨팅의 거의 모든 곳에 배포할 수 있다.

한편, 엔비디아 AI 파운데이션 모델은 엔비디아 NGC 카탈로그(보기)와 허깅 페이스(Hugging Face)에서 무료로 사용할 수 있으며, 마이크로소프트 애저(Microsoft Azure) AI 모델 카탈로그에서도 호스팅된다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지