새로운 GPU 오퍼레이터, 헬름 차트, NGC-레디 시스템을 통해 엣지에서부터 하이브리드 플랫폼에 이르는 마이그레이션 지원

인공지능(AI)은 더 이상 단순한 연구 프로젝트가 아니다. 조직들은 AI를 통해 실질적인 문제를 해결하고 있으며, 더 빠른 결정을 내리기 위해 AI 모델을 어디에 배치해야 할지 알아야 한다. AI와 IoT, 5G 인프라가 융합되면서 기업은 데이터 센터를 넘어 엣지에 이르기까지 수십억 개의 센서가 데이터를 스트리밍하고 실시간 의사결정을 하는 모델을 구축할 수 있다.

현지시간 10월 22일부터 24일까지 미국 로스앤젤레스에서 개최되는 이동통신 박람회 ‘MWC 2019 로스앤젤레스’에서 엔비디아가 EGX 엣지(NVIDIA EGX Edge) 슈퍼컴퓨팅 플랫폼과 NGC-레디 포 엣지(NGC-Ready for Edge) 시스템을 공개하며 NGC-레디 프로그램의 확장을 알렸다.

AI 배포 간소화하는 ‘NGC-레디 포 엣지’ 공개
AI 배포 간소화하는 ‘NGC-레디 포 엣지’ 공개

AI 워크로드를 대규모로 구현하는 기업은 온프레미스 데이터 센터와 클라우드를 결합해 AI 모델을 데이터가 수집되는 위치로 불러오고 있다. 데이터 센터에 대한 IT 전문 지식이 없는 경우, 소매점이나 주차장과 같은 엣지에 위치한 워크로드를 배치하는 일은 어려울 수 있다.

쿠버네티스(Kubernetes)는 애플리케이션 배포, 관리, 확장에 관련된 많은 수동 프로세스를 제거한다. 온프레미스, 엣지 및 클라우드 환경 전반에 걸쳐 일관된 클라우드 네이티브 구축 접근 방식을 제공한다. 그러나, 원격으로 수백 또는 수천 개의 애플리케이션을 관리하도록 쿠버네티스 클러스터를 설정하는 일은 매우 번거로울 수 있다. 엔비디아 EGX 엣지(NVIDIA EGX) 슈퍼컴퓨팅 플랫폼을 통해 이러한 과제를 해결할 수 있다고 한다.

특히 AI 배포 간소화 시키는 엔비디아 EGX는 대규모 하이브리드 클라우드 및 엣지 운영을 가능하게 하고 이를 효율적으로 수행할 수 있게 하도록 설계된 클라우드 네이티브 소프트웨어 정의 플랫폼이다.

플랫폼 내에는 엔비디아 드라이버, 쿠버네티스 플러그인, 엔비디아 컨테이너 런타임 및 GPU 모니터링 도구가 포함된 EGX 스택이 있으며, 엔비디아 GPU 오퍼레이터(Operator)를 통해 제공된다. 운영자는 운영 지식과 워크플로우를 코드화하여 쿠버네티스를 통해 컨테이너형 애플리케이션의 라이프사이클 관리를 자동화한다.

GPU 오퍼레이터는 GPU 지원 쿠버네티스 시스템 프로비저닝에 필요한 모든 구성 요소의 배포를 표준화하고 자동화하기 위한 헬름 차트(Helm Chart)가 구축되어 있는 클라우드 네이티브 방식이다. 엔비디아와 클라우드 네이티브 커뮤니티에 속한 레드햇(Red Hat)을 비롯한 다른 업체는 GPU 오퍼레이터를 만들기 위해 협력했다.

GPU 오퍼레이터는 또한 IT 팀이 CPU 기반 시스템을 관리하는 것과 동일한 방식으로 원격 GPU 파워 서비스를 관리할 수 있도록 해준다. 따라서, 단일 이미지로 구성된 원격 시스템을 쉽게 도입할 수 있으며, 추가적인 전문 지식 없이도 엣지 AI 애플리케이션을 실행할 수 있다.

EGX 스택 아키텍처는 캐노니컬(Canonical), 시스코(Cisco), 마이크로소프트(Microsoft), 뉴타닉스(Nutanox), 레드햇, VM웨어(VMware)와 같은 하이브리드 클라우드 관리 파트너의 지원을 받아 구축을 더욱 단순화하고 클라우드, 데이터 센터에서부터 엣지까지 일관된 환경을 제공한다.

또한 세계 선두의 서버 제조사가 제공하는 NGC-레디 시스템은 엔비디아의 GPU 최적화된 컨테이너용 소프트웨어 허브인 NGC에서 AI 소프트웨어의 기능과 성능을 검증한다. 이는 엣지 구현을 위한 기본적인 요건이며, 검증된 시스템은 EGX 스택 실행에 이상적이고 하이브리드 구축을 용이하게 한다.

검증된 NGC-레디 포 엣지 시스템은 어드밴텍(Advantech), 알토스 컴퓨팅(Altos Computing), 애즈락 랙(ASRock Rack), 아토스(Atos), 델 테크놀로지스(Dell Technologies), 후지쯔(Fujitsu), 기가바이트(GIGABYTE), 휴렛팩커드 엔터프라이즈(HPE), 레노버(Lenovo), 미텍(MiTAC), QCT, 슈퍼마이크로(Supermicro), 타이안(TYAN)을 포함한 세계 주요 제조업체에서 제공된다.

NGC는 현재 AI 소프트웨어 배포와 관리를 위한 헬름 차트 레지스트리를 제공한다. 헬름 차트는 강력한 클라우드 네이티브 툴로, 애플케이션 구축 방법과 위치를 커스터마이징하고 자동화한다.

NGC 헬름 차트 레지스트리는 AI 프레임워크, GPU 오퍼레이터, 의료 이미징을 위한 엔비디아 클라라(Clara), 스마트 시티, 스마트 리테일, 산업 검사를 위한 엔비디아 메트로폴리스(Metropolis)를 포함한 엔비디아 소프트웨어를 포함한다. NGC는 차량 분석을 위한 딥비전(DeepVision), 비디오 검색을 위한 아이언윈(IronYun), 스트리밍 분석을 위한 키네티카(Kinetica)을 포함한 서드파티 AI 애플리케이션을 위한 헬름 차트도 호스팅한다.

NGC-레디 서포트 서비스를 통해 개발자와 운영팀은 자체 NGC-레디 포 엣지 시스템이 헬름 차트를 푸시하고 공유할 수 있도록 프라이빗 헬름 레지스트리에 액세스할 수 있다. 이를 통해 운영팀은 일관되고 안전하며 신뢰할 수 있는 환경을 활용해 지속적인 통합과 구축 주기를 단축할 수 있다.

GPU 기반 쿠버네티스 클러스터를 여러 플랫폼에 걸쳐 쉽게 프로비저닝하고 헬름 차트와 컨테이너를 사용해 AI 애플리케이션을 신속하게 배포할 수 있다. 

저작권자 © 인공지능신문 무단전재 및 재배포 금지