텐서RT 추론 가속기로 ONNX 호환성 및 MXNet 1.0 즉각 지원 기능도 추가

엔비디아 GPU 클라우드 타이탄 X(사진:엔비디아)
엔비디아 GPU 클라우드 타이탄 X(사진:엔비디아)

엔비디아가 데스크톱 GPU를 사용하는 수십만 인공 지능 개발자들을 위해 엔비디아 타이탄(NVIDIA TITAN)에서 엔비디아 GPU 클라우드(NVIDIA GPU Cloud, NGC) 지원을 확장한다. 또한, 신규 소프트웨어 및 NGC 컨테이너 레지스트리 주요 업데이트 등 추가된 NGC 기능들을 5일 발표했다.

이를 통해 엔비디아는 인공지능 개발자들에게 AI 고성능 컴퓨팅(HPC) 연구 및 개발을 향상시킬 수 있는 보다 광범위하고 강력한 도구를 제공할 수 있게 된 것이며, 엔비디아 파스칼™(Pascal™) 아키텍처 기반 타이탄 GPU를 사용하는 고객들은 무료 NGC 계정 등록을 통해 GPU 최적화된 딥 러닝과 HPC 소프트웨어 및 도구의 포괄적인 카탈로그를 이용할 수 있다.

엔비디아 DGX-1 및 DGX 스테이션, 그리고 아마존 EC2상에서의 엔비디아 볼타 지원 인스턴스 등 다른 컴퓨팅 플랫폼도 지원되며, 빠르게 확장하는 NGC의 컨테이너 레지스트리를 통해 제공되는 소프트웨어에는 텐서플로우(TensorFlow) 및 파이토치(PyTorch) 등 엔비디아 최적화된 딥 러닝 프레임워크, 타사 관리 HPC 애플리케이션, 엔비디아 HPC 시각화 도구 및 엔비디아의 프로그래밍 가능한 추론 가속기인 엔비디아 텐서™RT 3.0(NVIDIA TensorRT™ 3.0) 등이 있다.

이로써 엔비디아 데스크톱 GPU를 사용하는 수십만 명의 연구진들이 GPU에 최적화된 소프트웨어를 사용할 수 있게 되면서, NGC는 인공 지능의 획기적인 발전을 위한 촉매제가 될 것이며 전세계 개발자들을 위한 자원이 될 것이며, NGC를 이용한 최초의 의료기기 업체인 GE 헬스케어는 NGC 컨테이너 레지스트리에서 딥 러닝 소프트웨어를 사용해 전 세계 50만 대의 의료 영상 기기에 최첨단 인공지능을 도입하는 등 보다 향상된 의료 서비스를 위해 신기술 도입을 가속화하고 있다.

새로운 NGC 컨테이너, 업데이트 및 기능으로는 Open Neural Network Exchange (ONNX)에서 텐서RT 지원, MXNet 1.0 출시와 함께 즉각적인 이용 및 지원 가능, 바이두 패들패들(PaddlePaddle) 인공지능 프레임워크 이용 등이 가능해졌으며, ONNX는 페이스북과 마이크로소프트가 만든 개방형 포맷으로, 개발자들은 서로 다른 프레임워크에서 모델을 교환 할 수 있다. 엔비디아는 텐서RT 개발 컨테이너에서 ONNX 모델을 텐서RT 추론 엔진에 배포하기 위한 변환기를 만들었다. 이에 애플리케이션 개발자는 텐서RT에 대기 시간이 짧고 처리량이 많은 모델들을 쉽게 배포 할 수 있는 것이다.

한편 이러한 기능들을 통해 개발자는 연구 및 애플리케이션 개발에서부터 트레이닝 및 배포에 이르기까지 인공지능 컴퓨팅 요구 사항을 모두 지원하는 소프트웨어를 원 스톱으로 공급하며, 지난 10월에 출시된 NGC는 아마존 웹서비스(AWS) 상의 엔비디아 볼타 GPU 사용자들과 모든 엔비디아 DGX-1 및 DGX 스테이션 고객들에게 무료로 제공된다

저작권자 © 인공지능신문 무단전재 및 재배포 금지