엔비디아, HPE, IBM, 오라클 등 기술 선도기업은 물론, 오픈소스 커뮤니티 및 스타트업들이 래피즈 플랫폼과 통합해 엔드-투-엔드 예측 데이터 분석 성능 대폭 향상

‘래피즈 GPU 가속 오픈 플랫폼’ 홈페이지 캡처
‘래피즈 GPU 가속 오픈 플랫폼’ 홈페이지 캡처

젠슨 황(Jensen Huang) 엔비디아 창립자 겸 CEO는 현지시간 10월 9일부터 11일까지 독일에서 열린 ‘GTC(GPU Technology Conference) 유럽 2018’의 10일 기조연설에서 래피즈 플랫폼을 공개하며, “고성능 컴퓨팅 시장에서 아직 가속화되지 않은 가장 큰 분야가 바로 데이터 분석과 머신러닝” 이라며, “세계 최대 산업들은 무수한 서버에서 머신러닝을 통해 작성된 알고리즘을 사용하여 시장과 환경의 복잡한 패턴을 파악하고 수익에 직접적인 영향을 주는 빠르고 정확한 예측을 수행한다”고 설명했다.

그는 이어 “래피즈 GPU 가속 플랫폼은 쿠다(CUDA)와 이의 글로벌 생태계에 기반해 구축됐으며, 오픈소스 커뮤니티와의 긴밀한 협력 하에 탄생했다. 이 플랫폼은 업계에서 가장 널리 사용되는 데이터 사이언스 라이브러리와 워크플로우에 원활히 통합돼 머신러닝 속도를 향상시킨다. 엔비디아는 딥 러닝에 구현했던 것과 마찬가지로 머신러닝 속도를 대거 끌어올리고 있다”고 말했다.

RAPIDS는 다중 노드, 다중 GPU 배치 지원을 포함하고있어 훨씬 더 큰 데이터 세트 크기에서 대폭 가속화 된 처리 및 학습을 가능하게 한다(도표:홈페이지 캡처)
RAPIDS는 다중 노드, 다중 GPU 배치 지원을 포함하고있어 훨씬 더 큰 데이터 세트 크기에서 대폭 가속화 된 처리 및 학습을 가능하게 한다(도표:홈페이지 캡처)

빅데이터 및 머신러닝(Machine Learning) 용으로 설계된 이 ‘래피즈(RAPIDS™) GPU 가속 플랫폼’은 이미 유수의 업계 선도 기업들이 채택한 이 플랫폼은 대기업들이 대량의 데이터를 분석해 전례 없는 속도로 정확하게 비즈니스 예측을 수행하도록 하며, 래피즈 오픈소스 소프트웨어는 데이터 과학자들이 신용카드 사기 예측, 소매 재고 예측, 고객의 구매 행동 파악 등 매우 복잡한 비즈니스 과제를 해결할 시 엄청난 성능 향상을 제공한다.

데이터 분석에서 GPU의 중요성에 대한 인식이 확대됨에 따라, 데이터브릭스(Databricks), 아나콘다(Anaconda)와 같은 오픈소스 커뮤니티 선구자들부터 HPE, IBM, 오라클(Oracle) 등 기술 선도기업에 이르는 많은 기업들이 래피즈 플랫폼을 지원하고 있다. 연구원들은 연간 200억 달러 규모의 데이터 사이언스 및 머신러닝 용 서버 시장이 과학적 분석 및 딥 러닝과 결합돼 고성능 컴퓨팅 시장의 가치를 360억 달러까지 끌어올릴 것으로 전망하고 있다.

GPU 가속 분석, 머신 러닝, 그리고 곧 추가될 데이터 시각화를 위한 일련의 오픈소스 라이브러리를 제공하는 래피즈는 엔비디아 엔지니어들이 지난 2년간 오픈소스에 기여하는 핵심 관계자들과 긴밀히 협업해 개발한 제품이다. 이 제품은 업계 최초로 과학자들이 GPU에서 전체 데이터 사이언스 파이프라인을 실행하는데 필요한 도구를 제공한다. 엔비디아 DGX-2™ 시스템 교육을 위한 XG부스트(XGBoost) 머신 러닝 알고리즘을 사용하는 초기 래피즈 벤치마킹은 CPU 전용 시스템 대비 50배 빠른 속도를 보여준다. 이를 통해 데이터 과학자들은 자체 데이터 세트 크기에 따라 교육 시간을 기존 며칠에서 몇 시간으로, 몇 시간에서 몇 분으로 단축할 수 있다.

행사장 내외부 전경(사진:엔비디아)
행사장 내외부 전경(사진:엔비디아)

래피즈는 가장 널리 사용되는 파이썬(Python) 데이터 사이언스 툴체인에 GPU 가속을 추가함으로써, 아파치 애로우(Apache Arrow), 팬더스(Pandas), 사이킷-런(scikit-learn)과 같은 주요 오픈소스 프로젝트를 기반으로 구축됐다. 엔비디아는 래피즈에 추가적인 기능과 머신 러닝 라이브러리를 제공하기 위해 오픈소스 생태계에 기여하고 있는 아나콘다, 블래이징DB(BlazingDB), 데이터브릭스, 콴사이트(Quansight), 사이킷-런과 더불어, 우르사 랩(Ursa Labs)의 대표이자 팬더스 및 아피치 애로우 창시자인 웨스 매키니(Wes McKinney), 그리고 가장 빠르게 성장하고 있는 데이터 사이언스 라이브러리인 파이썬과 협력하고 있다.

데이터브릭스의 공동 창립자 겸 최고기술책임자(CTO)이자 아파치 스파크의 창립자인 마테이 자하리아(Matei Zaharia)는 “데이터브릭스는 아파치 스파크 워크로드를 가속화할 수 있는 래피즈의 가능성에 한껏 고무된 상태이다. 아파치 애로우 지원 및 프로젝트 하이드로젠(Project Hydrogen)을 통한 GPU 스케줄링을 포함해 스파크를 네이티브 가속기와 보다 효과적으로 통합할 수 있는 여러 프로젝트를 진행 중이다. 래피즈는 우리 고객의 데이터 사이언스 및 인공지능(AI) 워크로드를 확장시켜줄 새로운 기회”라고 설명했다.

제레미 킹(Jeremy King) 월마트(Walmart) 수석 부사장 겸 CTO는 “래피즈 소프트웨어와 더불어 엔비디아의 GPU 가속 플랫폼은 우리가 데이터를 사용하는 방식을 대폭 개선시켰다. 가장 복잡한 모델도 대규모로 실행할 수 있으며, 한층 정확한 예측이 가능해졌다”며, “래피즈는 엔비디아와 월마트 엔지니어들 간의 긴밀한 협업을 바탕으로 하고 있으며, 이러한 관계를 더욱 발전시켜 나갈 것”이라고 말했다.

한편 GPU 가속 데이터 사이언스 플랫폼인 래피즈는 아파치 애로우로 실행되는 차세대 컴퓨팅 생태계로 엔비디아는 또한 래피즈 플랫폼의 채택 범위를 확대하기 위해 래피즈를 분석 및 데이터 사이언스를 위한 선도적인 오픈소스 프레임워크인 아파치 스파크(Apache Spark)와 통합 중에 있으며, 래피즈 오픈소스 라이브러리(바로가기)는 즉시 액세스 가능하며, 코드는 아파치 라이선스 하에 배포된다. 래피즈 컨테이너 버전은 NVIDIA GPU 클라우드 컨테이너 레지스트리(Cloud container registry)에서 이용 가능하다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지