인텔, 델 테크놀로지스, 엔비디아, OSC와 함께 과학 및 연구 분야의 AI 혁신을 지원하기 위한 차세대 고성능 컴퓨팅 클러스터 계획 공개

오하이오 슈퍼컴퓨터 센터의 프란타 바틱(Franta Bartik) 데이터센터 엔지니어가 2024년 후반에 출시될 예정인 카디널 클러스터의 테스트 노드에서 작업하고 있는 모습(사진:OSC)
오하이오 슈퍼컴퓨터 센터의 프란타 바틱(Franta Bartik) 데이터센터 엔지니어가 2024년 후반에 출시될 예정인 카디널 클러스터의 테스트 노드에서 작업하고 있는 모습(사진:OSC)

인공지능(AI) 분야에서 산업 혁신을 주도하고 있는 美 오하이오 슈퍼컴퓨터 센터(Ohio Supercomputer Center. 이하, OSC)는 인텔, 델 테크놀로지스(Dell Technologies), 엔비디아(Nvidia)와 협업한 최첨단 고성능 컴퓨팅(HPC) 클러스터인 카디널(Cardinal)을 지난 20일(현지시간) 공개했다.

카디널은 연구, 교육 및 산업 혁신, 특히 인공지능(AI) 분야에서 증가하는 지역 내 HPC 리소스 수요를 충족하기 위해 특별히 설계되었다.

OSC의 전무이사인 데이비드 후닥(David Hudak)은 "새로운 클러스터는 오하이오가 대학은 물론 민간 부문의 수요를 충족하고 초과하는 데 도움이 될 것이며, 이 신기술을 통해 우리는 연구 및 혁신을 위해 HPC를 사용하는 더 많은 분야에 힘을 실어줄 것입니다“라며, ”AI 및 머신러닝의 사용 확대를 촉진하고 미래 교육 인프라에 기여 할 것입니다“라고 말했다.

이어 그는 “과학, 엔지니어링, 생명의학 분야에서는 연구 문제를 해결하기 위해 AI와 머신러닝을 활용해 왔으며 농업 과학, 건축, 사회학 등의 분야를 포함한 더 많은 학문 분야에서도 이러한 도구를 채택하고 있습니다”라며, ”Cardinal은 증가하는 AI 작업량을 처리할 수 있는 최신 하드웨어를 선보일 것입니다“라고 덧붙였다.

인공지능과 머신러닝은 과학, 공학, 바이오 의학 분야에서 복잡한 연구 문제를 해결하기 위해 필수적으로 활용되고 있다. 이러한 기술의 효능이 지속적으로 입증되면서 농업 과학, 건축학, 사회학과 같은 학문 분야에서도 활용도 늘어나고 있다.

카디널 클러스터는 증가하는 AI 워크로드의 수요를 충족할 수 있는 하드웨어를 갖추고 있다. 기능과 용량 모든 면에서 이번 새로운 클러스터는 2016년에 출시된 오웬스 클러스터(Owens Cluster)를 대체할 시스템보다 더 대규모의 업그레이드가 될 것이다.

카디널 클러스터는 메모리 사용량이 많은 HPC 및 AI 워크로드를 효율적으로 관리하는 동시에 프로그래밍 기능, 이식성(portability) 및 에코시스템 채택을 촉진하는 기반이 되는 델 파워엣지(Dell PowerEdge) 서버와 고대역폭 메모리(HBM)를 갖춘 인텔® 제온® CPU 맥스 시리즈(Intel® Xeon® CPU Max Series)를 활용한 이기종 시스템이다.

2024년에 출시될 예정인 새로운 Dell Technologies 기반 클러스터인 오하이오 슈퍼컴퓨터 센터의 Cardinal에 대한 테스트 노드(사진:OSC)
2024년에 출시될 예정인 새로운 Dell Technologies 기반 클러스터인 오하이오 슈퍼컴퓨터 센터의 Cardinal에 대한 테스트 노드(사진:OSC)

이 시스템 주요 특징은 총 39,312 CPU 코어를 제공하는 756개 맥스 시리즈(Max Series) CPU 9470 프로세서와 128 기가바이트(GB) HBM2e 및 노드 당 512 GB의 DDR5 메모리, 단일 소프트웨어 스택과 x86 기반 기존 프로그래밍 모델을 갖춘 이 클러스터는 광범위한 사용 케이스를 처리하고 쉽게 도입 및 배포할 수 있도록 지원하면서 OSC의 처리 능력을 두 배 이상 향상시킬 수 있다.

이 시스템은 또한 32개의 노드로 104개의 코어, 1테라바이트(TB)의 메모리, 4개의 NV링크(NVLink) 연결로 상호 연결된 94GB HBM2e 메모리를 갖춘 엔비디아 호퍼 아키텍처 기반 H100 텐서 코어(H100 Tensor Core) GPU 4개 탑재. 초당 400기가비트(Gbps)의 네트워킹 성능과 짧은 지연 시간을 제공하는 엔비디아 퀀텀-2(Nvidia Quantum-2) 인피니밴드(InfiniBand)로 대규모 AI 기반 과학 애플리케이션을 위한 500페타플롭(petaflop)의 최고 AI 성능(희소성 포함 FP8 텐서 코어)을 제공, 16개의 노드에 104개의 코어, 128GB HBM2e 및 2TB DDR5 메모리를 탑재해 대규모 대칭형 멀티프로세싱(SMP) 스타일 작업을 처리한다.

인텔 데이터 센터 AI 솔루션 제품군 총괄 오기 브르기치(Ogi Brkic) 부사장은 “인텔 제온 CPU 맥스 시리즈(Intel Xeon CPU Max Series)는 가장 널리 채택된 AI 프레임워크와 라이브러리를 활용하여 HPC 및 AI 워크로드를 개발하고 구현하는 데 최적의 선택지"라며 "이 시스템의 고유한 이기종성을 통해 OSC의 엔지니어, 연구원 및 과학자들이 이 시스템이 제공하는 두 배 이상 메모리 대역폭 성능을 최대한 활용할 수 있도록 지원할 것이다. 핵심 분야에서 기존 및 미래 데이터의 분석 속도를 크게 높여주는 솔루션으로 OSC와 생태계를 지원하게 되어 기쁘다”고 밝혔다.

데이브 링컨(Dave Lincoln) 델 테크놀로지스 컴퓨팅 시스템 부문 부사장은 "카디널 클러스터는 델 파워엣지 XE9640(Dell PowerEdge XE9640) 서버의 컴퓨팅 성능과 오하이오 슈퍼컴퓨터 센터(OSC)의 자원에 귀중한 추가 요소가 되어 차세대 연구자 및 과학자들이 AI, ML 및 HPC를 사용하여 여러 분야의 어려운 문제를 해결하는 데 도움이 될 것입니다"라고 밝혔다.

 

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지