레오나르도로 명명된 이 시스템은 2021년 볼로냐 테크노폴로에 설치되며, 14,000개의 엔비디아 A100 GPU가 최대 8.736 FP16 ExaFLOPS(구조 스파리티가 활성화된 GPU당 624 TFLOPS) 성능을 달성

이탈리아 시네카(Cineca) 세계에서 가장 빠른 인공지능 슈퍼컴퓨터 구축(사진:시네카)

이탈리아 80개 대학과 4개의 국가연구센터로 구성된 비영리 컨소시엄이자 50년 동안 고성능 과학 컴퓨팅을 위한 최고의 도구를 공공 및 산업 연구에 제공하고 있는 시네카(Cineca)는 세계에서 가장 빠른 인공지능(AI) 슈퍼컴퓨터를 구축한다고 지난 15일(현지시간) 발표했다.

레오나르도(Leonardo)로 명명된 이 시스템은 2021년 볼로냐 테크노폴로(Bologna Tecnopolo)에 설치되며, 14,000개의 엔비디아 A100 GPU가 최대 8.736 FP16 ExaFLOPS(구조 스파리티가 활성화된 GPU당 624 TFLOPS) 성능을 달성할 수 있다. 한편, 같은 수의 GPU가 13만5800개의 FP64 테라플롭스(TFLOPS)의 성능을 제공할 수 있지만 현존하는 세계 최강 IBM 슈퍼컴퓨터 서밋(Summit)의 14만8600개의 FP64 TFLOPS에는 약간 못 미친다.

또한 이 슈퍼컴은 아토스(Atos)의 불세쿼나 XH2000(BullSequana XH2000) 슈퍼 컴퓨터 노드를 기반으로 하며, 각 노드는 아직 출시도 성능도 밝혀지지 않은 인텔 제논(Intel Xeon) 프로세서 1 개, 엔비디아 A100 GPU 4 개 및 연결을 위한 멜라녹스(Mellanox) HDR 200Gb/s 인피니밴드(InfiniBand) 카드를 탑재한다. 블레이드는 수냉식이며 각 HPC 캐비닛에는 32 개가 있다.

이 시스템은 이탈리아 대학 및 연구소에서 약물 발견, 우주 탐사와 연구, 날씨 모델 등의 구현에 사용할 계획이다.

한편, 전통적으로 이러한 애플리케이션은 FP64 정밀도가 필요한 고성능 시뮬레이션 및 데이터 분석 워크로드에 의존한다. 그러나 엔비디아는 오늘날 많은 HPC 작업이 강력한 인공지능 및 머신러닝에 의존하고 있으며 이러한 워크로드의 경우 FP16 정밀도로 충분하다고 한다. 당연히 엄청난 수의 GPU가 고해상도 시각화를 수행할 수도 있다. 엔비디아의 A100 GPU는 주로 컴퓨팅용으로 설계되었으므로 '슈퍼 컴퓨팅' FP64 및 'AI' FP16을 포함한 모든 종류의 정밀도를 지원하고 있다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지