레오나르도로 명명된 이 시스템은 2021년 볼로냐 테크노폴로에 설치되며, 14,000개의 엔비디아 A100 GPU가 최대 8.736 FP16 ExaFLOPS(구조 스파리티가 활성화된 GPU당 624 TFLOPS) 성능을 달성
이탈리아 80개 대학과 4개의 국가연구센터로 구성된 비영리 컨소시엄이자 50년 동안 고성능 과학 컴퓨팅을 위한 최고의 도구를 공공 및 산업 연구에 제공하고 있는 시네카(Cineca)는 세계에서 가장 빠른 인공지능(AI) 슈퍼컴퓨터를 구축한다고 지난 15일(현지시간) 발표했다.
레오나르도(Leonardo)로 명명된 이 시스템은 2021년 볼로냐 테크노폴로(Bologna Tecnopolo)에 설치되며, 14,000개의 엔비디아 A100 GPU가 최대 8.736 FP16 ExaFLOPS(구조 스파리티가 활성화된 GPU당 624 TFLOPS) 성능을 달성할 수 있다. 한편, 같은 수의 GPU가 13만5800개의 FP64 테라플롭스(TFLOPS)의 성능을 제공할 수 있지만 현존하는 세계 최강 IBM 슈퍼컴퓨터 서밋(Summit)의 14만8600개의 FP64 TFLOPS에는 약간 못 미친다.
또한 이 슈퍼컴은 아토스(Atos)의 불세쿼나 XH2000(BullSequana XH2000) 슈퍼 컴퓨터 노드를 기반으로 하며, 각 노드는 아직 출시도 성능도 밝혀지지 않은 인텔 제논(Intel Xeon) 프로세서 1 개, 엔비디아 A100 GPU 4 개 및 연결을 위한 멜라녹스(Mellanox) HDR 200Gb/s 인피니밴드(InfiniBand) 카드를 탑재한다. 블레이드는 수냉식이며 각 HPC 캐비닛에는 32 개가 있다.
이 시스템은 이탈리아 대학 및 연구소에서 약물 발견, 우주 탐사와 연구, 날씨 모델 등의 구현에 사용할 계획이다.
한편, 전통적으로 이러한 애플리케이션은 FP64 정밀도가 필요한 고성능 시뮬레이션 및 데이터 분석 워크로드에 의존한다. 그러나 엔비디아는 오늘날 많은 HPC 작업이 강력한 인공지능 및 머신러닝에 의존하고 있으며 이러한 워크로드의 경우 FP16 정밀도로 충분하다고 한다. 당연히 엄청난 수의 GPU가 고해상도 시각화를 수행할 수도 있다. 엔비디아의 A100 GPU는 주로 컴퓨팅용으로 설계되었으므로 '슈퍼 컴퓨팅' FP64 및 'AI' FP16을 포함한 모든 종류의 정밀도를 지원하고 있다.