텐서 코어로 가속화해 까다로운 애플리케이션에서 AI 성능 획기적으로 향상...게이머, 크리에이터, 개발자 등 모두를 위한 AI 환경 구축 지원

이미지:엔비디아
이미지:엔비디아

엔비디아(NVIDIA)가 RTX AI PC와 워크스테이션 사용자를 위한 하드웨어, 소프트웨어, 도구, 가속화 등을 선보일 예정이라고 7일(현지시간) 밝혔다.

엔비디아는 2018년 RTX 기술과 AI용으로 제작된 최초의 소비자 GPU인 지포스 RTX(GeForce RTX)를 출시하면서 AI 컴퓨팅으로의 전환을 가속화했다. 그 이후 RTX PC와 워크스테이션상의 AI는 1억 명 이상의 사용자와 500개 이상의 AI 애플리케이션을 갖춘 성공적인 생태계로 성장했다.

생성 AI는 PC에서 클라우드에 이르기까지 새로운 차원의 기능을 선보이고 있다. 또한 엔비디아는 풍부한 AI 경험과 전문성으로 모든 사용자가 다양한 AI 기능을 처리하는 데 필요한 성능을 갖출 수 있도록 지원한다.

사용자들은 집과 사무실에서 이미 생산성과 엔터테인먼트 기능을 향상시키는 소프트웨어와 함께 RTX의 AI를 활용하고 있다. 게이머들은 좋아하는 게임에서 놀라운 해상도로 높은 프레임 속도를 제공하는 지포스 RTX GPU에서 AI의 성능을 체감하고 있다. 크리에이터는 로딩을 기다리거나 지루한 작업을 반복하는 대신 창작 활동에 집중할 수 있다. 또한 개발자는 프로토타입 제작과 디버깅 자동화를 위해 생성형 AI를 사용해 워크플로우를 간소화할 수 있다.

지포스 RTX AI PC와 엔비디아 RTX 워크스테이션

AI PC는 AI를 더 빠르게 실행할 수 있도록 설계된 전용 하드웨어가 장착된 컴퓨터이다. 3D 이미지가 로드될 때까지 가만히 앉아 기다리는 대신 AI 디노이저를 통해 이미지가 즉각적으로 업데이트되는 것을 볼 수 있다.

RTX GPU에서는 이러한 전문 AI 가속기를 텐서 코어(Tensor Core)라고 한다. 텐서 코어는 업무와 게임 플레이에 사용되는 가장 까다로운 애플리케이션에서 AI의 성능을 획기적으로 가속화한다.

AI 성능을 측정하는 한 가지 방법은 테라옵스 즉 TOPS(초당 조 단위 연산)이다. 엔진의 마력 등급과 유사하게 TOPS는 사용자에게 PC의 AI 성능을 파악하기 위한 단일 지표를 제공한다. 현 세대의 지포스 RTX GPU는 대략 200 AI TOPS부터 1,300 TOPS 이상까지 다양한 성능 옵션을 제공하며, 노트북과 데스크톱에 걸쳐 다양한 옵션을 지원한다. 전문가들은 엔비디아 RTX 6000 에이다 제너레이션(RTX 6000 Ada Generation) GPU를 통해 더욱 높은 AI 성능을 얻을 수 있다.

 GPU가 없는 현 세대의 AI PC 성능은 10~45TOPS이다.

점점 더 많은 유형의 AI 애플리케이션이 클라우드가 아닌 디바이스에서 특정 AI 작업을 수행할 수 있는 PC를 필요로 하게 될 것이다. AI PC에서 실행하면 인터넷 연결 없이도 항상 컴퓨팅을 사용할 수 있고 시스템의 짧은 지연 시간으로 응답성도 높아진다. 아울러 사용자가 AI 활용을 위해 민감한 자료를 온라인 데이터베이스에 업로드할 필요가 없어 개인정보 보호가 강화된다는 이점도 있다.

모두를 위한 AI

RTX GPU는 단순한 성능 그 이상을 제공한다. 이들은 RTX 기술로만 가능한 기능을 선보인다. 이러한 AI 기능 중 상당수는 개인의 기술 수준과 관계없이 수백만 명이 이용할 수 있고, 그 영향력도 크다. AI업스케일링부터 개선된 화상 회의, 지능적이고 개인화된 챗봇에 이르기까지 모든 유형의 사용자에게 도움이 되는 여러 도구가 있다.

RTX 비디오는 AI를 사용해 스트리밍 영상을 업스케일링하고 HDR(하이 다이내믹 레인지)로 표시한다. SDR(표준 다이내믹 레인지)의 저해상도 영상을 최대 4K 고해상도 HDR로 생생하게 재현한다. RTX 사용자는 크롬(Chrome) 또는 엣지 브라우저(Edge browser)에서 스트리밍되는 거의 모든 영상에서 한 번의 클릭으로 이 기능을 이용할 수 있다.

RTX 사용자를 위한 무료 앱인 엔비디아 브로드캐스트(Broadcast)는 간단한 사용자 인터페이스(UI)를 통해 화상 회의, 라이브 스트리밍 개선 등 다양한 AI 기능을 제공한다. 노이즈와 에코 제거 기능으로 키보드 소리, 진공 청소기 소리, 아이들의 큰 목소리 등 원치 않는 배경 소리를 제거한다. 가상 배경을 사용해 더 나은 엣지 감지로 배경을 대체하거나 흐리게 처리할 수 있다. 영상 노이즈 제거 기능으로 저화질 카메라 이미지를 부드럽게 처리한다. 또한, 자동 프레임과 아이 콘택트 기능을 사용해 사용자가 어디로 이동하든 화면 중앙에서 눈은 카메라를 바라보도록 유지할 수 있다.

챗 위드 RTX(Chat With RTX)는 사용하기 쉽고 무료로 다운로드가 가능한 로컬 맞춤형 AI 챗봇 데모이다. 1월 처음 출시된 ‘챗 위드 RTX’에 곧 구글(Google) 젬마(Gemma)가 지원될 예정으로 사용자는 파일을 하나의 폴더에 끌어다 놓고 챗 위드 RTX에서 해당 위치를 가리키기만 하면 PC의 로컬 파일을 지원되는 대규모 언어 모델(LLM)에 쉽게 연결할 수 있다. 이를 활용하면 쿼리를 통해 상황에 맞는 답변을 빠르게 얻을 수 있다.

챗 위드 RTX는 지포스 RTX PC와 엔비디아 RTX 워크스테이션에 탑재된 윈도우(Windows)에서 로컬로 실행되므로 결과가 빠르고 사용자의 데이터가 디바이스에 그대로 유지된다. 아울러 클라우드 기반 서비스에 의존하는 대신 챗 위드 RTX를 사용하면 중요한 데이터를 제3자와 공유하거나 인터넷에 연결할 필요 없이 로컬 PC에서 처리할 수 있다.

게이머를 위한 AI

지난 6년 동안 게임 성능은 AI 가속화를 통해 가장 큰 도약을 이루었다. 게이머들은 2019년부터 엔비디아 DLSS를 사용해 프레임 속도를 높이고 이미지 품질을 개선했다. 엔비디아 DLSS는 AI를 사용해 비디오 게임에서 자동으로 픽셀을 생성하는 기술이다. 지속적인 개선 덕분에 이 기술은 현재 프레임 속도를 최대 4배까지 향상한다.

또한 최신 버전인 DLSS 3.5에 레이 리컨스트럭션(Ray Reconstruction)이 도입되면서 세계 최고 수준 게임에서 시각적 품질이 더욱 향상됐다. 이로써 엔비디아는 시각적으로 더 풍부하고 몰입감 있는 게임 플레이에 대한 새로운 기준을 수립했다.

현재 500개 이상의 게임과 애플리케이션이 레이 트레이싱, DLSS, AI 기반 기술 등을 사용하며 게임을 플레이하고 제작하는 방식을 혁신시키고 있다.

AI는 프레임을 넘어 게이머가 캐릭터와 상호 작용하고 고전 게임을 리마스터링하는 방식을 개선할 것으로 기대된다.

개발자는 생성형 AI 기반 음성, 애니메이션 모델을 포함한 엔비디아 ACE 마이크로서비스를 통해 지능적이고 역동적인 디지털 아바타를 게임에 추가할 수 있다. CES에서 선보인 ACE는 게임 캐릭터에 생명을 불어넣는 기능으로 여러 상을 수상하며 PC 게이밍의 미래를 엿볼 수 있었다.

엔비디아 RTX 리믹스(RTX Remix)는 모더들이 고전 게임의 놀라운 RTX 리마스터 버전을 제작할 수 있도록 지원하는 플랫폼이다. 고전 게임의 기본 텍스처를 최신 4K 해상도의 물리 기반 렌더링 머티리얼로 변환할 수 있는 생성형 AI 툴을 제공한다. 하프라이프 2 RTX(Half-Life 2 RTX), 포탈 위드 RTX(Portal with RTX )등 여러 프로젝트가 이미 출시됐거나 작업 중이다.

크리에이터를 위한 AI

AI는 크리에이터들의 지루한 작업을 줄이거나 자동화해 순수 창작을 위한 시간을 제공하며 창의적인 잠재력을 실현하도록 돕는다. 이러한 기능은 엔비디아 RTX 또는 지포스 RTX GPU가 탑재된 PC에서만 가장 빠르게 혹은 단독으로 실행된다.

어도비 프리미어 프로의 AI 기반 음성 향상 도구는 불필요한 노이즈를 제거하고 대화 품질을 개선한다.

어도비 프리미어 프로(Adobe Premiere Pro)의 음성 향상 도구는 RTX로 가속화된다. 이는 AI를 사용해 불필요한 노이즈를 제거하고 대화 클립의 품질을 개선해 전문적으로 녹음된 것 같은 사운드를 구현한다. 이 기능은 Mac보다 RTX에서 최대 4.5배 더 빠르다. 또 다른 프리미어 기능으로는 자동 리프레임이 있다. 자동 리프레임은 GPU 가속화를 통해 영상에서 가장 관련성 높은 요소를 식별하거나 추적해 다양한 화면 비율에 맞게 영상 콘텐츠를 지능적으로 재구성한다.

영상 편집자의 시간을 절약해 주는 또 하나의 AI 기능으로 다빈치 리졸브(DaVinci Resolve)의 매직 마스크(Magic Mask)가 있다. 이전에는 편집자가 한 장면에서 피사체의 색조와 밝기를 조정하거나 원치 않는 부분을 제거해야 하는 경우 로토스코핑(rotoscoping) 또는 기본 파워 윈도우와 마스크를 조합해 배경에서 피사체를 분리해야 했다.

매직 마스크는 이러한 워크플로우를 완전히 바꿔 놓았다. 매직 마스크를 활용하면 피사체 위에 선을 긋기만 해도 AI가 잠시 동안 처리한 후 선택 영역을 표시한다. 그리고 지포스 RTX 노트북은 가장 빠른 일반 노트북보다 2.5배 빠르게 이를 실행할 수 있다. 이는 AI가 창의성의 속도를 높이는 방법 중 하나에 불과하다. 현재 RTX로 가속화된 AI 애플리케이션은 125개 이상이다.

개발자를 위한 AI

AI는 확장 가능한 환경, 하드웨어와 소프트웨어 최적화, 새로운 API를 통해 개발자가 소프트웨어 애플리케이션을 구축하는 방식을 개선하고 있다.

엔비디아 AI 워크벤치(AI Workbench)는 개발자가 PC급 성능과 메모리 설치 공간을 사용해 사전 훈련된 생성형 AI 모델과 LLM을 빠르게 생성, 테스트, 맞춤화할 수 있도록 지원한다. 이는 RTX PC에서 로컬로 실행하는 것부터 거의 모든 데이터센터, 퍼블릭 클라우드 또는 엔비디아 DGX 클라우드(DGX Cloud)까지 확장할 수 있는 간편한 통합 툴킷이다.

개발자는 PC에서 사용할 AI 모델을 구축한 후 엔비디아 텐서RT를 사용해 모델을 최적화할 수 있다. 텐서RT는 RTX GPU에서 텐서 코어를 최대한 활용할 수 있도록 도와주는 소프트웨어이다.

이제 윈도우용 텐서RT-LLM을 통해 텍스트 기반 애플리케이션에서 텐서RT 가속화를 사용할 수 있다. 이 오픈 소스 라이브러리는 LLM 성능을 향상시키고 구글 젬마 ,메타(Meta) 라마2(Llama 2), 미스트랄(Mistral), 마이크로소프트(Microsoft) Phi-2 등 인기 모델에 대해 사전 최적화된 체크포인트를 포함한다.

또한 개발자는 오픈AI(OpenAI) 채팅 API용 텐서RT-LLM 래퍼에도 액세스할 수 있다. 컨티뉴(continue.dev)는 LLM을 활용하는 비주얼 스튜디오 코드(VS Code)와 제트 브레인(JetBrains)용 오픈 소스 자동 조종 장치이다. 컨티뉴는 단 한 줄의 코드 변경만으로 RTX PC에서 로컬로 텐서RT-LLM을 사용해 로컬에서 빠르게 LLM 추론할 수 있는 인기 도구이다.

한편, 엔비디아는 매주 AI 기술의 접근성을 높여 AI에 대한 이해를 돕고, RTX AI PC 사용자를 위한 새로운 하드웨어, 소프트웨어, 도구, 가속화 등을 선보일 예정이다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지