알리바바그룹 다모 아카데미, 생성 AI·사전학습 멀티모달 모델 등 '2023년 혁신 기술 10대 트렌드' 발표

생성 AI의 활용 범위 확장, 이중 엔진 의사결정 인텔리전스, 사전학습 멀티모달 기초모델, 통합 클라우드 컴퓨팅 아키텍처, 클라우드 네이티브 보안, 엣지·클라우드 시너지 기반 예측 패브릭, 전산 이미징, 칩렛(Chiplet), 지능형 반도체 핌(PIM), 대규모 도시형 디지털 트윈 등

전체 이미지 '2023년 IT 산업에서 주목해야 할 10가지 트렌드' 캡처 및 편집(이하)

지난해 11월 전세계 연구·개발자 위해 대규모 사전 학습 모델 포함한 수백 개의 '인공지능 모델' 오픈소스로 공개해서 관심을 모았던 알리바바(Alibaba) 그룹의 글로벌 연구 이니셔티브인 '다모 아카데미(DAMO Academy)'가 2023년 IT 산업에서 주목해야 할 10가지 트렌드를 11일(현지시간) 발표했다.

이 발표는 지난 3년간 발표된 논문과 특허 출원 분석을 포함해 약 100명의 과학자, 기업가, 엔지니어 등을 대상으로 조사한 내용에 기반한다.

발표에 따르면 생성 AI(Generative AI), 이중 엔진 의사결정 인텔리전스(Dual Engine Decision Intelligence), 클라우드 네이티브 보안 등의 기술을 주목할 수 있으며 ‘사전학습 멀티모달 기초모델(Pre-trained Multimodal Foundation Models)’, ‘클라우드 인프라 처리 장치(CIPU)’, ‘지능형 반도체 핌(PIM)’, 대규모 도시 단위 디지털 트윈 등의 신기술 또한 급부상 중인 것으로 나타났다.

다모 아카데미는 ‘생성형 인공지능'이 디지털 콘텐츠 제작 앱의 발전과 함께 영상 제작의 다양성, 창의성, 효율성 등을 더욱 향상할 것으로 전망했다. 또한, 운영 최적화와 AI 머신러닝을 통합한 ‘듀얼 엔진 디시전 인텔리전스’ 기술을 통해 기업과 산업군은 운영 효율성을 향상하고 지속가능한 발전을 실현할 수 있게 된다. 이 밖에도 클라우드와 보안 기술이 통합됨에 따라 보안 서비스는 클라우드 네이티브화, 플랫폼 중심화, 지능화되고 있다.

제프 장(Jeff Zhang) 알리바바 다모 아카데미 대표는 "2023년 다양한 혁신 기술의 발전은 소프트웨어, 하드웨어, 컴퓨팅, 통신 기술의 통합을 촉진할 것이다"며, "신기술 활용 범위는 점차 확장되고 있으며 이는 버티컬 시장에서의 AI, 디지털 기술 관련 산업의 발전을 더욱 가속화하고 보안 기술, 보안 관리 영역의 공공, 민간, 개인의 협력을 촉진하고 기술 발전과 산업계 응용으로 인한 혁신은 멈출 수 없는 흐름이다”라고 말했다.

다모 아카데미가 꼽은 2023년 IT 산업 10대 트렌드를 요약해 본다.

생성 AI의 활용 범위 확장

생성 AI(Generative AI, 또는 AI 생성 콘텐츠, AIGC)는 주어진 텍스트, 이미지 또는 오디오 파일 세트를 기반으로 새로운 콘텐츠를 생성한다.

텍스트, 이미지 또는 오디오 파일을 기반으로 새로운 콘텐츠를 생성하는 ‘생성 AI’는 현재 주로 시제품과 초안 제작에 활용되고 있다. 이 기술은 게임, 광고, 그래픽 디자인 등의 시나리오 제작에 활용될 수 있으며, 기술 고도화 및 비용 절감 등을 통해 콘텐츠 제작의 다양성과 창의성, 효율성을 향상할 것으로 예상된다.

향후 3년간, 생성 AI가 상용화됨에 따라 관련 비즈니스 모델과 생태계가 더욱 발전할 예정이다. 생성형 AI 모델은 더욱 인터랙티브하고, 안정적이고, 지능적으로 다양한 창작 활동을 지원할 것이다.

한편, 지난해 인공지능에서 가장 큰 발전과 이슈는 '생성 AI'를 꼽는다. 지난해 오픈AI의 자연어 처리 GPT-3.5 기반 '챗GPT(ChatGPT)', 확산 모델로 구동 이미지를 생성하는 '달리(DALL-E 2)', 오디오 소스만으로 표현력이 풍부한 얼굴 애니메이션을 즉시 생성하는 엔비디아 오디오투페이스(Audio2Face), 오디오 파일에서 애니메이션을 생성하는 오디오투제스처(Audio2Gesture) 등과 국내에서는 카카오브레인이 글 넘어 그림 그리는 '칼로' 등을 출시하며 관련 커뮤니티를 뜨겁게 달궜다.

이중 엔진 의사결정 인텔리전스(Dual-engine Decision Intelligence)

오늘날 빠르게 변화하는 세계에서 기업은 신속한 조치를 취하고 정보에 입각한 비즈니스 결정을 내릴 수 있어야 한다. 기존의 의사 결정 방법은 실제 상황에 맞게 구축된 수학적 모델과 운영연구(Operation Research) 최적화를 위한 알고리즘을 결합하여 여러 제약 조건에서 최상의 솔루션을 찾는 운영연구를 기반으로 한다.

그러나 우리 주변의 세상이 복잡해짐에 따라 이 방법은 불확실성이 큰 문제를 처리하는 데 한계가 있고 대규모 문제에 대한 느린 대응으로 인해 점점 유용성이 떨어지고 있다. 따라서 학계와 산업계는 인공지능 머신러닝을 의사 결정 최적화에 도입하여 수학적 모델과 데이터 기반 모델을 모두 활용하는 이중 엔진 기반 의사 결정 인텔리전스 시스템을 구축하기 시작했다.

두 엔진은 서로를 완벽하게 보완한다. 함께 사용하면 의사 결정의 속도와 품질을 향상시킬 수 있다. 이 기술은 실시간 전기 급전, 항만 처리량 최적화, 공항 스탠드 할당, 제조 프로세스 개선과 같은 역동적이고 포괄적인 실시간 자원 할당을 지원하기 위해 다양한 시나리오에서 널리 사용될 것으로 예상된다.

클라우드 네이티브 보안 (Cloud-native Security)

클라우드 네이티브 보안은 클라우드 인프라에 내재된 보안을 지원할 뿐만 아니라 클라우드 네이티브 기술을 통해 보안 서비스를 개선한다. 보안 기술과 클라우드 컴퓨팅은 컨테이너화 구축부터 마이크로 서비스, 서버리스 모델까지 발전해 높은 통합성을 보인다. 보안 서비스는 네이티브화, 세분화, 플랫폼 중심화 및 지능화되고 있다.

향후 3~5년간, 다양화된 클라우드 네이티브 보안은 멀티 클라우드 아키텍처에 더욱 쉽게 적용될 수 있으며 하이브리드 환경에서도 엔드투엔드의 동적이고 정확한 보안 시스템 구축을 보다 용이하게 지원할 것이다.

사전학습 멀티모달 기초모델 (Pre-trained Multimodal Foundation Models)

사전학습 멀티모달 기초모델은 AI 시스템 구축의 새로운 패러다임과 인프라로 부상했다. 다양한 모달리티를 기반으로 지식을 제공하는 본 기술은 향후 이미지, 텍스트, 오디오 작업 전반에 걸쳐 기본 인프라의 역할을 하며 AI 시스템의 추론, 답변, 요약 및 생성을 지원할 것으로 예상된다.

하드웨어·소프트웨어 통합 클라우드 컴퓨팅 아키텍처(Hardware-Software Integrated Cloud Computing Architecture)

클라우드 컴퓨팅은 CPU 중심 컴퓨팅 아키텍처에서 CIPU(Cloud Infrastructure Processor) 중심의 새로운 아키텍처로 진화했다. 이 소프트웨어 정의 하드웨어 가속 아키텍처는 클라우드 애플리케이션 개발을 위한 높은 탄력성과 민첩성을 유지하면서 애플리케이션을 가속화하는 데 도움이 된다.

이 새로운 아키텍처는 하드웨어 인프라와 소프트웨어 시스템을 모두 통합한다. 가공으로서 장치, CIPU는 컴퓨팅, 스토리지 및 네트워크 리소스를 포함하여 클라우드에서 하드웨어 리소스의 가속화를 지원한다.

CIPU 가속 하드웨어 리소스는 유연한 관리, 스케줄링 및 오케스트레이션을 위해 클라우드 리소스 컨트롤러를 통해 분산 운영 체제에 연결할 수 있다. CIPU는 차세대 클라우드 컴퓨팅의 사실상의 표준이 될 것이며, 핵심 소프트웨어 R&D 및 전용 칩 설계를 위한 새로운 개발 기회를 제공할 것이다.

엣지·클라우드 시너지 기반 예측 패브릭

‘호스트 네트워크 공동 설계 네트워크 시스템’인 ‘예측 패브릭(Predictable fabric)’은 고성능 네트워크 서비스를 제공한다. 컴퓨팅과 네트워크 서비스는 점차 통합되고 있으며 클라우드 프로토콜, 소프트웨어, 칩, 하드웨어, 아키텍처, 플랫폼의 풀 스택 혁신 통해 핵심 네트워크가 될 전망이다.

이는 현재의 ‘TCP 기반 네트워크 아키텍처’를 대체하고 데이터 센터 네트워크와 향후 광역 클라우드 백본 네트워크 전반에 활용될 예정이다.

전산 이미징 (Computational Imaging)

전산 이미징은 새로운 학제 간 기술로 빛의 각도, 편광, 위상 등 인간의 눈으로 감지할 수 없는 다차원 광학 정보를 수집하고 처리하는 응용형 기술이다. 광학 기반 이미징 시스템에 대한 센서 기술의 새로운 패러다임이다.

기존의 이미징 기술과 달리 컴퓨터 이미징은 수학적 모델과 신호 처리 기능을 사용하므로 라이트 필드 정보에 대한 전례 없는 심층 분석을 수행할 수 있다. 컴퓨팅 이미징은 많은 유망한 연구 결과와 함께 빠르게 발전해 왔다.

이 기술은 휴대폰 사진, 헬스케어, 자율주행 등의 분야에서도 대규모로 활용되고 있다. 앞으로 컴퓨팅 이미징은 계속해서 전통적인 이미징 기술을 혁신하고 무렌즈(Lensless) 이미징 및 편광 이미징과 같은 보다 혁신적이고 창의적인 애플리케이션을 가져올 것이다.

칩렛(Chiplet)

칩렛 기반 설계를 통해 제조업체는 ‘시스템 온 칩(SoC)’의 구성요소를 여러 개의 칩으로 분산시켜 개별 공정으로 분리 후 생산하여 인터커넥트 및 패키징을 통해 SoC로 재조립할 수 있다. 칩렛의 인터커넥트 표준은 점차 단일 표준으로 통합되어 칩렛의 산업화를 촉진하고, 집적회로(IC)의 연구개발 과정을 새롭게 변화시킬 것이다.

2022년 3월 UCIe(Universal Chiplet Interconnect Express) 컨소시엄이 설립되면서 칩렛의 상호 연결 표준이 단일 표준으로 통일되면서 칩렛의 산업화 과정이 가속화되고 있다. 고급 패키징 기술로 구동되는 칩렛은 전자 설계 자동화(EDA), 설계 및 제조에서 패키징 및 테스트에 이르기까지 집적 회로의 R&D 프로세스에 새로운 변화의 물결을 가져올 수 있다. 이것은 칩 산업의 지형을 재편할 것이다.

지능형 반도체 핌(PIM)

PIM(Processing in Memory) 기술은 단일 칩에 CPU와 메모리를 통합하여 데이터를 메모리에서 직접 처리할 수 있도록 한다. 이는 컴퓨팅 성능을 향상시키면서 데이터 전송 비용을 절감할 뿐만 아니라 작동하는 데 필요한 에너지도 줄어든다.

핌(PIM)은 데이터에 대한 빈번한 동시 액세스가 필요한 인공지능(AI) 컴퓨팅 시나리오에 이상적인 솔루션으로 증가하는 산업 수요와 자본 투자에 힘입어 컴퓨팅 인 메모리 칩이 생산 라인에서 출시되고 실제 다양한 애플리케이션에서 테스트되고 있다.

이 칩은 SRAM(Static Random-Access Memory), DRAM(Dynamic RAM) 및 플래시 스토리지를 사용하며 스마트 가전, 웨어러블 장치, 로봇, 및 스마트 보안 제품. 미래에는 컴퓨팅 인 메모리 칩이 클라우드 기반 추론과 같은 보다 강력한 애플리케이션에 사용될 것으로 예상된다. 이것은 전통적인 컴퓨팅 중심 아키텍처를 데이터 중심 아키텍처로 전환하여 클라우드 컴퓨팅, AI 및 사물 인터넷(IoT)과 같은 산업에 긍정적인 영향을 미칠 것이다.

대규모 도시형 디지털 트윈 (Large-scale Urban Digital Twin)

도시 디지털 트윈의 개념은 2017년 이후 널리 알려졌으며 세련된 도시 거버넌스에 대한 새로운 접근 방식이 되었다. 최근 몇 년 동안 우리는 이 분야에서 중요한 기술 혁신과 대규모 적용을 위해 여러 기술이 향상되었다.

예를 들어, 대규모 동적 지각 매핑은 모델링 비용을 낮추고 대규모 온라인 실시간 렌더링은 응답 시간을 단축하며, 대규모 공동 시뮬레이션 지원 추론은 더 높은 정밀도를 달성한다. 지금까지 대규모 도시 디지털 트윈은 교통 거버넌스, 자연 재해 예방, 탄소 정점 및 중립성과 같은 시나리오에서 큰 진전을 이루었다. 미래에는 대규모 도시 디지털 트윈이 더욱 자율적이고 다차원적으로 변할 것이다.

이상 알리바바 다모아카데미의 발표 내용을 요약했으며, 자세한 내용은 '2023 Top Ten Technology Trends(다운)'을 참고하면 된다.

한편, 글로벌 개발자 및 연구자들을 위한 대규모 사전 학습 모델을 포함한 수백 개의 인공지능(AI) 모델과 함께 오픈소스로 제공되는 MaaS(Model-as-a-Service) 플랫폼인 '모델스코프(ModelScope)'를 지난해 11월 3일 공개했다.

이 '모델스코프' 플랫폼은 알리바바의 글로벌 연구 이니셔티브인 '알리바바 다모 아카데미(Alibaba Damo Academy, DAMO)'가 지난 5년간 개발한 300개 이상의 즉시 사용 가능한 AI 모델로 컴퓨터 비전부터 자연어처리(NLP), 비디오, 오디오에 이르기까지 다양한 분야를 망라한다.

또한, 이 플랫폼에는 150개 이상의 최첨단(SOTA) 모델도 포함되어 있으며, 이는 주어진 작업에서 결과를 달성하는 데 있어 각 분야에서 세계적으로 최고의 것으로 인정받고 있다.

특히, 누구나 이용 가능한 이 플랫폼에서는 초거대 AI 모델로 텍스트를 50억 개의 매개 변수로 이미지로 바꿀 수 있는 '통이(Tongyi-보기)'와 이미지 캡션 및 시각적 질문 답변과 같은 교차 모달 작업에 뛰어난 60억 개의 매개 변수 사전 훈련된 모델인 '원포올(One-For-All, OFA- 보기)'과 같은 알리바바의 독점적인 대규모 사전 훈련된 모델 등이 포함됐다.

오픈소스 커뮤니티로서 '모델스코프(보기)'는 AI 모델을 개발하고 운영하는 것을 더 쉽고 비용 효율적으로 만드는 것을 목표로 한다. 개발자와 연구원들은 단순히 온라인에서 모델을 무료로 테스트하고 몇 분 안에 테스트 결과를 얻을 수 있다.

기존 모델을 미세 조정해 맞춤형 AI 애플리케이션을 개발하고 알리바바 클라우드가 지원하는 모델을 온라인으로 실행하거나 다른 클라우드 플랫폼이나 로컬 환경에서 배포할 수도 있다.

정한영 기자 hyjung@aitimes.kr

다른기사 보기

상단영역

본문영역

알리바바그룹 다모 아카데미, 생성 AI·사전학습 멀티모달 모델 등 '2023년 혁신 기술 10대 트렌드' 발표

기사 댓글 0

비회원 로그인