삼성전자, AI연산 속도 7배 강화한 초고속·고성능·저전력 NPU 프로세서 공개
삼성전자, AI연산 속도 7배 강화한 초고속·고성능·저전력 NPU 프로세서 공개
  • 최광민 기자
  • 승인 2018.11.14 11:00
  • 댓글 0
이 기사를 공유합니다

2018년은 무엇보다도 인공지능을 주머니 속에 넣을 준비가 되어가고 있는 것으로 보인다. 스마트폰이나 휴대용 디바이스에서 모델을 실행할 수 있기 때문에 AI가 더 빨라질 뿐만 아니라 물체인식, 감정인식, 동작인식, 자동 번역 등 다양하게 구현될 것
주머니 속으로 들어가는 인공지능(사진:본지DB)
주머니 속으로 들어가는 인공지능(사진:본지DB)

인공지능을 구현하기 위해서는 고속 연산을 저전력으로 처리해야 하지만, 연산 속도가 느리고 전력 소모가 큰 소프트웨어 기술을 활용하고 있어, 인공지능 가속 프로세서 개발이 필수적이다. 지난해 화웨이의 기린 970칩셋은 핵심 인공지능(AI)기술의 진전이라 할 뉴럴프로세싱유닛(NPU)을 가진 세계 최초의 스마트폰 칩셋을 출시하고 지난 9월 CPU-GPU, 듀얼 뉴럴프로세싱유닛(NPU), 인공지능 모바일 칩셋 '기린 980' 발표하면서 무엇보다도 가장 큰 발전 중 하나는 클라우드에서 AI모델을 실행하는 것을 휴대 전화로 전환(On-Device AI 구현)하는 것이다.

삼성전자가 기존 엑시노스칩셋과 퀄컴 스냅드래곤에 벗어나게 됐다. AI연산 속도 7배 강화하고 초고속·고성능·저전력으로 동시 다발적인 행렬연산에 최적화 되어, AI을 위한 여러개의 연산이 지연 없이 실시간으로 가능한 NPU(신경망처리장치. Neural processing unit) 내장해 자체적으로 AI 작업 가능하고 데이터 통신 없어도 고속으로 AI 연산 수행과 개인정보 보안성 강화시킨 프리미엄 모바일 어플리케이션 프로세서(AP, Application Processor) '엑시노스 9(9820)'을 14일 공개하고 연내 양산할 예정이라고 밝혔다.

또한 삼성전자는 '엑시노스 9(9820)'에 최신 그래픽 프로세서(Mali-G76)를 탑재해 이전 제품(9810) 대비 그래픽 처리 성능을 약 40%, 동일 성능에서의 전력소모를 약 35% 개선했으며, 업계 최초 8CA(주파수 묶음) 기능과 초당 2기가비트(Gbps) 다운로드 속도의 통신이 가능한 모뎀을 탑재한 것이 특징이다. 여기에 '엑시노스 9(9820)'은 2세대 이동 통신(2G)부터 4세대 이동 통신(4G)까지 총 6가지 통신 모드를 모두 지원해 이 제품을 탑재한 모바일 제품은 전세계 어디에서든 사용이 가능하다는 장점이 있다.

프리미엄 모바일 AP '엑시노스 9(9820)'(사진:삼성전자)
프리미엄 모바일 AP '엑시노스 9(9820)'(사진:삼성전자)

빠른 연산 속도는 증강현실(AR)과 가상현실(VR) 같은 응용처에서 인물과 사물의 특징을 빠르고 정확하게 파악해 역동적이면서도 재미있는 사용자 경험(User Experience)을 제공할 수 있다. 예를 들어, 사진을 촬영 할 때 피사체의 형태, 장소, 주변 밝기 등의 환경을 순간적으로 파악하고 최적 값을 자동으로 설정해 최상의 이미지를 얻을 수 있다.

특히'엑시노스 9(9820)'은 NPU를 내장해 기존에 클라우드(Cloud) 서버와 데이터를 주고받으며 수행하던 인공지능 연산 작업을 모바일 기기 자체적으로 할 수 있어(On-Device AI) 민감할 수 있는 사용자의 개인 정보를 보호할 수 있는 장점이 있으며, 설계를 최적화한 4세대 자체 싱글 코어를 적용, 3세대 대비 싱글코어 성능을 약 20% 높였고 동일 성능에서의 전력효율도 약 40% 개선했다. 개선된 싱글코어 성능은 빠른 어플리케이션(Application) 실행과 전환, 그리고 신속한 데이터 로딩에 큰 장점이 있다.

아울러 스마트폰 사용 환경에 맞게 각 영역의 코어가 유기적으로 동작할 수 있도록 옥타코어 CPU 구성을 최적화해 멀티코어 성능을 약 15% 향상시켰으며, '엑시노스 9(9820)'은 업계 최초로 8개 주파수 대역을 묶는 기술(LTE Cat.20 8CA, Carrier Aggregation)로 데이터를 최대 초당 2기가비트(Gbps, Gigabit per second) 속도로 다운로드 가능하고, 초당 최대 316메가비트(Mbps) 속도로 업로드 할 수 있다. 이는 초당 2기가 비트(2Gbps)는 FHD 고화질 영화(3.7 기가바이트)를 약15초 만에 다운로드 가능한 속도로 고해상도 인터넷 방송을 실시간으로 시청하거나 다중 접속 온라인게임(Massively Multiplayer Online Games, MMOG)을 지연 없이 구동할 수 있다.

한편 구글, 페이스북 등도 최근 자사의 프레임 워크의 모바일 버전을 출시함으로써 개발자가 자신의 앱에서 AI 기반 작업 속도를 높이고 있다. 화웨이 메이트20(Mate 20)이 나오는 등 7나노공정의 인공지능(AI) 칩셋이 탑재된 스마트폰이 시장을 어떻게 흔들지에 관심이 쏠리고 있다. 애플과 화웨이의 최신 스마트 발표에 관련 업계와 전세계 소비자들의 관심은 그 어느때보다 높다.

올해 말에 퀄컴(Qualcomm) 역시 처음으로 전용 신경처리장치(NPU)을 탑재한 새로운 고급 프로세서 제품군을 선보일 것으로 예상된다. 현재 CPU 또는 DSP에 의해 수행되는 이미지 정보 또는 음성 쿼리 분석은 성능 향상을 위해 NPU로 이동되며, 이 기초에서 구현된 함수의 정확한 범위는 알 수 없지만 다른 신경처리장치의 일반적인 범위에 있을 가능성이 높으며, 이것은 화웨이의의 기린 970에 포함된 NPU와 유사하거나 아직 시간이 있어 지난 9월 말에 발표된 기린 980의 성능에 버금 갈 것이라는 예상도 잇따른다.

이것은 스냅드래곤 855(Snapdragon 855)로 알려져 있으며, 일부 외신에 따르면 내부적으로 SDM855라고 불리는 SM8150으로 출시될 것으로 알려졌다. 이 새로운 스냅드래곤 855의 새로운 기능은 단연 인공지능 기능일 것이다. 소니 엑스페리아(Sony Xperia XZ4), 샤오미(Xiaomi Mi 9, OnePlus 7) 등에도 이 SoC가 탑재될 것으로 예상된다.

퀄컴은 TSMC에서 채택한 7nm 리소그래피를 활용할 예정으로 이 프로세스는 프로세서 트랜지스터 간의 거리를 감소시켜 구성 요소의 크기가 줄어들지만 에너지 효율성에 대한 영향력이 커지지만 스마트폰에서 하드웨어 수준에서 인공지능 작업을 처리할 수 있는 기능을 제공할 것으로 예상된다. 이렇게 하면 AI처리를 위해 별도의 웹 서버를 사용할 필요가 없으므로 스마트폰의 응답 시간이 그만큼 줄어들 것이다. 더 자세한 퀄컴의 자세한 AI성능은 올해 말 개최될 연례 테크서밋(Tech Summit)에서 그 베일이 벗겨질 것으로 보인다.

애플은 TSMC의 7나노공정에서 생산된 A12칩셋 기반 아이폰을 발표하고 순차 출시한다. 애플의 7나노 A12 칩은 더 빠른 HEIF 및 HEVC 인코딩부터 슈퍼 슬로우 모션 비디오 녹화 등 모든 카메라 기능을 한 단계 더 높은 수준으로 끌어올린 것이다. 또한 칩의 효율이 좋아질 뿐만 아니라 더 똑똑해진다. 기존 A11 바이오닉에서 애플은 전용 듀얼코어 신경 엔진을 만들어 아이폰의 주 프로세서 내에 탑재했다. 특정 머신러닝 알고리즘과 페이스 ID, 애니모지 등의 기능을 위한 것이다. 결과는 좋았지만 AI 경쟁이 치열해지면서 A12 프로세서도 이에 대응한 것으로 보인다.

결론적으로 2018 년은 무엇보다도 인공지능을 주머니 속에 넣을 준비가 되어가고 있는 것으로 보인다. 스마트폰이나 휴대용 디바이스에서 모델을 실행할 수 있기 때문에 AI가 더 빨라질 뿐만 아니라 물체인식, 감정인식, 동작인식, 자동 번역 등 다양하게 응용될 것이며, 개인화 등의 기능을 향상시키기 위해 스마트폰 및 기타 디바이스가 스스로 학습할 수 있는 토대를 마련하고 저전력, 고성능으로 구현하는 것이 가능해져 스마트폰 등에서 실시간 인공지능 실현이 가능해질 것으로 기대되며, 기존 클라우드 서버에서 이루어지는 인공지능 알고리즘을 스마트폰 등 사용자의 주머니 속에서도 최적화된 인공지능 구현이 가능하게 될 것으로 전망된다.

 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.