휴대용 디바이스에서 모델을 실행할 수 있기 때문에 AI가 더 빨라질 뿐만 아니라 물체인식, 감정인식, 동작인식, 자동 번역 등 다양하게 응용될 것이며,

기능을 향상시키기 위해 스스로 학습할 수 있는 토대를 마련하고 저전력, 고성능으로 구현하는 것이 가능해져 스마트폰 등에서 실시간 AI 실현이 가능해질 것

주머니 속으으로 들어간 AI(편집:본지)
주머니 속으으로 들어간 AI(이미지:본지편집)

오는 12일 애플의 새 아이폰 발표을 비롯, 다음달 16일에는 화웨이 메이트20(Mate 20)이 나오는 등 7나노공정의 인공지능(AI) 칩셋이 탑재된 스마트폰이 시장을 어떻게 흔들지에 관심이 쏠리고 있다. 애플과 화웨이의 최신 스마트 발표에 관련 업계와 전세계 소비자들의 관심은 그 어느때보다 높다. 

애플은 당장 오는 12일(현지시각) 미국 본사에서 TSMC의 7나노공정에서 생산된 A12칩셋 기반 아이폰을 발표하고 순차 출시한다. 애플의 7나노 A12 칩은 더 빠른 HEIF 및 HEVC 인코딩부터 슈퍼 슬로우 모션 비디오 녹화 등 모든 카메라 기능을 한 단계 더 높은 수준으로 끌어올린 것이다. 또한 칩의 효율이 좋아질 뿐만 아니라 더 똑똑해진다. 기존 A11 바이오닉에서 애플은 전용 듀얼코어 신경 엔진을 만들어 아이폰의 주 프로세서 내에 탑재했다. 특정 머신러닝 알고리즘과 페이스 ID, 애니모지 등의 기능을 위한 것이다. 결과는 좋았지만 AI 경쟁이 치열해지면서 A12 프로세서도 이에 대응한 것으로 보인다.

세계 최초, CPU-GPU, 듀얼 뉴럴프로세싱유닛(NPU), 인공지능 모바일 칩셋 '기린 980' 발표(사진:화웨이)
세계 최초, CPU-GPU, 듀얼 뉴럴프로세싱유닛(NPU), 인공지능 모바일 칩셋 '기린 980' 발표(사진:화웨이)

특히 화웨이는 지난달 31일 차세대 모바일 인공지능(AI) 혁신을 가져올 세계 최초로 듀얼 뉴럴프로세싱유닛(NPU, Neural processing unit) 시스템 온 칩(SoC)인 '기린 980(Kirin 980)'을 발표했다. 기린 980은 얼굴 인식, 물체 인식, 물체 감지, 이미지 분할 및 지능형 변환과 같은 AI에 신속하게 적응할 수 있다. 이중 코어 NPU는 분당 4500 개의 이미지를 생성하여 120 %의 인식 속도를 향상시키며, 강력한 물체 인식 기능은 다양한 물체를 정확하게 식별 할 수 있다. 또한 기린 980은 완벽한 프레임 워크 지원과 App 개발자를 위한 풍부한 툴 키를 제공한다.

또한 7나노 공정에서 생산된 칩셋은 지난해 기린 970으로 온-디바이스 AI의 잠재력을 세계 시장에 선보이며, 핵심 인공지능(AI)기술의 진전이라 할 뉴럴프로세싱유닛(NPU)을 가진 세계 최초의 스마트폰 칩셋이었지만 이번 발표된 기린 980은 이전과 완전히 새로운 CPU· GPU, 듀얼 NPU를 갖췄으며, 동급 최고의 성능으로 스마트폰 SoC와 LTE Cat.21을 지원하는 세계 최초의 인공지능 칩셋으로 이번에 출시되는 ‘Mate 20 시리즈’를 구동시킬 것으로 예상된다.

올해 말에 퀄컴(Qualcomm) 역시 처음으로 전용 신경처리장치(NPU)을 탑재한 새로운 고급 프로세서 제품군을 선보일 것으로 예상된다. 현재 CPU 또는 DSP에 의해 수행되는 이미지 정보 또는 음성 쿼리 분석은 성능 향상을 위해 NPU로 이동되며, 이 기초에서 구현된 함수의 정확한 범위는 알 수 없지만 다른 신경처리장치의 일반적인 범위에 있을 가능성이 높으며, 이것은 화웨이의의 기린 970에 포함된 NPU와 유사하거나 아직 시간이 있어 지난달 말에 발표된 기린 980의 성능에 버금 갈 것이라는 예상도 잇따른다.

이미지:본지DB
이미지:본지DB

이것은 스냅드래곤 855(Snapdragon 855)로 알려져 있으며, 일부 외신에 따르면 내부적으로 SDM855라고 불리는 SM8150으로 출시될 것으로 알려졌다. 이 새로운 스냅드래곤 855의 새로운 기능은 단연 인공지능 기능일 것이다. 2019년 가장 미디어 친화적인 스마트폰의 일부가 될 것으로 삼성전자도 내년 초 출시할 예정인 갤럭시S10과 폴더블 스마트폰 갤럭시F에 탑재할 것으로 예상되며, 소니 엑스페리아(Sony Xperia XZ4), 샤오미(Xiaomi Mi 9, OnePlus 7) 등에도 이 SoC가 탑재될 것으로 예상된다.

퀄컴은 TSMC에서 채택한 7nm 리소그래피를 활용할 예정으로 이 프로세스는 프로세서 트랜지스터 간의 거리를 감소시켜 구성 요소의 크기가 줄어들지만 에너지 효율성에 대한 영향력이 커지지만 스마트폰에서 하드웨어 수준에서 인공지능 작업을 처리할 수 있는 기능을 제공할 것으로 예상된다. 이렇게 하면 AI처리를 위해 별도의 웹 서버를 사용할 필요가 없으므로 스마트폰의 응답 시간이 그만큼 줄어들 것이다. 더 자세한 퀄컴의 자세한 AI성능은 올해 말 개최될 연례 테크서밋(Tech Summit)에서 그 베일이 벗겨질 것으로 보인다.

인공지능을 구현하기 위해서는 고속 연산을 저전력으로 처리해야 하지만, 현재는 연산 속도가 느리고 전력 소모가 큰 소프트웨어 기술을 활용하고 있어, 인공지능 가속 프로세서 개발이 필수적이다. 무엇보다도 가장 큰 발전 중 하나는 클라우드에서 기계 학습 모델을 실행하는 것을 휴대 전화로 전환하는 것이다. 구글, 페이스북 등도 자사의 프레임 워크의 모바일 버전을 출시함으로써 개발자가 자신의 앱에서 AI 기반 작업 속도를 높이고 있다.

최근 국내 연구진도 모바일에서 하나의 칩으로 회선 신경망(Convolutional Neural Network, CNN)과 재귀 신경망(Recurrent Neural Network, RNN)을 동시에 처리할 수 있고, 인식 대상에 따라 에너지효율과 정확도를 다르게 설정할 수 있는 인공지능 칩(Unified Neural Network Processing Unit, UNPU)을 개발함으로써 휴대 장치에서 인공지능 칩의 활용 범위를 넓혔다.

또한 스마트폰 카메라를 통해 사람의 얼굴 표정을 인식하여 행복, 슬픔, 놀람, 공포, 무표정 등 7가지의 감정 상태를 자동으로 인식하고 스마트폰 상에 실시간으로 표시하는 감정인식 시스템도 개발했으며, 비트 시리얼(Bit-serial) 기반의 연산을 수행하여 완전 가변한 (1bit~16bit) 인공신경망 무게 정밀도 (Weight Precision)을 지원하는 모바일 칩을 개발, 분리된 코어 구조를 갖는 기존 반도체 칩과 달리 UNPU는 통합된 하나의 프로세서 코어 구조로 재설계되어 회귀 신경망(CNN), 재귀 신경망(RNN) 연산시 최대성능이 세계 최고 수준 AI칩 대비 각각 1.15배, 13.8배 증가 시키고 상용화를 추진하고 있다.

결론적으로 AI는 수년간 개선되어 왔지만 대부분 클라우드 기반으로 2018 년은 무엇보다도 인공지능을 주머니에 넣을 준비가 되어가고 있는 것이다. 스마트폰이나 휴대용 디바이스에서 모델을 실행할 수 있기 때문에 AI가 더 빨라질 뿐만 아니라 물체인식, 감정인식, 동작인식, 자동 번역 등 다양하게 응용될 것이며, 개인화 등의 기능을 향상시키기 위해 스마트폰 및 기타 디바이스가 스스로 학습할 수 있는 토대를 마련하고 저전력, 고성능으로 구현하는 것이 가능해져 스마트폰 등에서 실시간 인공지능 실현이 가능해질 것으로 기대되며, 기존 클라우드 서버에서 이루어지는 인공지능 알고리즘을 스마트폰 등 사용자의 주머니 속에서도 최적화된 인공지능 구현이 가능하게 될 것으로 전망된다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지