네이버·라인·스노우 서비스에 적용된 컴퓨터 비전 분야 원천 기술에 글로벌 업계 주목

CVPR 2020 행사이미지로 홈페이지 캡처

네이버(사장 한성숙)와 네이버랩스(대표 석상옥)가 현지시간 14일부터 19일까지 코로나19 펜데믹 영향으로 가상으로 열리는 국제 컴퓨터 비전 및 패턴 인식 학회 2020(IEEE Conference on Computer Vision and Pattern Recognition, CVPR 2020)에서 총 7편의 논문을 발표하고, 7개의 워크샵을 진행한다고 밝혔다.

이번 CVPR 2020에 채택된 네이버와 네이버랩스 연구원들의 논문은 모두 컴퓨터 비전(Vision) 기술 연구 결과에 대한 것이다. 비전 기술은 번역, 이미지 분류, 자율주행, 동영상 등 다양한 영역에서 널리 활용된다. 올해 CVPR에서 주목받은 연구 결과들 역시, 네이버, 라인, 스노우의 OCR, 이미지 검색, 동영상 서비스 등에 이미 적용되어 글로벌 사용자들에게 새로운 가치를 제공하고 있다.

특히, 네이버 비전팀 연구원들의 논문인 '임베딩 확장: 심층 지표학습을 위한 임베딩 공간에서 증강기법(Embedding Expansion: Augmentation in Embedding Space for Deep Metric Learning) (고병수, 구건모)’에 포함된 효과적인 이미지 검색 시스템을 위해 간단한 선형 연산으로 가상의 정보를 생성해 딥러닝 기반의 이미지 검색 정확도를 향상 시킨 연구 기술은 네이버 이미지검색 품질 고도화에 크게 기여할 것으로 기대된다.

또한 '다중 도메인을 위한 다양한 이미지 합성(StarGAN v2: Diverse Image Synthesis for Multiple Domains)(최윤제, 어영정, 유재준, 하정우)’는 이미지 변환에 있어서 남·여 등 여러가지 도메인에 존재하는 머리색, 머리모양, 수염 등 다양한 요소들을 반영하면서도 사실같은 이미지를 생성할 수 있는 기술 연구 과정을 담았다. 해당 논문은 2년 전, 최윤제 연구원이 인턴 기간 동안 연구해 CVPR 2018에서 주목받았던 기술을 정식 입사 후 동료들과 함께 업그레이드 한 결과이다.

특히 네이버랩스 유럽은 이번 CVPR 2020의 '변화하는 환경에서의 장기간 이미지 기반 측위(Long-term Visual Localization under changing conditions)’ 워크샵에서 진행된 세 가지 챌린지에서 각각 1위, 2위, 4위를 기록했다.

​1위를 기록한 챌린지는 'Autonomous Vehicle 챌린지'로, 도시 및 전원 지역 환경에서 주어진 자율주행 시나리오 3가지에 대한 데이터셋 결과를 제출하는 것이다. 'Local Feature 챌린지(동일한 VL 알고리즘을 사용하는 상황에서 특징점의 정확도와 강건함을 평가하는 과제)'와 'Handheld Devices 챌린지(스마트폰과 같은 디바이스로 촬영한 이미지 기반의 localization 과제)'에서 각각 2위와 4위라는 우수한 결과를 기록했다. 해당 워크샵에서 진행된 세가지 챌린지에 모두 참여한 곳은 네이버랩스 유럽이 유일하다.

김성훈 네이버 클로바CIC 책임리더는 “세계 무대에서도 네이버, 라인, 스노우에 이미 녹아든 다양한 기술들에 대한 주목도가 나날이 높아지고 있다”며, “앞으로도 이 기술들이 서비스를 통해 만나는 이용자들의 경험을 더욱 다채롭게 하고, 더욱 많은 가치를 제공할 것” 이라고 전했다.

석상옥 네이버랩스 대표는 "정밀한 위치 인식 기술은 자율주행차나 서비스 로봇 등에 필수적이며, 새로운 위치 기반 서비스를 탄생시키는 촉매가 되는만큼 관련 분야 기술을 지속적으로 고도화해나갈 것"이라고 말했다.

한편, 네이버는 4년 연속으로 이번 학회에 주요 스폰서로 참석해 네이버와 네이버랩스, 네이버랩스 유럽의 컴퓨터 비전 연구 개발 현황과 사내 문화 및 협업 과정에 대해 적극적으로 알리며 글로벌 인재 영입에 나섰다. 

 

참고로 CVPR 2020에서의 네이버 & 네이버랩스 발표 논문은 다음과 같다.

1. Evaluating Weakly Supervised Object Localization Methods Right (최준석, 오성준, 이승호 (연세대), 전상혁, Zeynep Akata(University of Tübingen), 심현정(연세대) )

객체 위치 인식 기술 (weakly-supervised object localization) 알고리즘 사이의 공정한 평가 방법을 제안하고, 이에 따른 평가용 데이터셋 세 개를 공개

2. Embedding Expansion: Augmentation in Embedding Space for Deep Metric Learning (고병수, 구건모)

더욱 효과적인 이미지 검색 시스템을 위해 간단한 선형 연산으로 가상의 정보를 생성 및 활용하여 딥러닝 기반의 이미지 검색 정확도를 향상 시킨 연구.

3. StarGAN v2: Diverse Image Synthesis for Multiple Domains (최윤제, 어영정, 유재준, 하정우)

이미지 변환에 있어서 남/여 등 여러가지 도메인에 존재하는 머리색, 머리모양, 수염 등 다양한 스타일들을 반영하면서도 사실같은 이미지를 생성하는 기술 연구

4. Rethinking Data Augmentation for Image Super-resolution: A Comprehensive Analysis and a New Strategy (유재준, 안남혁, 손경아(아주대))

이미지 초고해상도 복원, 노이즈 제거, 화질 개선 등의 문제에 특화된 최초의 데이터 증강기법 제안으로 다양한 이미지 품질 향상 모델의 성능 향상 가능토록 한 연구

5. Regularization on Spatio-Temporally Smoothed Feature for Action Recognition (김진형, 차승환, 위동윤, 배순민, 김준모(KAIST))

비디오에서의 인물 행동 인식 정확도 향상을 위해 저주파 신호 교란을 통해 과적합 (overfitting)을 방지하는 정규화 (regularization) 기법 연구

6. GanHand: Predicting Human Grasp Affordances in Multi-Object Scenes (Enric Corona, Albert Pumarola, Guillem Alenyà, Francesc Moreno-Noguer, Grégory Rogez)

7. Estimating Low-Rank Region Likelihood Maps (Gabriela Csurka Khedari, Zoltan Kato, Andor Juhasz and Martin Humenberger)

저작권자 © 인공지능신문 무단전재 및 재배포 금지