채택된 논문은 Clova AI Research 팀에서 제출한 3편과, NAVER LABS Europe 에서 연구한 2편, 총 5편으로

초고속 사물 움직임 트래킹을 위한 상황기반 딥러닝 특징 압축 기술로 ​사진은 제안된 알고리즘 체계, 전문가 자동 인코딩은 컨텍스트 인식 네트워크에 의해 선택되고 ROI에 의해 한번 더 미세 조정된다.(이미지:논문 캡쳐)
초고속 사물 움직임 트래킹을 위한 상황기반 딥러닝 특징 압축 기술로 ​사진은 제안된 알고리즘 체계, 전문가 자동 인코딩은 컨텍스트 인식 네트워크에 의해 선택되고 ROI에 의해 한번 더 미세 조정된다.(이미지:논문 캡쳐)

네이버(대표 한성숙)가 18일부터 22일까지(현지 시간) 미국 솔트레이크시티 솔트 팰리스(Salt Palace) 컨벤션 센터에서 개최되는 세계적인 ‘컴퓨터 비전 및 딥러닝 컨퍼런스 CVPR 2018(IEEE Conference on Computer Vision and Pattern Recognition)'에 참석하여 AI 기술 공유 및 인재 영입에 나섰다. CVPR은 세계 최대 기술 전문 단체인 IEEE와 CVF가 1983년부터 공동 주최하는 컨퍼런스로, 세계적인 연구기관들이 참석해 매년 새로운 컴퓨터 비전, 딥러닝 등 인공지능 기술 연구에 대해 공유하는 장이다.

네이버는 작년에 이어 올해도 논문 5 편 채택(아래 다운받기 참고), 국내 산학기관 중 유일하게 ‘Oral 세션’에서 논문 발표하는 성과를 얻었으며, 이번 CVPR에는 총 3,359편의 논문이 제출되었으며, 그 중 979편이 채택, 구두(Oral) 발표는 약 2%(70편)에게만 주어진다. 이에 따라, CVPR에서 구두발표의 기회를 얻는 것은 세계 최고 수준의 기술력을 갖고 있음을 공식적으로 인정받는 셈이다.

머리색, 성별, 나이, 감정 등 여러개의 특징을 한꺼번에 변화시킬 수 있는 새로운 이미지변환 GAN모델로 사진은 RaD데이터 세트에서 학습한 지식을 전송함으로써 Celes7데이터 세트에 대한 다중 도메인 이미지 변환 결과로 첫번째 및 여섯번째 열에는 입력 영상이 표시되고, 나머지 열은 StarGAN에서 생성한 이미지로 단일 발생기 네트워크에 의해 생성되며, 분노, 행복, 두려움과 같은 얼굴 표정 라벨은 셀레브가 아닌 Ramp에서 온다.(이미지:논문 캡쳐)
머리색, 성별, 나이, 감정 등 여러개의 특징을 한꺼번에 변화시킬 수 있는 새로운 이미지변환 GAN모델로 사진은 RaD데이터 세트에서 학습한 지식을 전송함으로써 Celes7데이터 세트에 대한 다중 도메인 이미지 변환 결과로 첫번째 및 여섯번째 열에는 입력 영상이 표시되고, 나머지 열은 StarGAN에서 생성한 이미지로 단일 발생기 네트워크에 의해 생성되며, 분노, 행복, 두려움과 같은 얼굴 표정 라벨은 셀레브가 아닌 Ramp에서 온다.(이미지:논문 캡쳐)

특히, 다섯 편의 논문 중 Clova AI Research 인턴쉽 프로그램을 통해 연구한 ‘StarGAN’에 대한 논문’ Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation(최윤제, 하정우, Sung Kim, 주재걸 등)은 한국 소속의 산학 기관으로는 유일하게 CVPR 상위 2% 이내에 선정, ‘Oral 세션’에서 발표되는 성과를 얻었다. StarGAN은 딥러닝 기반의 이미지 변환 기술로, 하나의 이미지를 학습해 이미지 속 사람의 머리 색, 성별, 표정 등 여러 조건을 동시에 변경시킬 수 있으며, 여러 조건의 변화가 한 번에 연결되는 모양이 별과 같아 StarGAN이라는 명칭을 받았다.

한편 지난해 여름 네이버 Clova AI Research에서 인턴으로 재직했던 최윤제 연구원이 StarGAN 에 대한 모델링 설계와 구현, 실험을 포함한 대부분의 연구를 주도적으로 진행하였고, Clova 소속 개발자들이 함께 연구 방향성에 대한 논의와 결과분석, 논문작성 등 멘토링을 지원했으며, 또한 네이버는 AI 분야 핵심 인재 영입을 위해 컨퍼런스 기간 동안 참가자를 대상으로 기업 기술을 소개하는 'CVPR Industry EXPO' 프로그램에 참여 네이버의 AI 기술 연구 개발에 함께할 인재 영입에도 적극 나선다.

행동 인식 성능 향상을 위한 새로운 딥러닝 기반의 포즈 모션 표현 기법으로 사진은 샘플 추출된 몇개의 위치(왼쪽 그림의 원)에서 관측된 접합 j의 궤적에 대해, 다른 집계의 그림으로 C=3(색상으로 볼 때 가장 적합함)을 사용하는 스키마.(이미지:논문 캡쳐)
행동 인식 성능 향상을 위한 새로운 딥러닝 기반의 포즈 모션 표현 기법으로 사진은 샘플 추출된 몇개의 위치(왼쪽 그림의 원)에서 관측된 접합 j의 궤적에 대해, 다른 집계의 그림으로 C=3(색상으로 볼 때 가장 적합함)을 사용하는 스키마.(이미지:논문 캡쳐)

참고) 아래는 Clova AI Research 팀에서 제출한 논문 3편과, NAVER LABS Europe 에서 연구한 논문 2편, 총 5편을 다운 받을 수 있다.

1. StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation -머리색, 성별, 나이, 감정 등 여러개의 특징을 한꺼번에 변화시킬 수 있는 새로운 이미지변환 GAN모델 (최윤제, 하정우, 김성훈, 주재걸 등/ 다운받기)

​2. Dynamic Graph Generation Network: Generating Relational Knowledge From Diagrams -그래프나 다이어그램의 연결관계 정보를 해석해 주는 새로운 RNN 기반 모델.(유영준 + 네이버 D2SF에서 투자한 V.DO/ 다운받기)

그래프나 다이어그램의 연결관계 정보를 해석해 주는 새로운 RNN 기반 모델로 사진은 네트워크를 구문 분석하는 유니파이드 다이어그램의 개요(이미지:논문 캡쳐)
그래프나 다이어그램의 연결관계 정보를 해석해 주는 새로운 RNN 기반 모델로 사진은 네트워크를 구문 분석하는 유니파이드 다이어그램의 개요(이미지:논문 캡쳐)

3. Context-Aware Deep Feature Compression for High-Speed Visual Tracking -초고속 사물 움직임 트래킹을 위한 상황기반 딥러닝 특징 압축 기술 (윤상두/ 다운받기)

​4. Self-Supervised Learning of Geometrically Stable Features Through Probabilistic Introspection -사물의 위치 변경에 안정적인 특징 학습을 위한 자가 학습 딥러닝 모델 [저자: David Novotny(NAVER LABS Europe + Univ of Oxford), Samuel Albanie(Univ of Oxford), Diane Larlus (NAVER LABS Europe), Andrea Vedaldi (Univ of Oxford)/ 다운받기]

사물의 위치 변경에 안정적인 특징 학습을 위한 자가 학습 딥러닝 모델로 사진은 NAT의 접근 방식에서 얻은 대응력을 활용한다. 종합적인 것은 밀집된 것의 학습을 자기 주관적으로 하기 위해 변화한다.(이미지:논문 캡쳐)
사물의 위치 변경에 안정적인 특징 학습을 위한 자가 학습 딥러닝 모델로 사진은 NAT의 접근 방식에서 얻은 대응력을 활용한다. 종합적인 것은 밀집된 것의 학습을 자기 주관적으로 하기 위해 변화한다.(이미지:논문 캡쳐)

5. PoTion: Pose MoTion Representation for Action Recognition -행동 인식 성능 향상을 위한 새로운 딥러닝 기반의 포즈 모션 표현 기법[저자: Vasileios Choutas (NAVER LABS Europe + INRIA), Philippe Weinzaepfel(NAVER LABS Europe​), Jer´ ome Revaud(NAVER LABS Europe), Cordelia Schmid(INRIA)/ 다운받기]

 

 

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지