SEER는 10억개의 무작위, 레이블이 지정되지 않은, 큐레이팅 되지 않은 인스타그램 이미지에 대해 사전 학습 한 후 가장 진보 된 최첨단 자가지도 학습 시스템을 능가했으며, 이미지넷에서 84.2% 최고 정확도에 도달

이미지:페이스북
이미지:페이스북

인공지능(AI)의 미래는 테이터 분석을 통해 맞춤 정보를 제공하는 큐레이션(Curation)과 라벨링 된 데이터 세트에 의존하지 않고, 이미지 속의 물체를 인식하거나, 텍스트 블록을 해석하고 현재, 우리가 하고 있는 수많은 다른 작업을 수행하지 않고도, 주어진 모든 정보로부터 직접 학습할 수 있는 시스템을 구현하는 것으로 이동하고 있다.

이러한 접근 방식은 대표적으로 자가지도 학습(Self-Supervised Learning)이 주도하고 있다.

페이스북 AI가 이제, 컴퓨터 비전에서 자가지도 학습의 패러다임을 전환시켰다. 대부분의 컴퓨터 비전에서 세심한 큐레이션과 라벨링 없이 인터넷상의 이미지 그룹으로부터 학습할 수 있는 새로운 10억 파라미터의 컴퓨터 비전 모델인 '시어(Self-supERvised. 이하, SEER)'를 개발하고 이 개발에 사용된 비셀(VISSL)을 지난 4일 오픈 소스로 공개했다.

10억 파라미터의 컴퓨터 비전 모델인 '시어( SEER)'를 개발하고 이 개발에 사용된 비셀(VISSL) 로고 이미지
10억 파라미터의 컴퓨터 비전 모델인 '시어( SEER)'를 개발하고 이 개발에 사용된 비셀(VISSL) 로고 이미지

SEER는 10억개의 무작위, 레이블이 지정되지 않은, 큐레이팅 되지 않은 인스타그램( Instagram) 이미지에 대해 사전 학습 한 후 가장 진보된 최첨단 자가지도 시스템을 능가했으며, 이미지넷(ImageNet)에서 84.2 % 최고 정확도에 도달한 것이다.

아울러 로우샷, 물체 감지, 세분화 및 이미지 분류를 포함한 다운 스트림 작업에서 최첨단 지도 학습 모델을 능가했다. 또, 이미지넷 데이터 세트의 예제 중 단 10%로 훈련했을 때 SEER는 전체 데이터 세트에서 여전히 77.9%를 기록, Top-1 정확도를 달성했으며, 주석이 추가된 이미지넷 예제 중 단 1 % 만 사용하여 학습했을 때도 역시, SEER는 60.5 %의 Top-1 정확도를 달성했다.

이 SEER의 성과는 자기지도 학습이 실제 환경에서 컴퓨터 비전 작업에 탁월함을 보여준 것이다. 이것은 궁극적으로 미래에 더 유연하고 정확하며, 적응할 수 있는 컴퓨터 비전 모델을 위한 페러다임을 바꾸기 시작한 것으로 평가된다.

한편, 페이스북 AI는 SEER에 대한 세부 정보(논문)를 AI 커뮤니티와 공유하며, SEER를 개발하던 비셀(VISSL, 보기)을 오픈 소스(다운)로 공개하면서 자가지도 학습을 더욱 민주화하고 완전히 자체 감독된 미래를 향한 진전을 가속화하기 위해 노력하고 있다고 밝혔다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지