제안된 인스타오더 데이터 집합의 개요(사진:논문 캡처)
제안된 인스타오더 데이터 집합의 개요(사진:논문 캡처)

POSTECH(포항공과대학교, 총장 김무환) 박재식 교수 연구팀(제1저자 현, LG AI연구소 이현민 연구원)의 '인스타오더(InstaOrder)'라는 새로운  데이터 세트 연구 결과가 오는 6월 19일부터 24일까지  미국 루이지애나 뉴올리언스에서 열리는 국제 컴퓨터 비전 및 패턴인식 학술대회(CVPR2022, Conference on Computer Vision and Pattern Recognition)에서 발표된다.

InstaOrder는 3D 공간에서 인스턴스의 공간 관계를 이해하는 데 사용할 수 있는 새로운 데이터 세트로 포스텍이 기획해 제안하고, 인공지능(AI) 학습 데이터 플랫폼 스타트업  셀렉트스타(대표 김세엽)가 제작한 ‘데이터셋 지원사업’을 통해 2021년에 구축된  데이터 세트이다.

InstaOrder는 인공신경망(neural network)을 이용해 사진 한 장에 있는 각 물체 간의 상대적인 거리를 인지하기 위해 제작된 데이터 세트로 대규모 영상에서 물체 간 상대거리를 지정함으로써 사진 한 장에서 거리를 추정하는 인공지능 기법의 성능을 끌어올리는데 활용될 수 있다. 연구팀에 따르면, 세계 최고 수준 거리 추정기법인 MiDas V2가 InstaOrder의 도움으로 성능이 향상됐다.

포항공대 컴퓨터비전랩 박재식 교수는 “InstaOrder는 사진 속 물체들의 상대적인 거리의 학습에 쓰일 수 있으며, 물체 인지, 자율주행, 이미지 편집 등 분야에 광범위하게 활용될 수 있다”며 “셀렉트스타의 크라우드소싱 앱인 ‘캐시미션’을 통해 290만 개나 되는 물체간 거리의 레이블링을 효율적으로 진행할 수 있었다”고 말했다.

셀렉트스타 김세엽 대표는 “가장 시간이 오래 걸리고, 비용과 인력이 많이 드는 것은 데이터 전처리 과정”이라며 “셀렉트스타는 캐시미션을 통한 크라우드소싱 방식으로 데이터 ‘수집’과 ‘분석’ 그리고 ‘검수’까지 처리하는 덕택에 고품질의 데이터를 빠르게 수집할 수 있다”고 강조했다.

참고로 셀렉트스타가 운영하고 있는 캐시미션은 다수 이용자의 참여로 인공지능 서비스용 데이터를 수집하고 가공하는 크라우드소싱 서비스다. 기존과 달리 데이터 수집 및 가공을 위한 인력을 고용할 필요 없다는 것이 장점이다.

셀렉트스타는 작년부터 데이터셋 지원사업을 하고 있으며, 포항공대와 더불어 대한민국 대표 자연어 데이터셋인 ‘KLUE’도 셀렉트스타의 지원을 받은 바 있다.​

한편, 이번 CVPR2022 채택된 연구 논문은 지난해 11월30일 아카이브를 통해 ‘자연경관에서의 인스턴스별 차폐 및 깊이 순서(Instance-wise Occlusion and Depth Orders in Natural Scenes-다운)’란 제목으로 공개됐다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지