셀렉트스타(SelectStar)는 '2020 인공지능 데이터셋 경진대회'를 개최한다. 이번 대회는 NIA 한국정보화진흥원 후원으로 중소기업, 스타트업, 연구소, 개인 연구자 등이 활용 가능한 데이터세트 예시를 모집하기 위해 기획됐다.
데이터세트란 차세대 인공지능(AI) 학습에 활용할 수 있는 데이터를 수집해 놓은 자료다. 일례로 플레이된 바둑 게임 약 3천만 수를 가져와 정책망 학습 기록을 적용시킨 알파고, 얼굴로 나이·성별 등을 판별하기 위해 수많은 사진 데이터를 적용시킨 AI 솔루션 등이 있다.
이번 대회는 한국에 맞게 구축할 수 있는 데이터세트와 그 활용 예시들을 제안하는 것이 주요 골자다. 개인, 단체로 팀을 꾸려 누구나 대회 홈페이지(보기)을 통해 참여할 수 있다.
대회 참가자는 셀렉트스타 홈페이지에 업로드 된 이미지, 영상, 오디오, 텍스트 수집 및 가공 내용 예시들을 참고할 수 있다. 데이터세트 구축에 필요한 모든 데이터 수집, 가공은 셀렉트스타가 운영하는 캐시미션 앱을 통해 크라우드 소싱 방식으로 진행된다.
접수 마감은 2월 13일까지이며, 2월 18일 서류심사 및 우수팀 선발이 이뤄질 예정이다. 이어 19일에 우수팀 선정 및 발표 평가 공지, 26일에 발표 평가 및 시상이 예정돼 있다. 1등의 영예를 거머쥔 1팀에게 300만원을 지원한다. 2등 1팀에게는 150만원이, 3등 2팀에게는 각 50만원 씩 제공한다.
무엇보다 크라우드소싱 방식으로 불특정 다수의 대중들을 통해 수집, 가공할 수 있는 데이터를 제안하는 것이 참가 과정의 핵심이다. 독창적인 새로운 데이터세트를 제안하는 방법, 해외에 이미 구축된 데이터세트를 국내 환경에 맞게 새롭게 변모시키는 방법 등 다양한 과정으로 참여할 수 있다. 셀렉트스타는 실용성과 범용성을 주요 심사 기준으로 삼는다는 계획이다.
셀렉트스타 관계자는 "대회를 통해 한국의 AI 발전에 도움이 될 수 있는 데이터세트 구축에 대한 아이디어를 발굴하고 추후 셀렉트스타에서 이를 직접 구축한다는 것이 대회의 본 취지"라고 전했다.
한편, 셀렉트스타는 AI 개발에 필요한 데이터를 모바일 크라우드소싱으로 수집 및 가공하는 서비스 제공에 나서고 있다. 특히 모바일 앱 '캐시미션'의 2만여 사용자들이 AI 기업들이 요청한 데이터 수집과 레이블링을 수행하고 보상을 받아가는 시스템이다.
지난 2018년 말 카이스트 창업팀에서 시작된 셀렉트스타는 현재 네이버, LG CNS, 한국전력, 롯데정보통신, 카이스트 등 40여 개의 고객사와 매출 14억 원을 확보하는데 성공했다. 현재 카카오 벤처스의 투자를 받아 빠르게 성장하고 있는 스타트업으로 주목 받고 있다.