행사이미지
행사이미지

셀렉트스타(SelectStar)는 '2020 인공지능 데이터셋 경진대회'를 개최한다. 이번 대회는 NIA 한국정보화진흥원 후원으로 중소기업, 스타트업, 연구소, 개인 연구자 등이 활용 가능한 데이터세트 예시를 모집하기 위해 기획됐다.

데이터세트란 차세대 인공지능(AI) 학습에 활용할 수 있는 데이터를 수집해 놓은 자료다. 일례로 플레이된 바둑 게임 약 3천만 수를 가져와 정책망 학습 기록을 적용시킨 알파고, 얼굴로 나이·성별 등을 판별하기 위해 수많은 사진 데이터를 적용시킨 AI 솔루션 등이 있다.

이번 대회는 한국에 맞게 구축할 수 있는 데이터세트와 그 활용 예시들을 제안하는 것이 주요 골자다. 개인, 단체로 팀을 꾸려 누구나 대회 홈페이지(보기)을 통해 참여할 수 있다.

대회 참가자는 셀렉트스타 홈페이지에 업로드 된 이미지, 영상, 오디오, 텍스트 수집 및 가공 내용 예시들을 참고할 수 있다. 데이터세트 구축에 필요한 모든 데이터 수집, 가공은 셀렉트스타가 운영하는 캐시미션 앱을 통해 크라우드 소싱 방식으로 진행된다.

접수 마감은 2월 13일까지이며,  2월 18일 서류심사 및 우수팀 선발이 이뤄질 예정이다. 이어 19일에 우수팀 선정 및 발표 평가 공지, 26일에 발표 평가 및 시상이 예정돼 있다. 1등의 영예를 거머쥔 1팀에게 300만원을 지원한다. 2등 1팀에게는 150만원이, 3등 2팀에게는 각 50만원 씩 제공한다.

무엇보다 크라우드소싱 방식으로 불특정 다수의 대중들을 통해 수집, 가공할 수 있는 데이터를 제안하는 것이 참가 과정의 핵심이다. 독창적인 새로운 데이터세트를 제안하는 방법, 해외에 이미 구축된 데이터세트를 국내 환경에 맞게 새롭게 변모시키는 방법 등 다양한 과정으로 참여할 수 있다. 셀렉트스타는 실용성과 범용성을 주요 심사 기준으로 삼는다는 계획이다.

셀렉트스타 관계자는 "대회를 통해 한국의 AI 발전에 도움이 될 수 있는 데이터세트 구축에 대한 아이디어를 발굴하고 추후 셀렉트스타에서 이를 직접 구축한다는 것이 대회의 본 취지"라고 전했다.

한편, 셀렉트스타는 AI 개발에 필요한 데이터를 모바일 크라우드소싱으로 수집 및 가공하는 서비스 제공에 나서고 있다. 특히 모바일 앱 '캐시미션'의 2만여 사용자들이 AI 기업들이 요청한 데이터 수집과 레이블링을 수행하고 보상을 받아가는 시스템이다.

지난 2018년 말 카이스트 창업팀에서 시작된 셀렉트스타는 현재 네이버, LG CNS, 한국전력, 롯데정보통신, 카이스트 등 40여 개의 고객사와 매출 14억 원을 확보하는데 성공했다. 현재 카카오 벤처스의 투자를 받아 빠르게 성장하고 있는 스타트업으로 주목 받고 있다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지