정부 정책 및 활발한 투자 등의 영향으로 국내외 인공지능(AI) 데이터 산업 성장 가속, 데이터 공급기업과 작업자를 연결시키는 크라우드소싱 플랫폼이 각광

이미지:본지
이미지:본지

최근 ‘미래 산업의 원유’라 불리는 데이터 산업이 급속도로 성장하고 있다. 인공지능(AI), 자율주행, 블록체인 등 첨단 기술을 이끌어 갈 핵심 자원이 ‘데이터’라는 점에서, 4차 산업 혁명시대의 메인 키워드로 평가받기 때문이다.

실제로 하나의 AI 모델을 만들어내는 과정에는 수만에서 수백만 개 이상의 가공된 데이터를 학습시키는 단계가 필수적이다. 이에 AI 산업의 발전 흐름에 발맞춰 데이터 시장을 주도하기 위한 국가별 데이터 경쟁이 치열하다.

미국 트럼프 행정부는 지난해 2월 행정명령(Executive Order) '인공지능(AI) 분야에서 미국의 리더십 유지(Executive Order on Maintaining American Leadership in Artificial Intelligence)'을 통해 미국의 과학적, 기술적 및 경제적 리더십 지위를 유지하고 향상시키는 AI 정책 5 대 원칙을 제시하고 데이터 등 AI 전반적인 부분에 가속하고 있다. 또 민간을 중심으로 작년 기준 200조 원 규모의 데이터 거래 시장이 활성화되어 있다. 

이 가운데 중국은 2030년 AI 분야의 세계적인 리더가 되는 목표를 세우고 가속하는 가운데 특히, 디지털 이미지의 데이터베이스로부터 개인을 자동으로 식별하는 생체 인식 애플리케이션인 AI 얼굴 인식 기술은 세계에서 두 번째로 큰 중국 내수 시장에서 공공안전, 금융 서비스, 운송 및 소매 유통 등과 같은 분야에서 광범위하게 사용되고 있다. 

또한 중국 2030년까지 데이터 산업을 필두로 인공지능 분야의 세계 최고를 차지하겠다며 화웨이, 바이두, 알리바바 등 기업을 향한 지원을 아끼지 않고 있다. 뿐만 아니라 러시아, 일본, 프랑스 등도 데이터 관련 법과 정책을 정비하는 등 시장 내 패권을 잡기 위한 준비를 착실히 이어가는 중이다.

뿐만 아니라 러시아, 일본, 프랑스 등도 데이터 관련 법과 정책을 정비하는 등 시장 내 패권을 잡기 위한 준비를 착실히 이어가는 중이다.

사진:
사진:에이아이스튜디오

국내 데이터 시장의 성장세도 만만치 않다. 대한민국 데이터 시장의 규모는 약 16조 8693억원(2019년 기준)으로 전년보다 8.4% 증가했다. 특히, 해당 산업에 종사자의 경우 작년 기준 약 34만 명에 달해, 다른 산업보다 고용 증가율이 높은 수준에 속한다. 이에 최근 정부는 데이터 산업이 일으킨 고용 창출 효과를 더욱 극대화하고자 디지털 뉴딜, 데이터 바우처 지원 사업 등 관련 산업 육성을 위한 정책 지원에 적극 나서고 있다.

데이터 산업의 근간은 정리되지 않은 수많은 데이터를 학습 가능한 상태로 가공하는 작업인 ‘데이터 라벨링’이라 할 수 있다. 데이터 라벨링은 데이터 속 오브젝트에 이름표(라벨)를 달아주는 작업으로, 일견 단순해 보이지만 대개 AI 학습 데이터 구축의 80~90%는 라벨링에 소요될 정도로 매우 노동집약적인 과정이다.

최근에는 이를 보다 효율적으로 운영하기 위해 크라우드소싱 플랫폼이 등장했다. 크라우드소싱 플랫폼은 간단히 말해 데이터 가공 작업을 위해 데이터 공급 기업과 작업자를 연결해주는 통로로, 공급 기업은 플랫폼을 통해 작업자를 모집하여 데이터를 완성시키고, 작업자의 경우 주어진 프로젝트에 참여해 일정 수익을 얻는 구조로 운영된다.

해외에서는 이미 많은 기업들이 크라우드소싱 플랫폼을 개발하여 운영 중이다. 대표적으로 삼성, 핀터레스트, 에어비엔비, 도요타 등을 고객사로 두고 있는 ‘스케일 AI(Scale AI)’가 있으며, 해당 기업은 최근 실시한 시리즈 C펀딩 라운드에서 1억 달러의 자금을 투자 받으며 화제가 되기도 했다. 또한, 2008년 설립된 ‘사마소스(Samasource)’는 데이터 가공 플랫폼을 운영하며 주로 취업 취약계층의 경제적 활동과 자립을 활발하게 돕고 있어 눈길을 끌고 있다.

국내의 경우, 다수의 스타트업을 중심으로 크라우드소싱 플랫폼이 속속 생겨나고 있는 가운데, 인공지능 전문 기업 ‘에이아이스튜디오’가 새로 선보인 ‘마이크라우드(MyCrowd.ai)’가 대표주자로 떠오르고 있다. 마이크라우드는 누구나 참여 가능한 개방형 크라우드소싱 방식을 취해 데이터 공급 기업과 작업자를 연결시킨다.

특히 마이크라우드는 에이아이스튜디오가 자체 개발한 오토 세그멘테이션(자동 분할) 기능인 ‘매직핀(Magic Pin)’ 서비스를 도입했다. 이 기능은 사진, 영상과 같은 비정형 데이터에서 오브젝트와 배경을 자동으로 구분해주는 기능으로, 일반 작업 속도보다 10배 이상 빨라 효율적인 작업이 가능하다. 장애인, 고령자 등 취업 취약계층도 손쉽게 작업에 참여할 수 있어 국내 크라우드소싱 플랫폼 시장에 새로운 활력을 불어넣을 것으로 기대된다.

뿐만 아니라 데이터 바우처 지원 사업에 선정된 데이터 공급 기업의 경우, 마이크라우드가 제공하는 어노테이션 툴(Annotation Tool, 주석도구)을 활용하여 직접 데이터를 가공하거나, 크라우드소싱으로 모집된 작업자에게 별도로 가공 작업을 요청할 수도 있다. 이 외에도 마이크라우드는 데이터 수요 기업에게는 데이터의 유형에 따라 공급 기업을 매칭시켜주는 프로세스를 제공하는 등 공급 및 수요 기업 모두 만족할 수 있도록 하는 다양한 서비스를 강화해 나가고 있다.

이 밖에도 국내에서는 크라우드웍스, 에이모, 슈퍼브에이아이 등의 기업들이 크라우드소싱 플랫폼을 운영하고 있는 등 디지털 뉴딜 정책 등을 기점으로 많은 스타트업들이 데이터 가공 산업에 뛰어들고 있다.

에이아이스튜디오 노성운 대표이사는 “데이터는 인공지능 개발에 매우 필수적인 요소로 국내외 AI 관련 기업들은 계속해서 데이터 가공 분야에 관심을 가질 수밖에 없을 것이다”며 “에이아이스튜디오는 국내를 대표하는 인공지능 데이터 플랫폼으로서 이 시장을 주도해 AI 데이터 생태계를 활성화시키고, 우리와 같은 플랫폼 기업을 물론, 인공지능 개발사까지 모두가 함께 성장할 수 있는 토대를 마련하고자 최선을 다 할 것”이라고 전했다. 

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지