2017년, 아주그룹에 인수되어 보다 적극적으로 R&D에 투자하고 있으며, 이를 기반으로 2019년에 과기정통부 주관 AI R&D Grand Challenge 대회에서 상황인지/문자인지 2개 부문 우수상을...

고블린포토스 홈페이지 캡처
고블린포토스 홈페이지 캡처

컴퓨터 비전과 음성분석, 자연어 처리(NLP) 등의 AI 핵심 기술을 딥러닝, 머신러닝 기술 기반으로 제공하고 모든 기술들은 클라우드 기반으로 Open API 형태로 개발 및 솔루션을 제공하는 엠티콤(MTCom)의 허훈 대표는 “결국은 데이터의 품질을 높이는 게 관건이에요. 이제는 AI가 상용화 되지 않은 곳이 거의 없는데, 막상 AI서비스를 이용한 고객들은 실망하는 경우가 대다수입니다"라며, 기업들의 AI서비스가 아직까지는 소비자들의 마음을 사로잡지 못했다고 지적했다.

또 그는 “기업들이 너나 할 것 없이 AI 관련 인력을 투입해 서비스를 론칭하고 있지만 막상 고객들은 ‘아직까지는 사람이 편하다.’, ‘AI가 오류가 많고 사용자의 의도를 이해하지 못해 정확한 일처리가 힘들다.’ 등등의 애로사항을 토로”한다고 말하며, “지금은 AI를 기존 서비스에 접목시키거나 서비스의 일부분을 대체하는 것으로 만족할 때가 아니라 고객들이 120% 만족할 수 있도록 데이터를 기반으로 AI의 신뢰도를 향상하는 것에 주력해야 할 때”라고 설명했다.

AI 학습데이터 '고품질'에 매달려… 자체 개발한 AI 알고리즘으로 데이터 전처리

바야흐로 AI의 시대다. 금융, 의료, 교통, 패션, 뷰티, 예술까지 거의 모든 분야에 AI가 도입되었고, COVID-19 팬데믹으로 인해 AI 기술의 발전과 상용화가 더욱 시급한 상황이다. 하지만 사람이 제공하는 수준 높은 서비스를 AI가 구현할 수 있을까?

말의 뉘앙스와 대화의 상황을 이해하고, 사람과 커뮤니케이션 가능한 AI는 과연 언제쯤 가능할 것인가? AI는 사람의 어느 수준까지 발달할 수 있을까? 이런 물음에서 시작해, 엠티콤은 지난 2019년 데이터 고블린을 출시했다.

Data Goblins는 온라인 크라우드 방식을 통해 비용과 작업시간을 절감할 수 있는 AI 학습데이터 수집 가공 서비스로 사진은 로고 이미지
Data Goblins는 온라인 크라우드 방식을 통해 비용과 작업시간을 절감할 수 있는 AI 학습데이터 수집 가공 서비스로 사진은 로고 이미지

데이터 고블린은 크라우드 소싱을 이용해 로우 데이터(Raw Data)를 양질의 수준 높은 학습데이터로 가공하는 플랫폼이다. 엠티콤은 단지 고객사가 원하는 기간 안에 ‘쓸 만한’ 학습데이터를 내놓는 것에 만족하지 않았다. 그들은 ‘고품질’의 학습데이터 구축을 가장 중요한 목표로 하면서도, 어떻게 해야 데이터를 보다 효율적으로 가공할 수 있는지 연구했다. 이러한 과정에서 AI 산업에서 잔뼈가 굵은 전문가들이 사내 연구실에서 모여 밤을 지새우는 일이 많았다.

이들이 자체 개발한 AI 알고리즘은 수집된 로우 데이터를 빠르게 전처리한 뒤 데이터 고블린의 크라우드 작업자들에게 작업을 분배한다. AI 전처리 덕분에 작업자들은 더 많은 데이터를 가공할 수 있다. 작업 데이터의 질을 결정짓는 검수 과정에서도 마찬가지이다. AI가 1차 검수를 마치고, 내부 전문 인력들이 100%에 가까운 정확도를 위해 2차 검수를 진행한다. AI와 사람의 체계적인 협업이 좋은 데이터를 만들고, 좋은 데이터는 AI의 성능을 향상시키는 데 기여하는 선순환 구조이다.

한국의 AI 기술은 빠르게 성장 중이지만 아직 데이터 가공을 위한 인프라는 절대적으로 부족하다. 인프라의 부족은 곧 AI서비스의 저품질을 초래한다. 이를 해결하기 위해 엠티콤은 데이터 고블린을 통해 산발적으로 존재하는 데이터 가공 인력들을 모으고, 그들에게 가장 효율적인 시스템과 일에 걸맞는 보상을 즉각적으로 제공한다. 또한 데이터 고블린은 고객사에 데이터 컨설팅을 제공하고 있다. AI 전문인력들이 모여 만든 서비스인 만큼 데이터 수집의 기초 단계부터 면밀하고 효율적으로 짚어주겠다는 의지다.

가공은 웹으로, 수집은 모바일로... 사용자들의 편의성 높은 플랫폼을 각각 선택해 유기적으로 활용

데이터고블린 작업자페이지 캡처
데이터고블린 작업자페이지 캡처

그렇다면 과연 데이터 수집은 어떻게 진행되고 있을까? 엠티콤은 웹으로 운영되는 가공 플랫폼과 달리, 고블린 포토스 앱을 출시해 모바일로 이미지를 수집하고 있다. 대부분의 크라우드 작업자들이 스마트폰으로 사진을 찍고, 모바일에서 즉시 사진을 올릴 수 있는 작업 환경을 선호하기 때문이다. 자체 개발한 고블린 포토스 앱을 사용하면 작업 효율성과 데이터 수집 속도 향상이라는 두 마리 토끼를 동시에 잡을 수 있다.

고블린 포토스는 아주 간편하다. 타사의 앱과는 다르게 별도의 회원가입 절차를 없앴다. 이미지를 제출하고 연락처만 등록하면 모바일 상품을 수령할 수 있도록 프로세스를 최적화했다. 누구나 손쉽게 AI 기술 향상에 기여할 수 있으며, 리워드를 간편하게 제공받을 수 있다. 고블린 포토스에서 수집이 완료된 이미지들은 데이터 고블린에서 가공 후 학습 데이터로 완성된다. 고품질 학습 데이터를 만들기 위해 두 개의 플랫폼을 유기적으로 활용하는 것이다.

엠티콤 관계자는 “데이터 가공도 물론 어렵지만, 가공 이전에 적합한 데이터를 수집하는 과정부터 많은 기업들이 어려움을 겪고 있다. 엠티콤은 그런 어려움을 경감할 수 있도록 기존 크라우드 작업자들의 의견을 수렴하여 모바일로 이미지 수집이 가능한 앱을 개발했고, 기존 작업자뿐 아니라 크라우드 소싱에 대해 알지 못했던 일반인들의 참여도도 높일 수 있도록 앱의 사용성을 최적화했”다고 말하며, “고블린 포토스의 성과가 좋아 음성 수집 앱도 개발 단계에 있다”고 밝혔다.

AI 업계에서는 후발주자에 가깝지만 엠티콤의 기술력과 AI 학습데이터 품질은 이미 정평이 나있다. DB손해보험, SK매직, 아주캐피탈 등 국내 대기업에 음성인식 서비스를 개발하여 납품했고, ETRI(한국전자통신연구원)과는 이미 여러 번의 프로젝트를 함께 했다. 2017년에는 아주그룹에 인수되어 보다 적극적으로 R&D에 투자하고 있으며, 이를 기반으로 2019년에 과학기술정보통신부 주관 AI R&D Grand Challenge 대회에서 상황인지/문자인지 2개 부문 우수상을 받았다.

허훈 대표는 “포스트 코로나의 중심에 AI가 있습니다. 언택트(비접촉·비대면) 시대에 사람끼리의 접촉을 최소한으로 유지하면서 삶의 질을 높이는 일, 그야말로 웰니스(웰빙, 행복, 건강의 합성어)가 화두로 떠오르는 시대입니다. 이런 때일수록 사람에게 도움이 되는 AI, 우리의 삶을 풍성하게 만드는 AI가 필요합니다. 여러 기업들이 엠티콤과 협업해 최상의 AI서비스를 론칭하기를 바랍니다. 우리의 삶에 AI서비스가 편리함과 윤택함을 줄 수 있도록요.” 라고 말했다.

한편, 엠티콤은 의미있는 데이터를 수집하고 가공하여 여러 인공지능 기업들이 다양한 서비스를 개발하고, 사회와 인류의 발전에 기여할 수 있도록 돕는 중간 다리 역할을 수행한다는 비전을 가진 기업으로 학습 데이터의 새로운 기준을 제시하고 AI 업계를 오래도록 선도할 엠티콤을 주목할 차례다. 엠티콤은 오는 9월 23일(수)부터 25일(금)까지 서울 Coex에서 열리는 ‘AI EXPO KOREA 2020’에 참가해 데이터 수집, 가공 전문 플랫폼인 데이터고블린(Data Goblins, biz.datagoblins.com)을 선보인다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지