"최근 열리는 AI 경진대회가 목적보단 단지, 예산 소진과 단순 홍보 등의 일회성 대회로 변질되는 것과 참가자 또한 이력서에 경력사항을 한 줄 추가하는 형식으로 접근하는 것이 안타깝다"

데이콘 김국진 대표(사진:인공지능신문)

인공지능(AI) 시대에 들어서면서 국내에서는 다양한 교육과 프로그램들이 개설되고 있다. 최근 AI 인재를 양성하기 위해 각 대학에서는 인공지능 학과를 개설하고, AI대학원도 지난 2월 7개大가 추가로 선정되면서 국가지원 대상은 12개로 늘어났다. 또 민간 학원은 국비지원 프로그램, 공공기관은 개발연구소를 설립하는 등 AI 산업이 발전될 수 있도록 인재 양성과 기술 개발에 총력을 기울이는 상황이다.

현재, 국가의 지원으로 많은 교육 프로그램들이 개최되고 있는 가운데 이목을 끌고 있는 것이 ‘AI 경진대회’이다. 경진대회는 다양성을 촉진해 혁신을 이뤄내는 데 도움이 된다. 특히 AI경진대회는 분야에 관심이 있는 사람이라면 누구나 무료로 참여가 가능하여 많은 지원을 하고 있다. 게다가 대회에서 수상을 하게 되면 수상금을 받고 취업을 하게 될 경우 이력서에 경력사항을 한 줄 추가할 수 있다는 장점이 있다.

AI 및 데이터 경진대회는 미국에서 2010년 설립된 예측모델 및 분석 대회 플랫폼 ‘캐글(Kaggle)’을 시작으로 개발자 및 데이터 사이언티스트 사이에서 많은 인기를 끌었다. 구글 자회사이자 데이터 과학자 및 머신러닝 온라인 커뮤니티이기도 한 캐글은 현재, 회원이 194개국 100만명 이상으로 인공지능(AI) 경진대회 플랫폼으로 다양한 AI 대회를 주관하고 있다.

국내에서는 이러한 플랫폼이 없었지만 이와 견줄 허브로 지난 2018년 5월에 스타트업 ‘데이콘’이 설립됐다. 데이콘의 AI 컴피티션(competition) 플랫폼은 고객의 니즈를 해결하면서 AI 인재를 양성하는데 목표를 둔다. 현재, 국내 회원은 1.1만여 명과 해외 회원은 500여 명이 등록한 상태이며, 다가오는 6월에 글로벌 런칭 예정이다.

이에 본지는 데이콘 김국진 대표를 만나 그동안의 성과와 비전을 들어봤다

데이콘 김국진 대표(사진:인공지능신문)
데이콘 김국진 대표(사진:인공지능신문)

Q. 데이콘의 AI 컴피티션 플래폼이란?

A. 플랫폼은 고객의 니즈를 해결하면서 기업에게 AI과제 연구 실험실 제공과 개인과 팀은 도전 과제와 경쟁, 점수, 보상과 같은 게이미피케이션(Gamification)과 학습 및 이력 플랫폼 제공 등으로 데이터공유 실현과 국내 AI 산업 발전 촉진하는 것을 목표로 하며, 고객의 니즈를 효율적으로 충족시키는 경진대회를 열고 많은 사람들의 창의성과 다양성을 공유하며, 대회를 성공적으로 이끌어 AI 인재 양성을 위한 장을 열어주는 역할을 하는 것이다.

즉, 플랫폼은 경진대회 기획시 난이도 조절 및 흥행 실패에 대한 두려움과 운영 미숙으로 인한 불만과 신뢰성 하락, 대회 평가시 전문성 및 공정성등 진행에 따른 제반 문제에 데이콘은 다수의 회원(1만명)이 협업하는 플랫폼을 제공하고, 또한 문제 데이터 처리와 시뮬레이션으로 대회 난이도를 조절, 온라인에서 일어나는 부정행위를 치팅 알고리즘으로 차단하여 대규모 대회를 운영 하고, 실시간 리더보드와 내부 AI전문가들의 심화 평가로 대회의 신뢰성 확보과 성공적인 목표를 이끈다.

일반적으로 경진대회는 고객의 투자 자금에 따라 수상금과 운영예산이 책정된다. 현재 고객은 공공기관이 70%, 기업이 30%로 진행되고 있다. 중소기업 같은 경우 데이터 부족과 예산 문제를 고민이 많아 망설인다. 공공기관은 한국원자력연구원, GIST, ETRI, 국방과학연구소 등과 기업은 KB금융, KCB, 직방 등 금융, 핀테크 및 부동산 모든 산업에서 문제를 해결하기 위해 요청한다.

Q.데이콘 경진대회에 참여하는 사람들은 어떤 사람들인가?

A. 경진대회는 누구나 참여가 가능하다. 대학생, 석·박사, 사회초년생 등이 많이 지원하고 있다. 대학생이 많은 지원을 하고 있지만 수상은 적은 편이다. 팀은 한명 또는 여러명, 여러팀이 뭉쳐 한 팀이 될 수 있다.

실력이 부족한 사람들은 여러명에서 정보를 공유하며 시간을 단축시키고 효율적인 결과값을 얻어내기 좋다. 팀의 진행현황을 리더보드를 통해 실시간 업데이트하여 경쟁상황을 확인할 수 있다.

Q. 다른 유사 플랫폼처럼 고객의 니즈만 해결하면 되는데 왜 힘들게 경진대회까지 기획하는지?

A. 이전에 대기업을 다닐 때와 5년 전 부터 데이터 분석을 해봤는데 엑셀은 한계가 있어 파이썬, R 등 빅데이터 프로그래밍을 하게 되었다. 또한 4차산업 시대에서 나이의 고하를 막론하고 평생 직장이라는게 없으며 매일 새로운 기술과 지식이 쏟아진다. 따라서 흥미와 속도 높은 학습이 필요한데 캐글에 관심을 갖게 되었고, 캐글의 경진대회를 국내에서도 누릴 수 있도록 하고 싶었다.

각 나라마다 생성되는 데이터는 다르며, 해결하는 방식도 차이가 존재한다. 우리나라에서 발생되는 니즈를 국내 뿐만 아니라 해외 데이터 사이언티스트들과 함께 고민해 나아가고 싶다. 현재 인도, 필리핀, 등 해외 데이터 사이언티스트가 활동하고 있다. 나라, 인종 구분없이 함께 데이터를 공유하는 사회를 만들어가고 싶기에 노력하고 있다.

Q. 관련 AI업계 및 기관에 하고 싶은 말이 있다면?

A. 예전처럼 인공지능에 진입장벽이 그렇게 높지 않다. 유튜브나 교육 프로그램도 많이 진행되고 있으며 보다 효율적인 프로그램 툴이 많이 나온다. 많은 청년들이 자신의 분야에서 추가로 데이터 사이언스를 배운다면 큰 역량을 발휘할 수 있을 거라고 본다.

인공지능이 처음 화두가 되었을 때는 기업들의 잘못된 인식으로 인공지능을 도입해 큰 이득을 취하려 했지만, 현재는 인공지능에 대한 이해도가 높아졌기에 인공지능의 기술로 특정 기업이 부를 독차지 하는 것이 아닌 인공지능을 이용하여 다양한 기업과 사람들이 서로 상생할 수 있는 가치를 창출 할 수 있는 방법을 터득했으면 좋겠다.

특히, 최근 AI관련 경진대회의 문제점들이 발생되고 있다. 경진대회는 알고리즘을 새로운 방식과 창의성을 갖고 접근하고 해결하는 것이 매우 중요한 과제인데, 대회 주최자의 난발과 참가자의 목적이 일부 변질되고 있다. 최근 열리는 경진대회가 목적보단 단지, 예산 소진과 단순 홍보 등의 일회성 대회로 변질되는 것과 참가자 또한 이력서에 경력사항을 한 줄 추가하는 형식으로 접근하는 것이 안타깝다.

마지막으로 데이콘은 데이터 전처리기술과 난이도 컨트롤 및 사전 문제를 제거하고 초기 대회 모델 시뮬레이션, 머신러닝 치팅 알고리즘과 다양한 산업(20여종)의 요구사항에 맞는 평가 산식으로 신뢰도와 자유도를 높임으로써 대회를 여는 기관이나 기업들과 참가자들이 기존의 있던 데이터만 연구하는 것이 아닌 현재 국내·외에서 필요로 하는 니즈로 새로운 도전을 할 수 있도록 최선을 다할 것이다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지