2024년도 예산은 558억원 수준에 불과, 당초 구축하려던 데이터셋 목표에 적신호 켜져

윤영찬 의원(사진:의원실)
윤영찬 의원(사진:의원실)

국회 과학기술정보방송통신위원회 윤영찬 국회의원(더불어민주당, 성남 중원구)이 과학기술정보통신부(장관 이종호 이하, 과기정통부)로부터 제출받은 자료를 분석한 바에 의하면, 늘어난 수요와 데이터 활용실적에도 불구하고 AI 데이터 구축 예산이 대폭 삭감된 것이라고 지난 27일 밝혔다.

윤 의원에 따르면 지난 11일 한국지능정보사회진흥원(NIA. 원장 황종성) 국정감사에 출석한 황종성 원장은 ‘현재 트렌드가 초거대AI라 기존에 하던 데이터셋 구축사업, 라벨링이 필요없다’고 말했다고 한다. 그러나 이는 언어모델에 국한된 것으로, 다양한 분야에서 머신러닝을 하는 기업이 많은 현 상황과는 맞지 않는다.

또한 윤 의원은 "이 데이터 구축 사업은 중소‧스타트업 등 데이터 자원이 필요한 기업 지원을 위해 마련된 것이므로 대형언어모델(LLM, Large Language Model)을 구축하는 초거대AI 대기업의 사례를 들며, 해당 지원이 불필요하다고 주장하는 것은 무책임하다."며, "LLM을 하는 회사 또한 정교하게 정제된 데이터가 필요한 만큼 예산이 중요하기 때문이다"리고 짚었다.

당초 과기정통부는 2020년부터 6년간 총 2조 5천억원을 투입해 1,300종의 데이터셋을 구축할 예정이었다. 그러나 2023년 AI 학습용 데이터 구축사업의 총 예산은 2,805억원(150종, 종별 단가 18.7억원)으로, 당초 계획이었던 4,114억 대비 31.8%가 감소했다.

급기야 2024년 예산마저 대폭 삭감되어 558억원 수준으로 책정되었다. 급격히 늘어나는 수요와 데이터 활용실적에도 불구하고, 사업규모가 과도하게 축소된 것이다. 때문에, 2025년까지 1,300종의 데이터셋을 구축하기로 했던 애초의 사업 목표가 사실상 달성 불가능해졌다.

민간기업의 데이터 경제 활성화를 위한 마중물 사업인 데이터 바우처사업, AI‧클라우드 바우처사업 역시 대폭 축소됐다. 데이터, 인공지능, 클라우드 바우처의 수요기관이 증가함에 따라, 효과가 나오는 시점에서 최고 예산 규모였던 2022년 대비 25% 규모로 줄어든 것이다.

윤영찬 의원은 “ICT 분야는 기술 트렌드가 계속 변하는데, 트렌드만 쫓아가서는 지금의 초거대 AI 미래를 장담할 수 없다”며, “급변하는 추세에 맞춰 예산을 일부 조정할 수 있지만, 전 정권 지우기 차원에서 큰 규모의 예산을 삭감하는 것은 문제”라고 지적했다.

이어 “무분별한 예산 삭감은 윤석열정부가 표방하는 디지털 강국이라는 국정 운영 철학과도 맞지 않으며, 오히려 AI 선도국가로 가는 길에 걸림돌이 될 것”이라고 강조했다. 

저작권자 © 인공지능신문 무단전재 및 재배포 금지