이미지:2023 OURdata Index 표지 갈무리, 편집:본지
이미지:2023 OURdata Index 표지 갈무리, 편집:본지

인공지능(AI)의 치열한 경쟁이 데이터 경쟁으로 바뀌고 있다. 즉, AI 성능은 곧 데이터 세트의 품질에 따라 크게 좌우된다. 

지난해 말부터 시작된 챗GPT를 시작으로 생성 AI 모델은 이미 미국 변호사 시험에서 고득점을 획득하고 인간과 같은 문장을 작성할 수 있다. 그러나 이 모델들은 편견이나 거짓정보를 반영할 수 있다.

인공지능의 능력을 계속 향상시키려면 생활 지표, 공공 데이터, 정부 정책 데이터 등과 같은 더 정교한 유형의 정보로 스스로를 훈련시켜야 한다. 하지만 이러한 데이터는 접근과 개방의 어려움으로 가용성이 낮고 비용이 많이 든다.

여기에, 경제협력개발기구(Organisation for Economic Co-operation and Development. 이하, OECD)가 실시한 2023 공공데이터 평가에서 대한민국이 1위를 차지했다. 이는 지난 2015년, 2017년, 2019년에 이어 4회 연속 1위를 기록한 쾌거다.

OECD가 현지시간 22일, 발표한 2023년 OECD 공공데이터 평가 결과 보고서 '2023 OECD Open, Useful, and Re-Usable data(개방적이고 유용하며 재사용 가능한 데이터, 이하, OURdata) Index : Result and Key Findings-다운)'에 따르면 우리나라는 종합 0.91점(1점 만점)으로 평가에 참여한 40개국(회원국 중 36개국 + 비회원국 4개국/브라질, 페루, 크로아티아, 루마니아) 중 1위를 기록했다.

이는 OECD 평균(0.48점)보다 두 배 가량 높은 수준으로, 우리나라의 뒤를 이은 프랑스, 폴란드 등 상위 국가들에 비해 크게 앞섰다. 2위를 차지한 프랑스보다 약 10% 높은 점수다.

OECD 공공데이터 평가는 국제 공공데이터 헌장(International Open Data Charter)을 바탕으로 OECD 조사 대상국의 공공데이터 정책과 성과 평가를 위한 지수(OURdata Index)를 만들어 낸다.

2023 OURdata 인덱스, 국가별 결과(출처:보고서)
2023 OURdata 인덱스, 국가별 결과(출처:보고서)

2015년부터 2년마다 평가결과가 발표되었으나, 2021년에는 코로나19 상황으로 인해 공공데이터평가가 지연되어 4년 만인 올해 평가 결과가 공개됐다. 평가는 데이터의 가용성(Data Availability), 접근성(Data Accessibility), 정부 지원(Government support for data reuse) 등 총 3가지 분야로 진행된다. 

한국은 고도화된 평가체계에서도 3개 분야에서 모두 상위권을 유지하였으며, 특히 데이터 활용을 위한 정부지원 부문은 1위, 데이터 가용성, 접근성에서는 2위를 차지했다.

특히, 올해는 국제사회가 당면한 문제를 해결하는 데 도움을 줄 수 있는 기후·지리·교육 등 분야별 고부가가치데이터셋을 새롭게 정의하고 이에 대한 개방 여부가 가용성 및 접근성 분야에서 평가되기 시작했다.

<가용성>분야는 사회문제 해결에 공공데이터를 활용한 정도를 평가하는 지표다.

우리나라는 0.84점을 받았으며, OECD 평균은 0.48점이다. 국민수요가 높고 기후문제 등 사회문제 해결에 도움이 되는 데이터를 발굴‧개방하는 국가중점데이터 개방계획(국민수요를 바탕으로 행정안전부의 행·재정적 지원을 통해 고품질·고부가가치 데이터를 개방)과, 범정부 중장기개방계획(공공데이터의 원칙적 개방 기조하에 공공기관이 보유·관리하는 데이터를 연차적으로 개방 확대)을 적극 추진하였고 이 부분이 좋은 평가를 받았다.

또한, 올해 처음으로 범정부 차원의 개방 촉진 인센티브 및 개방 모니터링 시행 여부가 평가되었는데, 우리나라가 도입하여 시행 중인 공공데이터 제공 운영 실태 평가 제도가 우수하게 받아들여졌다.

<접근성>분야는 국민의 공공데이터를 쉽게 활용할 수 있는 정도를 평가하는 지표다.

우리나라는 0.9점을 받았으며, OECD 평균은 0.59점이다. 공공데이터를 국민과 기업이 한층 편리하게 활용할 수 있도록 하는 공공데이터포털의 오픈API 자동변환 서비스(공공데이터포털에 등록한 오픈포맷(CSV 형식) 파일 데이터를 오픈API로 자동 변환하여 민간에 제공하는 서비스로 이용자들의 앱‧웹 개발 편의성 향상)로 높은 평가를 받았으며, 비공개정보가 들어가 있어 개방이 곤란한 데이터라도 그 진위여부를 확인할 수 있게 하는 ‘진위확인 서비스’도 높은 평가를 받았다.

<정부지원>분야는 민간협업, 교육 등 공공데이터 정책을 위해 정부의 지원 정도를 평가하는 지표다.

평가대상 40개국의 평균점수가 가장 낮은 분야로서 각 나라의 적극적인 노력이 요구되는 분야다. 이 분야에서 우리나라는 회원국 중 유일하게 1만 점을 기록했으며, OECD 평균은 0.37점이다.

코로나19 시기에도 불구하고 시민사회와 협력해 다양한 사회 현안을 다루는 열린세미나 개최 노력이 좋은 평가를 받았고, 민관 협력 기반 공적 마스크 데이터 개방을 통한 코로나19 대응, 요소수 대란 시 전국 요소수 재고 현황 개방 등 주요 데이터를 적시 개방‧활용하여 국가 현안 해결에 적극 기여한 점이 크게 평가됐다.

아울러 공무원 대상 공공데이터 리터러시 제고를 위한 맞춤형 교육(기초, 심화, 고급) 및 데이터 분석 교육 노력도 우수하게 평가됐다.

한편, 행정안전부(장관 이상민)는 한국지능정보사회진흥원(원장 황종성. NIA) 등 관계기관과 함께 공공데이터 정책 추진에 더욱 박차를 가할 계획이다. 우선, 데이터 생성‧관리‧제공‧활용‧폐기 등 데이터의 생애주기적 관리를 위해 올해 '공공데이터법', '데이터기반행정법' 개정을 추진하는 등 변화하는 데이터 환경을 적극 반영하여 제도를 정비할 예정이다.

데이터 개방 관점뿐 아니라 데이터 ‘활용 관점’을 고려하여 민간이 개발하고자 하는 서비스를 조사하여 서비스 활용에 필요한 데이터를 국가중점데이터로 선제적으로 개방한다. 또한 '범정부 공공데이터 중장기 개방계획 (’23~’25)'을 통해 메타데이터(데이터의 체계적인 관리와 편리한 검색 및 활용을 위하여 데이터의 구조, 속성, 특성, 이력 등을 표현한 자료)를 기반으로 미개방중인 데이터의 개방을 확대해 나간다는 것이다.

아울러, 기존의 공공데이터포털을 대대적으로 개편하는 ‘데이터 융합분석 대국민 플랫폼(국민이 의미기반으로 데이터를 쉽게 찾고, 활용할 수 있는 차세대 데이터개방 플랫폼)’ 구축을 통해 공공기관의 모든 데이터를 연계·결합하여 고부가가치를 창출할 수 있는 기반을 조성할 계획이다.

실제로 이렇게 개방된 다양한 고품질의 공공데이터는 사회문제를 효과적으로 해결하고 민생편의를 도모하고 있다. 올해 세계 최초로 선보인 인공지능 기반 ‘보이스피싱 음성분석모델 케이 봄(K-VoM)’은 행정안전부 통합데이터분석센터와 국립과학수사연구소가 공동으로 공공데이터를 활용해 개발한 성공적인 사례로 꼽힌다. 

올해 10월 케이봄(K-VoM)을 통해 콜센터 총책, 자금관리책, 상담원 등 3개 조직 혐의자 특정 및 범죄가담자 51명을 검거하는 효과를 거두었다.

또한 개방된 공공데이터를 활용하여 다양한 민간애플리케이션이 개발되어 보다 편리한 서비스를 누릴 수 있게 되고 창업도 활성화되었다. 공공데이터를 활용하여 민간에서 개발한 병원 예약 시스템 ‘똑닥’, 온라인 주차 플랫폼 ‘모두의 주차장’ 등의 앱 서비스는 국민생활 편의를 크게 증진시켰다.

행안부 이상민 장관은 “이번 최고 평가결과는 적극적으로 공공데이터를 개방한 정부, 공공데이터를 잘 활용한 기업과 국민 모두의 성과”라며, “앞으로도 기업과 국민이 필요로 하는 고품질의 공공데이터를 보다 많이 개방하고, 데이터 활용도 제고를 위한 지원도 강화해나가겠다”고 밝혔다.

이어 “최근 행정전산망 장애를 계기로 디지털플랫폼정부를 더욱 업그레이드하여 디지털 강국의 위상을 공고히 해나가겠다”고 덧붙였다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지