분야별 초거대 인공지능 확산을 위한 데이터 70종 기획‧발굴...그 첫 번째로 초거대 AI 학습용 데이터 구축 위해 양질의 한국어 말뭉치 300억 토큰 규모로 구축할 예정

AI 데이터 융합 네트워크 발족 참가자 단체 기념촬영 모습(사진:본지)
AI 데이터 융합 네트워크 발족 참가자 단체 기념촬영 모습(사진:본지)

과학기술정보통신부(장관 이종호, 이하‘과기정통부’)는 초거대 인공지능의 전산업으로의 확산을 위한 산‧학‧연 전문가 협의체인 'AI 데이터 융합 네트워크' 발족식을 8일, 명동 이비스 앰배서더 서울에서 개최했다.

주요 산업 분야별 전문가들로 구성된 'AI 데이터 융합 네트워크'는 각 산업 분야에서 인공지능의 확산‧융합 동향을 공유하고 양질의 인공지능 데이터가 적시 공급이 필요한 분야를 신속히 발굴하기 위해 결성되었다.

박윤규 차관은 “인공지능은 경제‧사회 전반으로 확산되어 혁신을 이끌게 될 것”이라며, “산‧학‧연 각계각층과 적극적으로 협의하여 정부 지원이 필요한 과제를 발굴하고 신속히 정책에 반영하여 전분야의 경쟁력이 강화될 수 있도록 최선을 다하겠다”라고...(사진:본지)
박윤규 차관은 “인공지능은 경제‧사회 전반으로 확산되어 혁신을 이끌게 될 것”이라며, “산‧학‧연 각계각층과 적극적으로 협의하여 정부 지원이 필요한 과제를 발굴하고 신속히 정책에 반영하여 전분야의 경쟁력이 강화될 수 있도록 최선을 다하겠다”라고...(사진:본지)

'AI 데이터 융합 네트워크'는 10대 전략 분야별로 각 10명 내외의 위원으로 구성되며, 해당 전략 분야는 산업 및 정부 정책을 기반으로 전략분야 후보를 구성한 후, 델파이 조사를 통해 시장 수요 및 파급효과, 구축‧공개 가능성, 기술 선도성 등에 대한 전문가 의견을 수렴하여 선정되었다.

AI 데이터 융합 네트워크 발족 후 첫 위원 회의 전경(사진:본지)
AI 데이터 융합 네트워크 발족 후 첫 위원 회의 전경(사진:본지)

10대 전략분야 및 위원은 ▷법률(인텔리콘 임영익 대표·변호사), ▷의료(장혁재 연세대학교 의과대학 교수, 김종엽 건양대학교의료원 의생명연구원장), ▷교육(장소원 국립국어원 원장), ▷지능행정(김동환 포티투마루 대표), ▷교통·물류(김준석 포티투닷 상무), ▷제조·로보틱스(윤현수 연세대학교 교수), ▷콘텐츠(이충희 엔씨소프트 실장), ▷재난·안전·환경(이승국 부경대학교 교수), ▷국방(심승배 한국국방연구원 센터장), ▷농림축수산(허은아 에이아이포펫 대표) 등으로 구성됐다.

이날 발족식 행사에는 박윤규 과기정통부 차관, 장소원 국립국어원장, 황종성 한국지능정보사회진흥원장, 과기정통부 인공지능확산팀장 및 10대 분야별 전문가들이 함께 모여 인공지능 산업 동향을 공유하고, 각 산업 분야에서의 인공지능 활용방안을 모색하였다.

포티투마루 김동환 대표(사진:본지)
포티투마루 김동환 대표(사진:본지)

먼저, 기업용 경량형 언어모델(sLLM)을 개발한 포티투마루의 김동환 대표가 초거대 인공지능의 기술발전과 상용 활성화를 위한 방안을 발표하였고, 과기정통부는 초거대AI 중심으로의 시장 환경 변화에 대응하는 ‘초거대 인공지능 데이터 정책 방향’과 관련 인사이트를 공유했다. 

이어 과기정통부 인공지능정책관 인공지능확산팀 최우석 팀장이 '초거대 AI 데이터 정책 방향'으로 기업이 초거대 ai 시장에 진입하는 데 필요한 최소한의 학습용 데이터를 구축하여 진입 장벽을 낮추고 데이터 활용 확산 및 기반 조성을 통해 궁극적으로 민간 자율적인 데이터 생태계를 조성하기 위해 그 첫 번째로 초거대 AI 학습용 데이터 구축의 경우 양질의 한국어 말뭉치를 약 300억 토큰 규모로 구축할 예정이라고 말했다.

인공지능확산팀 최우석 팀장(사진:본지)
인공지능확산팀 최우석 팀장(사진:본지)

아울러, 발족하는 'AI 데이터 융합 네트워크' 운영을 통해 데이터 구축 수요를 모으고 파급력 있는 과제를 개발해 나갈 예정이며, 데이터 활용 확산을 위해서 AI 허브의 검색 다운로드 기능을 고도화하여 데이터 접근성과 편의성을 강화하고 각 데이터세트들의 성능 지표를 공개하고 커뮤니티 기능을 부과하는 리더 보드를 운영해 데이터 및 AI 모델을 자유롭게 업로드하고 비교 경쟁할 수 있는 환경을 구축할 예정이라고 밝혔다.

이어지는 토의에서는 분야별 인공지능 관련 산업 동향을 공유하고, 정부의 정책 방향에 대한 논의가 이루어졌다. 장소원 국립국어원장은 국민의 국어능력 향상을 지원하기 위해 인공지능을 활용한 글쓰기 평가‧첨삭 서비스를 준비하고자 하며, 이를 위해 글쓰기 원천 데이터 구축을 확대할 것을 요청하였다. 

임영익 인텔리콘 대표(사진:본지)
임영익 인텔리콘 대표(사진:본지)

임영익 인텔리콘 대표는 생성형 인공지능의 출현으로 전 세계 기술을 바탕으로 하여 법률 서비스를 제공하는 리걸테크 산업이 급변하고 있고 인공지능이 직접 고객에게 법률 상담까지 진행하는 단계가 되었음을 설명하며, 판결문 등 법률 데이터 구축이 필요함을 이야기하였다.

이날 발족한 'AI 데이터 융합 네트워크'는 분야별 회의를 정기적으로 운영하여 현장의 인공지능 데이터 수요를 확인하고, 인공지능의 전산업 확산을 가속화하기 위한 방안을 논의할 계획이다. 이를 기반으로, 과기정통부는 정부의 지원이 필요한 초거대 인공지능 데이터 구축 과제를 분야별로 5~10종 발굴하여‘24년도 사업화로 연계할 계획이다.

과기정통부 박윤규 차관은 “인공지능은 경제‧사회 전반으로 확산되어 혁신을 이끌게 될 것”이라며, “산‧학‧연 각계각층과 적극적으로 협의하여 정부 지원이 필요한 과제를 발굴하고 신속히 정책에 반영하여 전분야의 경쟁력이 강화될 수 있도록 최선을 다하겠다”라고 밝혔다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지