수상작들은 문화체육관광부 장관상, 국립국어원 원장상과 상금 외에 단체장 상 등 시상 범위가 확대 되었으며 특히 네이버, NC소프트, KT 등 기업들에 우선 입사의 기회가 제공된다.

행사이미지:본지편집
행사이미지:본지편집

국립국어원(원장 소강춘)이 2009년부터 해마다 개최되어 온 ‘2020 국어 정보 처리 시스템 경진 대회’ 참가자를 오는 9월 11일까지 모집한다.

‘국어 정보 처리 시스템 경진 대회’는 국립국어원에서 구축한 국어 말뭉치 자원의 활용도를 높이고, 국어 정보화 확대를 유도하는 등 국어 정보 처리 시스템 개발 및 보급 수준을 높이는 중추적 역할을 해 왔다.

‘말뭉치(말모둠, 글모둠)’는 언어 연구를 위해 텍스트를 컴퓨터가 읽을 수 있는 형태로 모아 놓은 언어 자료다. 이는 인공지능(AI)이 얼마나 많이 학습하느냐에 응용 시스템이나 디바이스의 성능이 좌우된다. 우리말과 우리글을 기반으로 한 국가 인공지능(AI) 산업 강화와 자연어처리(NLP) 등 AI의 핵심기술 개발을 위한 인공지능 생태계 구축이 필요한 이때에 ‘국어 정보 처리 시스템 경진 대회’는 중요한 의미를 갖는다.

현재, 국어원은 2022년까지 150억 어절 규모의 말뭉치를 구축하는 것이 목표하고 있다.

대회홈페이지 캡처
대회홈페이지 캡처

2020년 경진 대회의 모든 접수와 심사는 온라인으로 진행된다. 참가 분야는 지정 분야와 일반 분야 두 개로, 올해 ▶지정 분야의 주제는 감성 말뭉치 분석 시스템 개발 및 적용이며, ▶일반 분야의 주제는 국립국어원에서 구축한 국어 말뭉치를 활용한 한국어 처리 도구(형태소 분석, 구문 분석, 개체명 인식 등), 한글, 한국어 활용 및 학습에 관련된 소프트웨어 개발이다.

특히, ‘감성 말뭉치 분석 시스템 개발 및 적용’은 지난 대회와 차별화된 다양한 분석 도구의 개발 및 활용이 기대된다. ‘감성 말뭉치’는 고도화된 인공지능 서비스를 개발하기 위해 매우 필요한 자원이다. 이러한 중요성을 인식한 국립국어원은 올해부터 본격적으로 ‘감성 말뭉치’ 구축 사업과 연구를 진행하고 있으며, 이에 발맞추어 지정 분야를 선정하였다고 밝혔다.

감성 말뭉치 분석 시스템 개발 및 적용분야에는 최대 10단계 척도를 적용한 감성 분석(긍정-부정) 가능 소프트웨어 개발로 관련 보고서를 5쪽 이내의 문서로 작성하여 제출하면 된다. 학습 데이터 제공(경진 대회 홈페이지 참고)된다. 일반 분야는 한국어 처리 도구(형태소 분석, 구문 분석, 개체명 인식 등), 한글, 한국어 활용 및 학습 관련된 소프트웨어, 국립국어원에서 구축한 국어 말뭉치 활용 관련 내용으로 한다. 참가 자격은 국어 정보 처리에 관심 있는 누구나 개인 또는 팀 구성을 통해 '2020 국어 정보 처리 시스템 경진 대회 홈페이지(보기)'에서 참가할 수 있다. 

한편, 이번 경진대회를 주관하는 한국정책개발연구원(원장 임성근)에 따르면 올해부터 수상작들은 문화체육관광부 장관상, 국립국어원 원장상과 상금 외에 단체장 상 등 시상 범위가 확대 되었으며 특히 네이버, NC소프트, KT 등 기업들에 우선 입사의 기회가 제공된다.

토크콘서트 포스터
토크콘서트 포스터

또한 대회에 참가자와 관련 분야의 전공자를 대상으로 오픈하여 진행되는 특강 및 토크콘서트가 8월 18일에 온라인 화상시스템(Zoom)으로 진행되며 여기에 국민대 소프트웨어학부 강승식 교수의 '감정 분석 연구의 최신 동향'과 서울대 사이언스대학원 신효필 교수의 '한국어 감정분석 코퍼스(KOSAC)와 이를 활용한 BERT기반 사전학습 모델'이란 주제로 열정 강의와 시원한 질문 및 답변 등 격이 없는 대화를 주고 받을 수 있는 토크콘서트가 운영되며 참여하기 위해서는 홈페이지 내 참가하기에 신청하면 누구나 가능하며 참가작 품질향상에 좋은 기회가 되기를 기대한다고 밝혔다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지