NTT, 딥러닝에 뉴스 원고 자동 생성, AI 기자 실현 가능성을 검증

이미지

NTT 데이터는 인공지능(AI)을 이용하여 기상 뉴스 원고를 기상 전문(電文)에서 자동 생성하는 실증 실험을 지난해 9월부터 4개월간 딥 러닝(Deep Learning)을 적용해 미디어 사업자와 연계하여 우선 비교적 패턴이 복잡하지 않은 기상 뉴스 원고의 자동 생성을 실현했다고 27일 밝혔다.

현재, 이미지와 음성과 비교하여 의미를 알고 문서(기사)를 자동으로 생성하는 것은 난이도가 크며, 실제 어렵다고 되어있었으나. 본 실증 실험에서는 난이도가 높은 문서 자동 생성에 도전하고 자동 생성 된 문서의 품질이 실용화 할 수 있는지를 검증했다.

실험에서는 기상청이 과거에 공개한 기상 전문와 과거에 아나운서가 읽은 기상 뉴스 원고를 세트로 학습하는 구조를 구축하고 지난 4년 동안의 기상 전문에서 기상 뉴스 원고를 생성하는 규칙을 학습했다.

이 방법으로 생성 된 기상 뉴스 원고를 평가 한 결과, 일본어의 문법은 사람이 읽어도 위화감이 없는 수준에서 의미의 정확성에 대해서는 약간의 수정이 필요하지만, 대체로 기상 전문과 같은 내용의 문서를 작성할 수 있는 것으로 확인했다고 밝혔다.

지금까지 뉴스 원고를 자동 생성하려면 미리 준비된 템플릿 문장에 단어와 숫자를 포함하는 방법이 주류 이었지만, 이 방법은 대량의 템플릿 문장이나 단어 포함 방법을 사람이 하나하나 설계 할 필요가 있기 때문에 다양한 패턴에 대해 포괄적으로 대응하는 데는 한계가 있었다.

NTT그룹의 인공지능인 코레보 로고(corevo)(사진:NTT)

실험에서는 우선 기상청이 과거에 공개 한 기상 전문과 아나운서가 읽은 뉴스 원고를 각각 4 년 동안 준비하고, 원고 작성의 규칙성을 딥 러닝에서 학습하는 것으로, 뉴스 원고를 생성하는 AI를 구축했다.

이 AI에 새로운 기상청의 기상 전문을 읽도록 하면 학습한 결과를 바탕으로 하여 새로운 기상 뉴스 원고를 자동 생성 할 수 있었다. 또한 NTT그룹의 인공지능인 코레보(corevo)의 정밀 일본어 해석 기술을 결합하여 보다 자연스러운 일본어의 생성을 실현했다.

자동 생성 된 기상 뉴스 원고는 일본어 '문법과 의미'의 정확성을 평가했으며, 그 결과 일본어 문법의 정확성은 4점 만점에 3.86 점(NTT 데이터 자체 평가 기준)에서 사람이 읽어도 위화감이 없는 수준에 도달하였다.

의미의 정확성은 4점 만점에 3.07점(NTT 데이터 자체 평가 기준)에 달했다. NTT는 이 결과를 토대로 의미의 정확성을 향상시켜 주며, 기상 분야의 상용화를 목표 로하고, 다른 분야 배포를 위한 새로운 실증 실험을 진행한다고 밝혔다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지