김경중 교수 (윗줄 왼쪽)와 연구팀
김경중 교수 (윗줄 왼쪽)와 연구팀

인공지능(AI)의 영향력과 중요성에 대해서 누구나 잘 알고 있지만 일반인 입장에서는 여전히 선뜻 다가가기 어려운 분야이다.

그중에서도 ‘강화학습(RL)’은 연구자들도 그 핵심 개념을 이해하기 위해 많은 자료를 검토하고 전문적인 강좌를 수강해야 할 만큼 어려운 기술이다. 이런 가운데 게임을 통해서 AI 기술을 쉽게 배울 수 있는 ‘몰입형 논문’이 공개돼 눈길을 끈다.

광주과학기술원(GIST, 총장 임기철)은 융합기술학제학부 김경중 교수 연구팀이 AI 분야의 핵심 기술인 강화학습을 보다 쉽게 설명하는 새로운 형태의 몰입형 논문 '강화학습의 몬테카를로 및 시간차 방법(Monte Carlo and Temporal Difference Methods in Reinforcement Learning-보기)'을 게재했다.

이는 글로벌 최고 권위의 'IEEE 컴퓨팅 인텔리전스 매거진(IEEE Computational Intelligence Magazine. 이하, IEEE CIM)'이 ‘인공지능을 설명하다(AI eXplained)’를 주제로 AI 기술을 쉽게 설명하는 몰입형 논문(Immersive Article)을 공모해 김경중 교수 연구팀의 논문을 포함한 총 3편의 논문을 선정, 2023년 11월호 표지 논문으로 게재됐다.

IEEE CIM 11월호 표지
IEEE CIM 11월호 표지

몰입형 논문은 2022년 11월 ‘IEEE CIM’을 통해 처음 등장했으며 전통적인 논문과 달리 상호작용이 가능한 콘텐츠를 포함할 수 있으며, 독자들이 웹브라우저를 통해 직접 실험해 보고 체험해 볼 수 있다.

기존 논문과 차별화된 내용 전달 방법으로 연구자들 사이에서도 매우 실험적인 시도로 받아들여지고 있으며, 큰 관심을 받고 있다. 현재까지 연구팀의 논문을 포함해 총 6편의 몰입형 논문(Immersive Article)이 게재됐다.

최근 IEEE Transactions on Games에서도 몰입형 논문을 시도하려는 움직임이 있어 앞으로 더 많은 사례를 경험할 수 있을 것으로 기대된다.

강화학습은 게임의 결과를 통해 배워 가는데 게임의 결과(승/패 또는 최종 점수)가 확실해질 때까지 기다린 후에 학습을 진행하는 ‘몬테 카를로(Monte Carlo)’ 방법이 대표적이다.

최근에는 게임의 결과가 확정되지 않았더라도, 결과를 예측하여 학습하는 ‘시간차 학습(Temporal Difference Learning)’이 크게 유행하고 있다.

강화학습을 쉽게 설명하기 위해 사용한 상어 게임: 상어를 조정하여 폭탄, 덫 등의 여러 장애물을 피해 보물 상자에 도달하는 게임이다. 높은 점수를 받기 위해서 상어는 장애물을 피하고, 최단 거리로 보물에 도착해야 한다.
강화학습을 쉽게 설명하기 위해 사용한 상어 게임: 상어를 조정하여 폭탄, 덫 등의 여러 장애물을 피해 보물 상자에 도달하는 게임이다. 높은 점수를 받기 위해서 상어는 장애물을 피하고, 최단 거리로 보물에 도착해야 한다.

김경중 교수 연구팀은 AI 분야에서 이해하기 어려운 주제 중 하나인 강화학습을 쉽게 접할 수 있도록 다양한 상호작용 콘텐츠를 개발했다. 연구팀은 강화학습을 쉽게 설명하기 위해 상어를 주인공으로 하는 간단한 게임을 만들고, 독자들이 게임을 조작하면서 강화학습의 개념을 이해할 수 있도록 설계했다.

인공지능이 경험하면서 배우고 있는 내용을 숫자와 색으로 보여줌
인공지능이 경험하면서 배우고 있는 내용을 숫자와 색으로 보여줌

강화학습에 대한 이해를 돕기 위해 총 18개의 상호작용이 가능한 콘텐츠를 제공하고 있으며, 독자들은 간단한 강화학습 실험을 웹브라우저를 통해 수행해 볼 수 있고, 결과도 확인해 볼 수 있다.

또한 연구팀은 웹에서 돌아가는 다양한 프로그램을 개발과 실험 결과를 실시간으로 보여주기 위해 2차원 그래프와 3차원 그래프를 그리는 도구도 개발했다.

웹브라우저에서 실험 결과를 2차원 실시간 그래프로 보여줌
웹브라우저에서 실험 결과를 2차원 실시간 그래프로 보여줌

김경중 교수는 “연구 결과를 효과적으로 전달하기 위해 여러 가지 방법들이 있겠지만 무엇보다 직접 경험해보는 것이 가장 좋다고 생각한다”면서 “몰입형 논문을 통해 일반인들이 과학과 공학을 어렵지 않게 이해하는 새로운 길이 열렸으면 좋겠다”고 밝혔다.

한편, 이번 연구는 GIST 융합기술학제학부 김경중 교수가 지도하고 한이삭 박사과정생, 오승원 박사과정생, 정호윤 석사과정생, 정인식 석사과정생이 수행했다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지