KAIST 이상완 교수 연구팀, ‘강화학습 기반 실험 디자인’ 기술 이용
신경과학과 AI 융합 통해 불확실성, 복잡도 높은 상황의 뇌 정보처리 과정 규명

인간의 문제해결 능력을 인공지능에 이식한다(사진:본지)

인공지능(AI) 알고리즘이 최근 다양한 분야에서 인간의 작업 수행 능력을 넘어서고 있다. 하지만 아직 인간을 대체할 완벽한 해결방법은 제시하지 못하고 있다.

불확실성과 복잡도가 변화하는 상황에서 달성 가능한 목표를 설정하고 계획을 세우고 실행에 옮겨 전략을 수정해 나가는 일련의 과정은 인간이 가진 고유한 문제 해결 능력 중 하나이다.

이에 국내 연구진이 신경과학-인공지능 융합연구를 통해 인간의 문제 해결 과정을 이론적, 신경과학적으로 규명해 인간 지능의 핵심 요소들을 AI 알고리즘으로 이식할 수 있는 가능성이 크게 높아졌다. 또 이 기술이 완성되면 궁극적으로는 지능을 공학적으로 분해하고 과학적으로 이해할 수 있을 것이란 기대까지 나오고 있다.

KAIST(총장 신성철) 바이오및뇌공학과 이상완 교수 연구팀은 신경과학과 AI의 융합연구를 통해 인간의 문제해결 과정에서 뇌가 정보를 처리하는 원리를 규명하는 데 성공했다.

이상완 교수(왼쪽)와 연구진(사진:KAIST)
이상완 교수(왼쪽)와 연구진(사진:KAIST)

연구팀의 인간의 문제 해결 과정은 목표설정-전략수립-실행-전략수정을 반복하는 형태이다. 이는 상태 의존적인 복잡한 시간의 함수이다. 일반적으로 인간의 문제 해결 과정은 많은 양의 데이터를 모으기 어렵고 불확실성과 복잡도가 높아 빅데이터 기반의 전통적 딥러닝 설계 방식으로는 구현이 어렵다.

연구팀은 이같은 문제 해결을 위해 ‘강화학습 이론 기반 실험 디자인’이라는 기술을 이용해 문제 해결 목표, 문제의 복잡도, 상황 변화의 불확실성이라는 세 가지 변수를 동시에 변화시켜 실제 인간의 문제 해결 과정과 유사한 상황을 구현했다.

‘강화학습 이론 기반 실험 디자인’이란 기술은 인간의 일반적 문제해결과정은 마르코프 의사결정 과정이라 불리는 수학적 틀로 변환할 수 있으며, 이 틀을 이용하면 복잡한 가설도 한 두 개의 변수로 요약될 수 있다. 결과적으로 뇌과학 실험자가 통제하기 어려운 수준의 매우 복잡한 실험 디자인을 할 수 있는 것이다.

이를 이용해 취득한 행동과 뇌 영상 데이터를 바탕으로 문제 해결 과정을 설명할 수 있는 수학적 모델을 찾기 위해 100가지가 넘는 종류의 메타 강화학습 알고리즘을 학습하고 비교 분석했다. 이 과정은 모델 기반 뇌 이미징 분석이라 불리는 기법이다.

문제의 불확실성(uncertainty)과 복잡도(complexity)가 동시에 변화하는 상황에서 달성 가능한 목표를 설정하고 계획을 세우고 실행에 옮겨 전략을 수정해 나가는 일련의 과정을 설명하는 메타 강화학습 모델(좌)과 각 단계의 정보처리 과정에 관여하는 뇌 영역(우). (사진:논문캡처)
문제의 불확실성(uncertainty)과 복잡도(complexity)가 동시에 변화하는 상황에서 달성 가능한 목표를 설정하고 계획을 세우고 실행에 옮겨 전략을 수정해 나가는 일련의 과정을 설명하는 메타 강화학습 모델(좌)과 각 단계의 정보처리 과정에 관여하는 뇌(우) 영역 (사진:논문캡처)

연구팀은 더 엄밀한 검증을 위해 ‘정밀 행동 프로파일링’이라는 분석 방법을 적용했다. 이 방법은 문제 해결 과정의 최적성을 판단할 수 있는 행동 지표 발굴, 실험 변수와 뇌 모델의 행동 연관성 분석, 파라미터 재현성 등 추가적인 분석을 포함한다. 알고리즘 학습에 이은 정밀 행동 프로파일링 과정은 개념적으로 무한히 반복할 수 있다.

이렇게 알고리즘 학습과 정밀 프로파일링 검증 과정을 반복하게 되면 겉으로 보이는 행동이 인간과 유사할 뿐만 아니라, 실제로 인간과 같은 원리로 문제를 해결하는 모델을 도출할 수 있게 된다.

그 결과로 문제의 불확실성 및 복잡도와 변화하는 상황에서 인간의 학습과 추론 과정을 모사하는 메타 강화학습 모델을 구현했고, 이 모델의 정보처리 과정이 전두엽의 한 부위인 복외측전전두피질의 신경 활성 패턴으로 설명된다는 것을 발견했다.

제 1저자인 김동재 박사과정은 “다양한 가설을 엄밀히 검증하는 과정에 많은 시간이 소요됐지만 정밀 행동 프로파일링 방법론을 통해 실제 인간의 행동 원리를 재현하는 모델을 찾아냄으로써 추후 인공지능으로의 이식에도 큰 도움이 될 것이다”라고 말했다.

이상완 교수는 “기존 연구방식은 하나의 퍼즐 조각을 떼어서 다른 퍼즐의 빈자리를 메꾸는 것이라면 이번 연구는 퍼즐을 푸는 원리를 배워 다른 퍼즐 맞추기에 적용하는 것에 비유할 수 있다”며, “인간만이 가진 지능의 핵심 요소들을 인공지능 알고리즘으로 이식하는 기술은 이제 첫걸음을 떼었다고 생각한다"고 말했다.

이어 "이 기술이 완성되면 궁극적으로는 지능을 공학적으로 분해하고 과학적으로 이해할 수 있을 것으로 기대한다”고 덧붙였다.

또한 연구팀은 KAIST 신경과학-인공지능 융합연구센터에서 이러한 기반 기술을 활용해 인간 지능을 모사한 차세대 인공지능 모델을 개발하고, 아울러 딥마인드, MIT, IBM AI 연구소, 케임브리지 대학 등 해외 관련 연구 기관과의 국제 공동연구를 통해 기술의 파급력을 높여나갈 계획이라고 말했다.

한편, 이상완 교수와 함께 김동재 박사과정과 박건영 석사과정이 주도하고, 미국 캘리포니아 공과대학(Caltech)과의 국제 공동연구를 통해 진행된 이번 연구는 국제 학술지 ‘네이처 커뮤니케이션즈(Nature Communications)’ 12월 16일 자 온라인판에 게재됐다. 논문명: '모델 기반 학습과 모델 없는 학습 간의 중재에서 작업 복잡도는 상태 공간 불확실성과 상호 작용(Task complexity interacts with state-space uncertainty in the arbitration between model-based and model-free learning- 논문 다운

저작권자 © 인공지능신문 무단전재 및 재배포 금지