딥러닝의 의사결정을 설명하고 해석하는 기술, 딥러닝의 예측에 대한 신뢰성 높여, 다양한 딥러닝 모델에 설명성을 제공해 딥러닝 활용 분야의 확장에 기여할 것으로 기대

최재식 대표는 “글로벌 IT기업들의 인공지능 분야에서 활약이 두드러지고 있습니다. 인이지 역시, XAI 분야 알고리즘(엔진)과 다양한 래퍼런스를 보유하고 있으며, 이번 연구 성과로 인이지 기술이 다시한번 세계적 수준임을 보여주는 결과입니다”라며, “이는 기업‧학계는 물론이고 정부의 인공지능 원천 기술 개발에 지속적인 관심과 투자가 있었기에 가능하였으며, 앞으로도 선도적인 기술 개발 및 상용화를 위해 노력하겠습니다”라고 말했다.
최재식 대표는 “글로벌 IT기업들의 인공지능 분야에서 활약이 두드러지고 있습니다. 인이지 역시, XAI 분야 알고리즘(엔진)과 다양한 래퍼런스를 보유하고 있으며, 이번 연구 성과로 인이지 기술이 다시한번 세계적 수준임을 보여주는 결과입니다”라며, “이는 기업‧학계는 물론이고 정부의 인공지능 원천 기술 개발에 지속적인 관심과 투자가 있었기에 가능하였으며, 앞으로도 선도적인 기술 개발 및 상용화를 위해 노력하겠습니다”라고 말했다.

최근 딥러닝 모델은 문서 자동 번역이나 자율 주행 등 실생활에 널리 보급되고 활용되는 추세 및 발전에도 불구하고 비선형적이고 복잡한 모델의 구조와 고차원의 입력 데이터로 인해 정확한 모델 예측의 근거를 제시하기 어렵다.

이처럼 부족한 설명성은 딥러닝이 국방, 의료, 금융과 같이 의사결정에 대한 근거가 필요한 중요한 작업에 대한 적용을 어렵게 한다. 따라서 적용 분야의 확장을 위해 딥러닝의 부족한 설명성은 반드시 해결해야 할 문제다.

'설명가능한 인공지능(eXplainable AI. 이하, XAI)'으로 제조현장에서 공정 최적화 및 안정적인 프로세스 자동화를 그리고 기업이 핵심 비즈니스에 집중할 수 있도록 도와주는 국내 대표 XAI 스타트업이자 KAIST 교수 창업기업 '인이지(대표 최재식)'의 AI 블랙박스를 해결해 나가는 놀라운 행보가 이어지고 있다.

이미지:본지
이미지:본지

現 KAIST 김재철AI대학원(원장 정송) 설명가능 인공지능 연구센터 센터장으로 재임하고 있는 최재식 교수 연구팀이 인공지능 딥러닝의 의사결정에 큰 영향을 미치는 입력 변수의 기여도를 계산하는 세계 최고 수준의 기술을 개발했다.

최 연구팀은 딥러닝 모델이 국소적인 입력 공간에서 보이는 입력 데이터와 예측 사이의 관계를 기반으로, 입력 데이터의 특징 중 모델 예측의 기여도가 높은 특징만을 점진적으로 추출해나가는 알고리즘과 그 과정에서의 입력과 예측 사이의 관계를 종합하는 방법을 고안해 모델의 예측 과정에 기여하는 입력 특징의 정확한 기여도를 계산했다.

해당 기술은 모델 구조에 대한 의존성이 없어 다양한 기존 학습 모델에서도 적용이 가능하며, 딥러닝 예측 모델의 판단 근거를 제공함으로써 신뢰도를 높여 딥러닝 모델의 활용성에도 크게 기여할 것으로 기대된다.

증류 절차를 통한 기여도 계산 알고리즘의 모식도:(a) 증류 절차의 각 단계는 국소적 기여도를 계산하고, 이를 이용해 특성 증류를 위한 마스크를 계산한다. (b) 증류 절차가 진행됨에 따라, 딥러닝 모델의 입력공간에서 순차적으로 데이터가 결정된다. (c) 증류 절차를 통해 수집된 데이터의 국소적 기여도를 결합하여 포괄적 기여도를 계산한다.
증류 절차를 통한 기여도 계산 알고리즘의 모식도:(a) 증류 절차의 각 단계는 국소적 기여도를 계산하고, 이를 이용해 특성 증류를 위한 마스크를 계산한다. (b) 증류 절차가 진행됨에 따라, 딥러닝 모델의 입력공간에서 순차적으로 데이터가 결정된다. (c) 증류 절차를 통해 수집된 데이터의 국소적 기여도를 결합하여 포괄적 기여도를 계산한다.

모델의 예측에 대한 입력 특징의 기여도를 계산하는 문제는 해석이 불가능한 딥러닝 모델의 작동 방식을 설명하는 직관적인 방법 중 하나다. 특히, 이미지 데이터를 다루는 문제에서는 모델의 예측 과정에 많이 기여한 부분을 강조하는 방식으로 시각화해 설명을 제공한다.

딥러닝 예측 모델의 입력 기여도를 정확하게 계산하기 위해서 모델의 경사도를 이용하거나, 입력 섭동(행동을 다스림)을 이용하는 등의 연구가 활발히 진행되고 있다. 그러나 경사도를 이용한 방식의 경우 결과물에 잡음이 많아 신뢰성을 확보하기 어렵고, 입력 섭동을 이용하는 경우 모든 경우의 섭동을 시도해야 하지만 너무 많은 연산을 요구하기 때문에, 근사치를 추정한 결과만을 얻을 수 있다.

연구팀은 이러한 문제 해결을 위해 입력 데이터의 특징 중에서 모델의 예측과 연관성이 적은 특징을 점진적으로 제거해나가는 증류 알고리즘을 개발했다.

증류 알고리즘은 딥러닝 모델이 국소적으로 보이는 입력 데이터와 예측 사이의 관계에 기반해 상대적으로 예측에 기여도가 적은 특징을 선별 및 제거하며, 이러한 과정의 반복을 통해 증류된 입력 데이터에는 기여도가 높은 특징만 남게 된다.

또한, 해당 과정을 통해 얻게 되는 변형된 데이터에 대한 국소적 입력 기여도를 종합해 신뢰도 높은 최종 입력 기여도를 산출한다.

연구팀의 이러한 입력 기여도 측정 기술은 산업공정 최적화 프로젝트에 적용해 딥러닝 모델이 예측 결과를 도출하기 위해서 어떤 입력 특징에 주목하는지 찾을 수 있었다. 또한 딥러닝 모델의 구조에 상관없이 적용할 수 있는 이 기술을 바탕으로 복잡한 공정 내부의 다양한 예측변수 간 상관관계를 정확하게 분석하고 예측함으로써 공정 최적화(에너지 절감, 품질향상, 생산량 증가)의 효과를 도출할 수 있었다.

이미지 분류 문제인 이미지넷(ImageNet) 데이터에 대해 학습된 VGG-16 모델의 입력 기여도를 측정 및 시각화한 비교
이미지 분류 문제인 이미지넷(ImageNet) 데이터에 대해 학습된 VGG-16 모델의 입력 기여도를 측정 및 시각화한 비교

연구팀은 잘 알려진 이미지 분류 모델인 VGG-16, ResNet-18, Inception-v3 모델에서 개발 기술이 입력 기여도를 계산하는 데에 효과가 있음을 확인했다. 해당 기술은 구글(Google)이 보유하고 텐서플로우 XAI 툴 키트에 적용된 것으로 알려진 입력 기여도 측정 기술(Guided Integrated Gradient) 대비 LeRF/MoRF 점수가 각각 최대 0.436/0.020 개선됨을 보였다.

특히, 입력 기여도의 시각화를 비교했을 때, 기존 방식 대비 잡음이 적고, 주요 객체와 잘 정렬됐으며, 선명한 결과를 보였다. 연구팀은 여러 가지 모델 구조에 대해 신뢰도 높은 입력 기여도 계산 성능을 보임으로써, 개발 기술의 유효성과 확장성을 보였다.

연구팀이 개발한 딥러닝 모델의 입력 기여도 측정 기술은 이미지 외에도 다양한 예측 모델에 적용돼 모델의 예측에 대한 신뢰성을 높일 것으로 기대된다.

왼쪽부터 인이지 전기영 연구원, KAIST 김재철AI대학원의 정해동 연구원.(사진:KAIST)
왼쪽부터 인이지 전기영 연구원, KAIST 김재철AI대학원의 정해동 연구원.(사진:KAIST)

전기영 연구원은 "딥러닝 모델의 국소 지역에서 계산된 입력 기여도를 기반으로 상대적인 중요도가 낮은 입력을 점진적으로 제거하며, 이러한 과정에서 축적된 입력 기여도를 종합해 더욱 정확한 설명을 제공할 수 있음을 보였다ˮ라며 "딥러닝 모델에 대해 신뢰도 높은 설명을 제공하기 위해서는 입력 데이터를 적절히 변형한 상황에서도 모델 예측과 관련도가 높은 입력 특성에 주목해야 한다ˮ라고 말했다.

인이지 최재식 대표는 “글로벌 IT기업들의 인공지능 분야에서 활약이 두드러지고 있습니다"라며, "인이지 역시, XAI 분야 알고리즘(엔진)과 다양한 래퍼런스를 보유하고 있으며, 이번 연구 성과로 인이지 기술이 다시한번 세계적 수준임을 보여주는 결과입니다”라고 말했다.

이어 “이는 기업‧학계는 물론이고 정부의 인공지능 원천 기술 개발에 지속적인 관심과 투자가 있었기에 가능하였으며, 앞으로도 선도적인 기술 개발 및 상용화를 위해 노력하겠습니다”라고 덧붙였다.

한편, 인이지의 전기영·김재철AI대학원의 정해동 연구원이 공동 제1 저자로 참여한 이번 연구는 오는 28일부터 12월 9일까지 미국 루이지애나 뉴올리언스에서 개최되는 2022신경정보처리시스템학회(Conference on Neural Information Processing Systems, NeurIPS 2022)에서 ‘증류된 그라데이션  병합: 심층 신경망에서 입력 속성을 위한 기능 정제(Distilled Gradient Aggregation: Purify Features for Input Attribution in the Deep Neural Network,-아래 참조)'란 제목으로 발표를 앞두고 있다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지