사진은 이번 연구의 제1 저자 KAIST 전산학부 신재민 박사과정(사진:KAIST)
사진은 이번 연구의 제1 저자 KAIST 전산학부 신재민 박사과정(사진:KAIST)

인공지능(AI)을 학습하는 기존 방식과 달리, 사용자가 직접 사용하는 데이터를 처리하고 모델을 강화해, 이 모델을 한 곳에 모아 더 정교한 모델을 만들어 다시 배포하는 방식인 연합학습(Federated Learning, 통합학습)이 전 세계적으로 뜨거운 관심과 주목을 받고 있다.

글로벌 연구소 및 IT 기업들도 연구와 개발에 여념이 없다. 먼저 구글이 2019년 8월에 발표한 연합학습은 일반적으로 모든 데이터를 서버로 모아, AI를 학습하는 방식과 달리, 사용자가 직접 사용하는 스마트폰에서 데이터를 처리하고 모델을 강화하고 이 모델을 한 곳에 모아 더 정교한 모델을 만들어 다시 배포하는 방식이다.

사진은 구글의 연합학습 개요로 스마트폰은 사용량에 따라 모델을 로컬로 개인화하고(A) 많은 사용자의 업데이트가 집계되어 (B)공유 모델에 대한 합의 변경(C)이 이루어진 후 절차가 반복된다(사진:본지보도캡처)
사진은 구글의 연합학습 개요로 스마트폰은 사용량에 따라 모델을 로컬로 개인화하고(A) 많은 사용자의 업데이트가 집계되어 (B)공유 모델에 대한 합의 변경(C)이 이루어진 후 절차가 반복된다(사진:본지보도캡처)

이는 상대적으로 적은 데이터로 최적화한 AI 모델을 개발할 수 있다. 방대한 데이터를 저장하는 스토리지나 이런 데이터를 처리하기 위한 고성능 프로세서를 사용자 개인 디바이스로 분산했으며, 필요 사항만을 공유해 최적화한 모델을 다시 배포하는 만큼 트래픽에 대한 부담도 적다. 또 개인정보 침해 가능성 역시 상대적으로 적어 제도적 장벽 역시 쉽게 넘을 수 있다.

또한 메타도 안드로이드와 iOS 환경에서 원활하게 머신러닝을 실행하고 배포할 수 있도록 하는 프레임워크 ‘파이토치 모바일(PyTorch Mobile)'도 연합학습(Federated Learning)을 지원해 개인정보 유출 우려를 줄이고 보다 개인에 맞춰 AI를 학습시킬 수 있는 것이 특징이다.

(왼쪽부터) 이성주 교수, 칭화대 윤신 리우 교수, 위안춘 리 교수.
(왼쪽부터) 이성주 교수, 칭화대 윤신 리우 교수, 위안춘 리 교수.

여기에, KAIST(총장 이광형)는 전기및전자공학부 이성주 교수와 신재민 박사과정이 제1 저자, 중국 칭화대학교(Tsinghua University) 위안춘 리(Yuanchun Li) 교수, 윤신 리우(Yunxin Liu) 교수가 참여한 공동연구를 통해 다수의 모바일 기기에서 연합학습 속도를 4.5배 가속할 수 있는 방법론을 개발했다. 

이성주 교수 공동연구팀은 연합학습에 참여하는 사용자 기기 위 데이터 샘플 각각의 학습 기여도 측정을 기반으로 최적의 샘플을 선택함으로써 연합학습 속도 향상을 달성했다.

또한, 샘플 선택으로 줄어든 학습 시간에 대응해, 연합학습 라운드의 데드라인 또한 최적으로 조절하는 기법을 제안해 모델 정확도의 저하 없이 학습 속도를 무려 4.5배 높였다. 이러한 방법론의 적용을 통해 연합학습으로 인한 사용자 스마트폰 과부하 문제를 최소화할 수 있을 것으로 기대된다.

연구 모식도
연구 모식도

이성주 교수는 "연합학습은 많은 세계적 기업들이 사용하는 중요한 기술이다ˮ며 "이번 연구 결과는 연합학습의 학습 속도를 향상하고 활용도를 높여 의미가 있으며, 컴퓨터 비전, 자연어 처리(NLP), 모바일 센서 데이터 등 다양한 응용에서 모두 좋은 성능을 보여, 빠른 파급효과를 기대한다ˮ라고 소감을 밝혔다.

한편, 이번 연구는 지난 6월 27일부터 7월 1일까지 열린 세계컴퓨터연합회(ACM) 제20회 모바일 시스템, 애플리케이션 및 서비스에 관한 국제회의(MobiSys, International Conference on Mobile Systems, Applications, and Services)에서 '이기종 클라이언트에 대한 효율적인 연합 학습을 위한 데이터 및 속도 제어(FedBalancer: Data and Pace Control for Efficient Federated Learning on Heterogeneous Clients-다운)'란 제목으로 발표됐다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지