이번 연합학습 구현과 애플리케이션 능력으로 국내 MLOps 분야의 리더십을 강화하고 감성지능(Emotional Intelligence)에 이은 책임감 있는 인공지능(Responsible AI) 생태계를 선도해 나갈 수 있을 것...

연합학습(Federated Learning, 통합학습)은 개발자와 조직이 여러 위치에 분산된 훈련 데이터를 사용하여 심층신경망(DNN, Deep Neural Networks)을 훈련시킬 수 있는 새로운 학습 패러다임이다. 이를 통해 데이터를 직접 공유할 필요없이 공유 모델에 대해 협업할 수 있다.

이는 개인 정보 보호 문제를 해결하고, 프라이버시 컴퓨팅, 머신 학습, 유전자 시퀀싱, 금융 비즈니스, 의료, 비디오 처리 및 네트워크 보안과 같은 컴퓨팅 집약적인 애플리케이션을 가속화하고 이는 상대적으로 적은 데이터로 최적화한 AI 모델을 개발할 수 있다. 

연합학습은 현재의 데이터 중심 시스템과 비교할 때 제안된 접근 방식은 기관 데이터를 공유하지 않고도 비슷한 세그멘테이션(segmentation) 성능을 달성할 수 있었으며, 희소 벡터 기술(the sparse vector technique)을 사용하는 연합학습 시스템은 상당히 적은 비용으로 심층 모델의 정확성, 견고성 및 일반화 능력을 더욱 향상시킬 수 있는 것이다.

이처럼 인공지능을 학습시키는 기존 방식과 달리, 사용자가 직접 사용하는 데이터를 처리하고 모델을 강화해, 이 모델을 한 곳에 모아 더 정교한 모델을 만들어 다시 배포하는 방식인 연합학습은 전 세계적으로 뜨거운 관심과 주목을 받고 있다.

여기에, 국내 대표 감성 인공지능(AI) 전문 플랫폼 아크릴(대표 박외진)이 멀티 GPU를 기반으로 한 통합 인공지능 개발 플랫폼 조나단 플라이트베이스(Jonathan Flightbase)의 연합학습 기능을 개발 완료했다.

아크릴이 개발한 연합학습 기법은 분산된 각 기관에서 독립적으로 학습된 인공지능 학습 결과들을 최적의 비율로 합성한다. 이 과정에서 자사의 조나단 플라이트베이스의 독자적인 ‘최적 파라미터 검색(OHPS, Optimal Hyper-Parameter Search)’ 기술을 적용하여 최고 성능의 인공지능 모델이 자동적으로 합성될 수 있도록 하였다. 

‘조나단 플라이트베이스의 ‘연합 학습’ 기능 화면
‘조나단 플라이트베이스의 ‘연합 학습’ 기능 화면

고유한 데이터를 보유한 다수의 기관에서 공통적으로 사용될 하나의 인공지능 개발 시, 중앙의 개발 서버로 각 기관들의 데이터를 이동하여 통합하는 과정이 수행된다. 

그러나, 연합학습 기능을 활용하는 경우, 각 기관에서 보유한 데이터를 각자 학습한 뒤, 학습된 인공지능의 정보만을 중앙 서버로 전송하게 된다. 중앙 서버로 전송된 각 기관의 인공지능 정보는 하나의 고성능 인공지능으로 합성되는데, 이 기술은 민감한 원천 데이터의 반출이 불가능하거나 반출 조건이 까다로운 의료 분야, 금융 분야 등에서 인공지능 기술 도입 시에 적극적으로 활용될 수 있을 것으로 보인다. 민감한 개인정보를 포함하는 의료 데이터를 다른 병원과 공유하는 것은 현실적으로 쉽지 않은 일이기 때문이다

이처럼 다수의 의료기관이 협력하여 인공지능을 개발하는 경우, 보건 의료 데이터들을 비식별화 처리하여 중앙으로 전송하는 현재의 개발 방법은, 금번 아크릴에서 발표한 연합학습 기능이 포함된 인공지능 플랫폼의 활용을 통하여 획기적인 진보가 이루어질 것으로 기대된다.

아크릴의 ‘조나단 플라이트베이스 - 연합학습' 솔루션 진행 과정을 살펴보면, 다수의 기관이 공통의 인공지능을 데이터 공유 없이 구축할 수 있는 환경을 제공하는 것을 골자로 한다.

연합 학습 솔루션 진행 과정
연합 학습 솔루션 진행 과정

먼저, ▷준비된 데이터로 각 기관 내부에서 인공지능 학습을 진행하며 ▷기관내 데이터로 학습한 인공지능만을 중앙으로 전송하며, 데이터는 각 기관  내부에 유지한다. ▷각 기관에서 수집된 인공지능들을 합성하여 하나의 통합 인공지능을 생성한 후 각 기관에 통합 인공지능을 전송한다. 마지막으로 ▷새로운 데이터가 준비되면 첫번째 단계부터 다시 모든 과정을 반복하며, 추가적인 학습을 주기적으로 진행하여 고성능 인공지능을 구현 배포한다.

특히, 아크릴의 연합학습 기능은 위 모든 과정을 자동화하여 진행한다. 학습한 데이터의 통계적인 정보를 제공하여 각 기관 간 데이터의 패턴이 상이한 현상에 대해 대응할 수 있다. 또한, 각 기관 내 서버와 중앙 서버의 연합 학습 진행 상태를 한눈에 파악할 수 있도록 시각화된 대시보드도 제공한다. 

아크릴 박외진 대표는 “연합학습은 의료 분야의 DT(Digital Transformation) 과정에서 직면하게 될 데이터와 관련된 많은 장벽들을 넘기 위한 현시대 가장 슬기로운 기술적 방법이다.” 라며 “아크릴의 연합학습 기술은 이러한 장벽들을 넘게 하여, 진정한 의료 디지털 혁신의 발판을 제공할 수 있을 것.”이라고 강조하였다. 

한편, 아크릴은 멀티 GPU 기반의 MLOps인 ‘조나단 플라이트베이스’로 GS인증 1등급을 취득해 개발 역량을 공인 받은 바 있다. 특히, 이번 연합학습 구현과 애플리케이션 능력으로 국내 MLOps 분야의 리더십을 강화하고 감성지능(Emotional Intelligence)에 이은 책임감 있는 인공지능(Responsible AI) 생태계를 선도해 나갈 수 있을 것으로 보인다.   

아크릴의 연합학습 기술은 지난 5월 관련 특허 출원을 완료했으며, 해당 솔루션의 시연영상은 아크릴 공식 YouTube에서도 확인할 수 있다. 

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지