희귀한 병리를 확인하는 것은 감독된 학습 환경에서 AI시스템을 훈련시키는 데 사용할 수 있는 이미지가 부족하기 때문에 임상의나 연구자에게는 지속적으로 대두되는 도전 과제...

희귀 질환을 진단하기 위한 머신러닝을 학습시키기 위해, 다시 머신러닝을 사용해 학습시킬 데이터를 만든 것이다

사진에서 각 사분면의 왼쪽에는 환자의 가슴과 그 옆에 있는 실제 X 선 이미지, DCGAN에 의해  합성된 X 선이 있다.(사진: MIMLab)
사진에서 각 사분면의 왼쪽에는 환자의 가슴과 그 옆에 있는 실제 X 선 이미지, DCGAN에 의해 합성된 X 선 이미지(사진: MIMLab)

인공지능(AI)은 의료 진단의 속도와 정확성을 향상시킬 수 있는 실질적인 잠재력을 가지고 있다. 그러나 임상의가 인공지능의 힘을 이용하여 엑스레이와 같은 이미지의 상태를 식별할 수 있기 전에 알고리즘을 개발하고 학습시켜야 한다. 하지만 희귀한 병리를 확인하는 것은 감독된 학습 환경에서 AI시스템을 훈련시키는 데 사용할 수 있는 이미지가 부족하기 때문에 임상의나 연구자에게는 지속적으로 대두되는 도전 과제이다.

이런 가운데 머신러닝을 사용하여 인공지능을 학습시키기 위한 데이터 세트를 보강하기 위해, 특정 희귀 조건을 반영한 시뮬레이션 된 X- 레이를 컴퓨터로 작성해 실제 X- 레이와 결합하고 이를 다른 X- 레이에서 신경 네트워크를 훈련 할 수 있는 충분한 데이터베이스를 확보할 수 있는 기술이 개발된 것이다. 즉, 희귀 질환을 진단하기 위한 데이터 확보와 머신러닝을 학습시키기 위해, 다시 머신러닝을 사용해 학습시킬 데이터를 만드는 것이다.

전혀 새로운 혁신적인 접근 방식이다. 이 기술은 토론토 대학(University of Toronto) 전기 및 컴퓨터 공학과 샤로크 발레(Shahrokh Valaee) 교수팀이 개발, 6일(현지시각) 발표했으며, 이 인공적인 X 선 데이터 이미지를 만들기 위해 팀은 시뮬레이션 된 이미지를 생성하고 지속적으로 개선하기 위해 '딥 콘볼루션 생성 적대적 네트워크(DCGAN, deep convolutional generative adversarial network)'를 사용했다.

이는 이미지를 생성하는 네트워크와 실제 이미지와 합성 이미지를 구별하는 두 가지 네트워크로 구성된 알고리즘 유형으로 두 네트워크는 판별자가 실제, 이미지를 합성 이미지와 구별할 수 없도록 훈련되었으며, 충분한 수의 인공 X- 레이가 생성되면 실제 X- 레이와 결합되면서 딥 컨볼루션(convolutional) 신경 네트워크를 학습한 다음 이미지를 정상으로 분류하거나 여러 조건으로 임의 식별하는 것이다.

결론적으로 이번 개발된 인공지능 기술은 딥 콘볼루션 GAN(Generative Adversarial Network) 에 의해 ​​생성된 인위적인 데이터를 사용하여 실제 데이터 집합을 보완할 수 있음을 보여준 것으로 이는 AI가 학습을 위한 더 많은 양의 데이터를 제공하고 특히, 희소한 상황을 식별할 때 이상적으로 적용될 것으로 기대된다. 또한 최근 AI 진단 의료에서 국내외적으로 이슈가 되고 있는 '개인 정보 보호'에 대한 우려 없이 합성된 X 선은 실제 개인의 정보가 아니기 때문에 병원 또는 연구자가 데이터 세트를 쉽고 자유롭게 이용할 수 있다는 것이 관련 업계와 연구 또는 개발자들에게 희소식이 될 것으로 보인다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지