100만 개 이상의 AI학습 이미지를 뼈(BONE), 가슴, 뇌, 목, 손··발말단(EXTREMITY) 등 9개의 카테고리로 분류하고 '스탠퍼드 AIMI 공유 데이터 세트' 공유 플랫폼을 통해...

AIMI의 공동 책임자이자 스탠포드 방사선과 매튜 렁렌 교수 모습(사진:AIMI)
AIMI의 공동 책임자이자 스탠포드 방사선과 매튜 렁렌 교수 모습(사진:AIMI)

인공지능(AI)은 의료 영상 데이터에서 의미를 추출하고 환자 치료를 개선하는 도구를 개발할 수 있는 전례 없는 기회를 제공하고 있다. 이제, 많은 AI 의료 솔루션들이 인간 의사의 정확성에 필적하고 있다.

AI는 유방조영술과 뇌 스캔에서 종양을 감지하는 것에서부터 심장 박동의 초음파 영상을 분석하는 것에 이르기까지 의료 영상을 해석하는 데 점점 더 보편적인 도구로 작용하고 있으며, 단순히 종양이나 뼈가 골절될 가능성을 발견하는 것을 넘어, 일부 시스템은 환자의 병의 경과를 예측하고 권고한다.

그러나, 의료에서의 AI 도구는 인간 전문가들에 의해 꼼꼼하게 주석을 달고 있는 값비싼 이미지 데이터 세트에 대해 학습되어야 한다. 이러한 데이터 세트를 획득하거나 만드는 데 수십에서 수백만 달러가 들 수 있기 때문에, 대부분의 연구는 기관과 데이터를 공유하지 않는 대기업들의 자금 지원을 받고 있다.

여기에, 의료 분야의 인공지능(AI) 애플리케이션 개발에 박차를 가하기 위해 스탠퍼드대학교(Stanford University)의 '인공지능의학&이미지센터(Artificial Intelligence in Medicine and Imaging. 이하, AIMI)'는 전 세계 연구진과 개발자들을 위해 무료 데이터세트 저장소(포털)를 확장하고 오픈소스로 2일(현지시간) 공개했다.

의료AI 학습 데이터세트 공유 플랫폼 홈페이지 캡처
의료AI 학습 데이터세트 공유 플랫폼 홈페이지 캡처

AIMI는 마이크로소프트의 AI for Health 프로그램과 협력하여 보다 자동화되고 접근 용이하며, 가시적인 새로운 플랫폼을 출시한 것이며, 이를 통해 전 세계 기관들의 수많은 추가 이미지들을 호스팅하고 구성할 수 있다. 또, 이 아이디어의 일부는 열린 글로벌 저장소를 구축하는 것이라고 밝혔다.

AIMI의 공동 책임자이자 스탠포드의 방사선과 매튜 렁렌(Matthew Lungren) 교수는 "외과 의사든 산부인과 의사든 이 기술의 핵심은 데이터라고 말한다"라며, "우리는 의료 데이터가 공공의 이익이며, 전 세계 연구원 또는 개발자에게 개방되어야 한다는 생각을 두 배로 늘리고 싶습니다"라고 말했다.

로고 이미지
로고 이미지

2년 전에 설립된 AIMI는 이미 100만 개 이상의 이미지에 대한 주석이 달린 데이터 세트를 획득했으며 그 중 대부분은 스탠포드대학 의료센터에서 가져왔다. 전 세계 연구진은 이러한 데이터 세트를 무료로 다운로드하여 특정 종류의 AI 모델을 학습하는 데 사용할 수 있다.

또한, 이 플랫폼은 연구를 공유할 수 있는 거점(허브)을 제공하여 다양한 모델을 보다 쉽게 다듬고 인구 집단 간의 차이를 식별할 수 있도록 한다. 또, 이 플랫폼은 클라우드 기반으로 제공할 수 있기 때문에 연구자들은 특정지역 자원 집중적인 임상 머신러닝 인프라를 구축하는 데 대해 걱정할 필요가 없다.

특히, AIMI는 단순히 이미지 분석을 위한 것이 아니라 AI 의료 연구를 위한 생태계 전체를 조성하겠다는 구상이다. 올바른 데이터세트를 통해 연구자들은 픽셀 데이터뿐만 아니라 관련된 다른 멀티모달 데이터를 포함한 중요한 임상 사용 사례도 탐색할 수 있다.

AIMI는 현재, 100만 개 이상의 이미지를 담은 9개의 데이터 세트를 보유하고 있다. 매튜 렁렌은 "내년 안에 이 데이터세트는 두 배로 증가할 것으로 예상하고 있다"며, "이 플랫폼은 세계에서 가장 많은 인공지능 학습 의료 데이터 세트를 공유하게 될 것"이라고 강조했다.

AIMI 공동 책임자이자 스탠포드 방사선과 매튜 렁렌(Matthew Lungren) 교수
AIMI 공동 책임자이자 스탠포드 방사선과 매튜 렁렌(Matthew Lungren) 교수

또한 렁렌은 향후, "이 플랫폼은 표준화된 머신러닝 도구와 오픈 소스 데이터와 공통 아키텍처를 활용하는 사전 훈련된 모델도 제공할 것"이라고 덧붙였다.

AIMI의 이러한 다양한 인구 그룹에서의 데이터 세트를 무료로 제공함으로써 연구자들은 데이터나 알고리즘에서 숨겨진 편견을 쉽게 발견할 수 있다. 일부 AI 모델은 특정 집단에서만 다른 집단에서 보다 더 정확하다.

이는 주로 한 지역에서 환자 데이터를 학습했기 때문이다. 다양한 커뮤니티의 데이터세트을 보유하면 연구자들이 이러한 문제를 더 쉽게 감지할 수 있는 것이다.

마지막으로 매튜 렁텐 AIMI 공동책임자는 “기업이 이 모든 작업을 수행하는 것은 환영하지만 정보를 공유할 수 있는 기회가 차단된다는 사실은 좋아하지 않습니다"라며, "만약 그들이 데이터를 축적하고 그것을 잠그면 혁신할 수 있는 유일한 사람이 될 것입니다. 그것은 전 세계 컴퓨터 과학자와 임상의의 중요한 기여를 차단할 것입니다. 그것은 우리가 원하는 바가 아닙니다”라고 강조했다.

한편, 스탠퍼드 인공지능의학&이미지센터가 오픈소스로 공개한 데이터세트는 현재, 100만 개 이상의 이미지를 뼈(BONE), 가슴, 뇌, 목, 손··발말단(EXTREMITY) 등 9개의 카테고리로 분류하고 '스탠퍼드 AIMI 공유 데이터 세트(Stanford AIMI Shared Datasets)' 공유 플랫폼(다운)을 통해 누구나 검색하고 사용할 수 있다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지