승인하거나 임상 단계에 있는 인간의 신피질 상피(HRCE)에 있는 SARS-CO-2 영향의 조절을 위한 1,672개 소분자(small molecules)에서 치료 가능성을 연구한 실험에서 도출... 연구원들은 305,520 개의 5 채널 형광 현미경 이미지와 해당 딥러닝 임베딩에 액세스하여 자신의 실험을 분석하거나 적용할 수 있다.

SARS-CoV-2로 처리된 추가 세포 유형 분석 이미지(사진:논문 캡처)
SARS-CoV-2로 처리된 추가 세포 유형 분석 이미지(사진:논문 캡처)

미국 서부 유타주 솔트레이크 시티(SaltLake City)에 본사를 둔 인공지능(AI) 기반 희귀질환 치료 약물 개발에 집중하고 있는 기업 리커전(Recursion Pharma)이  SARS-CoV-2 바이러스에 대한 최초의 형태학적(인간 세포 형태) 이미징 데이터 세트 'RxRx19 데이터 세트'를 24일(현지시간) 오픈 소스로 공개했다.

최근 미국 시장조사기관 'CB 인사이츠(CB Insights)'가 세계 약 5천개 스타트업을 대상으로 2020년 유망 AI 스타트업 Top 100 기업에 선정된 리커전(Recursion)은 신약 연구와 세포 구조를 분석하고, 약물이 세포에 어떻게 작용하는지 파악하는 데에 AI를 활용하고 있다.

이번 RxRx19 데이터 세트의 공개는 코로나19 퇴치를 위해 노력하고 있는 전 세계의 연구자들에게 인간 세포 형태 데이터와 1,600 개 이상의 소분자를 신속하게 제공하는 것으로 데이터 세트는 리커전이 유타주립대학(Utah State University)과 공동으로 유럽 의약품청(European Medicines Agency)이 승인하거나 임상 단계에 있는 인간의 신피질 상피(HRCE)에 있는 SARS-CO-2 영향의 조절을 위한 1,672개 소분자(small molecules)에서 치료 가능성을 연구한 실험에서 도출되었다.

이미지들은 또한 공개적으로 공유되고 있는 뚜렷한 현상 형태의 프로파일을 식별하기 위해 각 이미지의 고차원적인 특징을 생성하기 위해 리커젼의 독자적인 딥 신경망을 이용하여 처리되었다.

RxRx19 데이터 세트 다운로드 페이지 캡처

RxRx19를 통해 과학계의 연구원들은 305,520 개의 5 채널 형광 현미경 이미지와 해당 딥러닝 임베딩에 액세스하여 자신의 실험을 분석하거나 적용할 수 있다.

리커전의 최고 기술 책임자 벤 마비(Ben Mabey)는 "우리는 반복해서 인공지능이 표적에 구애 받지 않는 약물 발견과 결합되어 어떻게 전통적인 접근법을 통해 불분명한 통찰력을 빠르게 발견할 수 있는지를 봐왔습니다"라며, “이번 RxRx19의 공개는 머신러닝 커뮤니티가 전 세계적 유행병과의 싸움에서 가장 가치있는 숨겨진 통찰력을 발견할 수 있는 전례없는 기회를 만들 것입니다”라고 말했다.

이어 그는 “이 오픈 소스 데이터 세트는 즉각적인 목적을 넘어 연구자들이 복합 효능 스크리닝에 고용량 이미지를 사용하는 능력을 발전시키는 데 도움이 될 것이며, 이는 현재 위기의 해결을 넘어서는 긍정적인 영향을 미칠 것입니다”라고 덧붙였다.

한편, 실험은 4 주에 걸쳐 진행 및 완료되었으며, USU 생물 안전 수준 3(USU Biosafety Level 3) 시설에서 수행 된 후 현재, 원격으로 작업중인 리커젼의 데이터 과학자, 엔지니어 및 머신러닝 과학자 팀에 의해 분석되었다.

참고로 'RxRx19: SARS-CoV-2 바이러스에 대한 최초의 형태학적 이미징 데이터 세트(다운)', 관련 연구논문은 'SARS-CoV-2에 감염된 인간 세포에 대한 인공지능 기반 페노믹 분석을 통한 COVID-19의 잠재적 치료법 식별(Identification of potential treatments for COVID-19 through artificial intelligence-enabled phenomic analysis of human cells infected with SARS-CoV-2- 다운)이란 제목으로 23일(현지시간) 생명과학 논문 사전발표 플랫폼인 ‘바이오리시브(bioRxiv)’에 발표됐다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지