공개 데이터 세트 프로그램을 통해 무료로 액세스하고 쿼리할 수 있으며, 이제 연구원들은 '빅쿼리 머신러닝(BigQuery ML)'을 사용하여 추가 비용 없이 이 데이터를 사용하여 고급 머신러닝 모델을 학습시킬 수 있다

COVID-19 공개 데이터 세트 프로그램으로 이 이 질병의 확산을 막기 위해 더 빠르고 더 나은 연구할 수 있기를(사진:구글, 편집:본지)
COVID-19 공개 데이터 세트 프로그램으로 이 이 질병의 확산을 막기 위해 더 빠르고 더 나은 연구할 수 있기를(사진:구글, 편집:본지)

데이터는 항상 공중 보건 비상사태를 연구, 연구 및 퇴치하는 능력에서 결정적인 역할을 하며, 글로벌 위기의 경우, 이 보다 더 중요한 것은 없다.

또한 클라우드 규모로 데이터를 분석할 수 있는 데이터 세트 및 도구에 대한 액세스는 연구 프로세스에 점점 더 중요해지고 있다. 특히, 전세계로 확산되고 있는 새로운 코로나19(COVID-19)에 대한 글로벌 대응에 필수적이다.

구글은 코로나19를 퇴치하기 위한 연구자, 데이터 과학자, 분석가를 돕기 위해, COVID-19 공개 데이터 프로그램을 통해 무료로 액세스하고 조회할 수 있는 존스 홉킨스 시스템 과학엔지니어링센터(JHU CSSE)의 글로벌 건강 데이터 세트(보기) 프로그램(Open Street Map) 데이터 등과 같은 공공 데이터셋 저장소(Repository)를 호스팅하고 있다.

구글은 COVID-19 공개 데이터 세트(다운) 프로그램을 통해 무료로 액세스하고 쿼리할 수 있으며, 이제 연구원들은 빅쿼리(BigQuery)에서 표준 SQL 쿼리를 사용하여 머신러닝 모델을 만들고 실행할 수 있는 '빅쿼리 머신러닝(BigQuery ML-다운)'을 사용하여 추가 비용 없이 이 데이터를 사용하여 고급 머신러닝 모델을 학습시킬 수 있다고 3월 31일(현지시간) 공식 블로그를 통해 밝혔다.

사진:구글
사진:구글

데카르트랩(Descartes Labs)의 엔지니어링 총 책임자인 샘 스킬먼(Sam Skillman)은 "빅쿼리에서 COVID-19 데이터를 공개하고 사용할 수 있게 되면 해당 분야의 연구원 및 분석에 도움이 될 것입니다"라며, "특히 쿼리가 자유로울수록 참여도가 높아지고 결과를 분석하고 동료 및 일반 대중과 신속하게 공유할 수 있게 됨으로써 바이러스 확산에 대한 우리의 공통된 이해가 가속화될 것입니다"라고 말했다.

이제 이러한 데이터 세트는 장벽을 제거하고 중요한 정보에 빠르고 쉽게 액세스할 수 있으며, 대용량 데이터 파일을 검색하고 탑재할 필요가 없다. 연구원은 구글클라우드 콘솔(Google Cloud Console) 내에서 현재, 143개의 데이터 세트(보기)에 액세스하고 데이터에 대한 설명 및 샘플 쿼리를 통해 연구를 진행할 수 있는 것이다.

한편, 이 프로그램에 포함된 모든 데이터는 교육 및 연구 목적으로 하는 대중에게 오픈 소스로 공개되며 무료로 제공된다. 이 프로그램은 오는 9 월 15 일까지 계속 유효하다. 구글 클라우드 팀은 COVID-19 공개 데이터 세트 프로그램(보기)이 이 질병의 확산을 막기 위해 더 빠르고 더 나은 연구를 할 수 있기를 진심으로 바란다고 밝혔다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지