KIST 연구팀, 군집화-예측 기반 인공지능 기술로 하폐수 속 신종 유입물질의 특성 예측, 까다로운 분석절차 단축해 수처리 관련 시설에서 실제 활용 기대

(왼쪽부터) 손문 KIST 선임연구원, 임승지 KIST 박사후연구원, 홍석원 KIST 선임연구원.
(왼쪽부터) 손문 KIST 선임연구원, 임승지 KIST 박사후연구원, 홍석원 KIST 선임연구원.

전 세계 의약품 소비량은 2020년 기준으로 4 조회 분량으로 매년 급증하는 추세다. 과거와 비교해 점점 더 다양한 의약품들이 인체의 대사 작용을 거쳐 하·폐수 처리장으로 유입되면서, 여기서 발견되는 미량물질의 양과 종류도 증가하고 있다. 

특히, 하·폐수 속 미량물질이 다시 강과 바다 등으로 유입돼 상수원으로 활용되면 환경뿐 아니라 발암, 내분비계 장애 등 인간의 건강에도 해로운 영향을 미칠 수 있다. 

따라서 이러한 미량물질의 그 특성과 거동을 신속, 정확하게 예측하는 기술이 필요지만, 알려지지 않은 미량물질을 분석하는 데는 고가의 장비와 숙련된 전문가가 필요하며 오랜 시간이 걸린다.

한국과학기술연구원(KIST, 원장 윤석진)은 물자원순환연구단 홍석원 단장과 손문 선임연구원 팀이 군집화-예측기반 인공지능(AI)을 활용해 신종 미량물질을 물리화학적 특성에 따라 분류하고 농도를 예측하는 기술을 개발했다.

연구진은 데이터의 유사성에 따라 지도의 형태로 군집화하는 자기조직화지도 인공지능 기술을 통해 의약화합물, 카페인 등 기존에 알려진 29종의 미량물질을 물리화학적 특성, 작용기, 생물학적 반응 기작 등의 정보에 따라 분류했다. 

그다음, 새로운 미량물질의 특성과 농도 변화를 예측하기 위해 데이터를 여러 하위 집합으로 분류하는 머신러닝 기술인 랜덤 포레스트를 추가로 구축했다. 만약 새로운 미량물질이 자기조직화지도 내의 어떤 군집에 속한다면, 해당 군집 내 다른 물질의 특성을 통해 새로운 미량물질의 특성과 농도가 어떻게 변화할지 예측할 수 있다.

연구팀의 머신러닝 이용한 신종 미량물질 예측 기술 개요
연구팀의 머신러닝 이용한 신종 미량물질 예측 기술 개요

이렇게 구성된 군집화-예측 인공지능 모델(자기조직화지도-랜덤포레스트)을 새로운 13종의 신종 미량물질에 적용한 결과, 생물학적 정보를 이용한 기존 인공지능을 활용한 기술의 예측정확도인 0.40을 훨씬 뛰어넘는 약 0.75의 우수한 예측정확도를 보였다.

수식을 기반으로 하는 전통적인 예측 방법에 비해 KIST 연구팀의 데이터 기반 분석모델은 미량물질의 물리화학적 특성만 입력하면 비슷한 데이터를 가진 물질과의 군집화를 통해 새로운 미량물질의 농도가 하수처리 과정에서 어떻게 변화할지 효율적으로 파악할 수 있다는 장점이 있다. 또한, 데이터 기반의 인공지능 모델 특성상 사회적인 관심사인 마약과 같은 신종물질의 농도 예측에도 향후 활용할 수 있다.

KIST 홍석원 박사와 손문 박사(이상 공동 교신저자)는 “실제 하폐수 처리장 뿐 아니라 신종 미량물질이 존재하는 대부분의 수처리 관련 시설에 적용할 수 있으며, 관련 규제를 위한 정책결정 과정에서 신속하고 정확한 자료를 제공할 수 있는 기술”이라고 밝히며, “머신러닝 기술을 활용하기 때문에 관련 데이터가 축적될수록 예측정확도도 향상될 것”이라고 기대했다.

한편, 연구결과는 네이처 포트폴리오 저널 클린워터(npj Clean Water)에 '머신러닝을 사용하여 미량 오염물질을 클러스터링하고 흡착 및 생분해 속도 상수 추정 방법(Clustering micropollutants and estimating rate constants of sorption and biodegradation using machine learning approaches-아래첨부)'란 제목으로 지난달 28일 게재되었다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지