AI 시각지능 ‘딥뷰’(Deep View) 쓰레기 투기 단속한다
AI 시각지능 ‘딥뷰’(Deep View) 쓰레기 투기 단속한다
  • 박현진 기자
  • 승인 2018.11.20 18:20
  • 댓글 0
이 기사를 공유합니다

딥러닝 기반, 사람 관절의 위치와 사람이 들고 가는 물체를 탐지하고 사람과 물체의 관계를 모델링하는 방법으로 투기 행위를 탐지하는 방법을 개발했으며, 기술의 핵심은 사람 관절 포인트를 갖고 행동을 인식하는 기술과 사물을 인지하고 추적하는 기술이다.

국내 연구진이 개발한 시각지능 ‘딥뷰’(Deep View)가 CCTV 영상에서 사람의 행동을 관절수준으로 정밀하게 인식하는 기술개발에 적용된다. 기존 사람을 인식하는 기술에서 이젠 사람이 물건을 내려놓거나, 던지거나, 투기하는 행동을 정밀하게 인식하는 AI 기술이다. 또한 기술은 도심의 다양한 범죄나 사건을 사전에 감지, 예방하기 위한 핵심 기술이 될 전망이다.

한국전자통신연구원(ETRI)은 도심지역에서 쓰레기 불법투기 행위를 단속하는데 시각 인공지능 기술을 본격 활용한다. 기존 학계에서 사람의 행동이해 연구는 스포츠 영상이나 유튜브 영상과 같이 범용 데이터를 활용, 개발되어 실제 CCTV 영상에서 나타나는 행동을 인식하는데 어려움이 따랐다. 이러한 어려움을 해소하고자 ETRI에서는 지방자치단체와 필요한 기능, 요구사항, 데이터 등 긴밀한 협력을 통해, 실제 환경에서 동작할 수 있는 행동 이해 기술 개발에 초점을 두었다.

시연중인 ETRI SW콘텐츠연구소 시각지능연구그룹 연구팀(사진:ETRI)
시연중인 ETRI SW콘텐츠연구소 시각지능연구그룹 연구팀(사진:ETRI)

ETRI는 시각지능 기술을 CCTV 환경에 적용키 위해 사람의 행동 인식 중 자주 일어나고, 탐지 수요가 많은 도심의 불법 투기 행위 탐지를 목표로 했다. 기존 기술은 투기 지역에 지나가기만 해도 탐지하는 오탐지로 많은 어려움을 겪었다. 또한 이벤트 발생 시 즉각적으로 탐지해야 하는 이슈도 컸다. 연구진은 이를 위해 딥러닝 기반 인식 기술을 활용, 사람 관절의 위치와 사람이 들고 가는 물체를 탐지하고 사람과 물체의 관계를 모델링하는 방법으로 투기 행위를 탐지하는 방법을 개발했으며, 이 기술의 핵심이 사람 관절 포인트를 갖고 행동을 인식하는 기술과 사물을 인지하고 추적하는 기술이다.

즉 쓰레기를 무단으로 투기하는 일련의 과정과 관련이 있다는 셈이다. 사물을 검출하고 쓰레기를 추적하며 쓰레기 투기행위를 검출하는 기술이 적용된 것이다. 아울러 쓰레기 더미를 검출하고 투기 시에 사람의 관절 포인트와 행동을 인식해 관계를 추적하고 추론도 하게 된다. 또한 머신러닝으로 일정거리 이상 떨어져 있는지, 쓰레기를 던졌는지, 완전히 버렸는지 등의 다양한 쓰레기 투기 행동의 패턴들을 학습해 검출한다.

도심의 불법 투기 행위 인식의 정량적 결과로 녹색 선: 사람과 물체 간의 그래프 관계, 빨간색 메시지: 투기 행위 탐지 알람
도심의 불법 투기 행위 인식의 정량적 결과로 녹색 선: 사람과 물체 간의 그래프 관계, 빨간색 메시지: 투기 행위 탐지 알람

또한 실제 CCTV 환경에 접목이 가능하도록 각 구성 알고리즘들을 스트리밍 방식의 영상에 맞게 구성하고, 인식 지연시간을 최소화하기 위한 효율적 알고리즘 설계에 집중했다. 실제 실험을 통해 사람이 쓰레기를 무단으로 버리면 ‘찰칵’ 소리가 나며 “사진이 촬영되었습니다. 투기물을 가져가지 않으면 관련법에 따라 처벌 받게 됩니다.”라는 경고 메시지가 방송된다.

이처럼 AI 시각지능 기술이 쓰레기 투기 등에 적용됨에 따라 ‘카메라가 실제 나를 보고 있구나’라는 인식이 확장되어 향후 상용화 시 투기 등이 감소할 것으로 전망된다. 연구진은 이 기술은 향후 기술개발을 통해 상점에서 사용자의 행동 분석, 교량에서의 자살행위 감지, 공장 근로자의 위험 행동 경고 등 다양하게 활용될 수 있다고 밝혔으며, 이 기술은 세종특별자치시와 서울시 은평구와의 실증을 통해 기술 검증 후 영상관제, 영상검색, 패션AI 관련 업체 등에 기술이전이 가능할 것이라고 말했다.

특히 연구진은 지난해 시각지능 플랫폼 기술로 국제 국제영상인식대회(ILSVRC, 이미지넷)에서 사물 종류별 검출 성능 부문에서 구글, 마이크로소프트, 페이스북 등 기업과 대학 연합팀들과 겨루어 사물 종류별 검출 성능 기준 2위, 평균 검출 정확도 기준 3위 성적을 달성했었다. 사물 검출 분야는 200가지 사물(65,500장) 사진 중 사물의 종류와 위치를 찾아내어 성능을 평가한다. 성적은 사물 종류별 검출 성능과 평균 검출 정확도(mAP)로 측정한다. mAP는 200가지 전체 사물의 검출 정확도를 나타내는 지표로 사물 검출 분야 종합 수준을 나타낸다. 전체 14개 참가기관 중 3개 팀만이 정확도 0.60 이상의 성적을 거뒀다.

시각지능 ‘딥뷰’ 개요
시각지능 ‘딥뷰’ 개요

ETRI에서는 ‘딥뷰’ 팀과 ‘콘텐츠 비주얼 브라우징’ 팀이 참가, 딥러닝 기술 기반으로 사물의 종류와 위치를 검색하는 네트워크를 설계, 학습해 검출 성능과 정확도를 높이는데 주력했다. 그 결과, 사물 종류별 검출성능 기준으로 ETRI ‘딥뷰’팀이 2위를 달성했으며, 10가지 사물에 대해 최고 성능을 보였다. 사물 종류별 검출 성능이 높다는 것은 특정 사물에 대해 차별화된 기술력을 가지고 있다는 것을 의미한다.

한편, 본 기술은 현재 주요 인공지능 관련 논문 등에 접수된 상태이며, SCI급 저널에도 소개될 예정이다. 관련 연구자들은 본 기술이 획기적인 발상이며 사람과 물체의 관계 모델링을 통해 실세계 CCTV 환경에 적용 가능한 유망한 기술이라고 리뷰를 남기기도 했다.

이춘희 세종특별자치시장은 “본 기술이 확대 될 시 쓰레기 무단투기 예방은 물론 CCTV관제를 효율적으로 운영할 수 있을 것이며, 상용화되어 시민의 안전을 지키는 스마트시티 산업에 기여하기를 희망 한다”고 밝혔다. 또 김미경 은평구청장도 “이번 ‘행동인식기술 시험 적용 사업’을 통해 도심에서 발생할 수 있는 범죄사건 및 쓰레기무단투기 등 각종 범죄 상황을 신속· 정확히 판단하는데 도움이 될 것으로 기대한다"고 말했으며, ETRI 한동원 SW콘텐츠연구소장은 “ETRI가 보유하고 있는 다양한 시각 AI 기술을 실제 현장에 적용하여 국민생활과 밀접한 사회문제를 해결하고 국민 삶의 질을 향상시키는데 기여할 수 있도록 노력할 것이다”고 설명했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.