KAIST 박용화 교수 연구팀, 인공지능 기반 실시간 ‘기침 인식 카메라’ 개발
KAIST 박용화 교수 연구팀, 인공지능 기반 실시간 ‘기침 인식 카메라’ 개발
  • 최광민 기자
  • 승인 2020.08.03 13:00
  • 댓글 0
이 기사를 공유합니다

기침 인식 모델 개발을 위해 컨볼루션 네트워크(convolutional neural network, CNN)을 기반으로 지도학습(supervised learning)을 적용했다. 1초 길이 음향신호의 특징(feature)을 입력 신호로 받아, 1(기침) 또는 0(그 외)의 2진 신호를 출력하고 학습률의 최적화를 위해 일정 기간 학습률이 정체되면 학습률 값을 낮추도록 설정
기계공학과 박용화 교수(사진:KAIST)

펜데믹, 전대미문의 위기 속에서 인공지능은 단 수주만에 '코로나19 진단 키트' 개발하고 정확성이 혁신적으로 향상된 '영상 AI 진단' 기술은 불과 수초만에 감염여부를 판별한다. AI 얼굴인식 및 열화상인식 시스템, AI 화상회의 및 교육 솔루션, 유통, 물류 등 비대면 언텍트 시대에서 인공지능은 다양한 장소와 지역에서 눈부시게 활약하고 있다.

여기에, KAIST(총장 신성철)는 기계공학과 박용화 교수 연구팀이 에스엠 인스트루먼트(대표 김영기)와 공동으로 실시간으로 기침 소리를 인식하고 기침하는 사람의 위치를 이미지로 표시해주는 `기침 인식 카메라'를 개발했다고 3일 밝혔다.

합성곱 신경망 기반의 기침 인식 모델 구조 개요

코로나19의 대표적인 증상이 발열과 기침인데, 현재 발열은 열화상 카메라를 이용해 직접 접촉을 하지 않고도 체온을 쉽게 판별할 수 있다. 문제는 비접촉방식으로는 기침하는 사람의 증상을 쉽사리 파악하기 어렵다는 점이다. 박 교수 연구팀은 이런 문제를 해결하기 위해 기침 소리를 실시간으로 인식하는 딥러닝 기반의 기침 인식 모델을 개발했다.

연구팀은 또 열화상 카메라와 같은 원리로 기침 소리와 기침하는 사람의 시각화를 위해 기침 인식 모델을 음향 카메라에 적용, 기침 소리와 기침하는 사람의 위치, 심지어 기침 횟수까지를 실시간으로 추적하고 기록이 가능한 `기침 인식 카메라'를 개발했다.

연구팀은 기침 인식 카메라가 사람이 밀집한 공공장소에서 전염병의 유행을 감지하거나 병원에서 환자의 상태를 상시 모니터링 가능한 의료용 장비로 활용될 것으로 기대하고 있다.

기침 인식 모델의 학습을 위해 사용된 음향 특징의 예시
기침 인식 모델의 학습을 위해 사용된 음향 특징의 예시

연구진은 기침 인식 모델 개발을 위해 컨볼루션 네트워크(convolutional neural network, CNN)을 기반으로 훈련 데이터(Training Data)로부터 하나의 함수를 유추해내는 지도학습(supervised learning)을 적용했다. 1초 길이 음향신호의 특징(feature)을 입력 신호로 받아, 1(기침) 또는 0(그 외)의 2진 신호를 출력하고 학습률의 최적화를 위해 일정 기간 학습률이 정체되면 학습률 값을 낮추도록 설정했다.

연구진은 기침 인식 모델의 훈련 및 평가를 위해 구글과 유튜브 등에서 연구용으로 활발히 사용 중인 공개 음성데이터 세트인 `오디오세트(Audioset)'를 비롯해 `디맨드(DEMAND)'와 `이티에스아이(ETSI)', `티미트(TIMIT)' 등에서 데이터 세트를 수집했다. 이 중 `오디오세트'는 훈련 및 평가 데이터 세트 구성을 위해 사용했고 다른 데이터 세트의 경우 기침 인식 모델이 다양한 배경 소음을 학습할 수 있도록 데이터 증강(data augmentation)을 위한 배경 소음으로 사용했다.

기침 인식 카메라의 외형 및 신호처리 블록선도
기침 인식 카메라의 외형 및 신호처리 블록선도

데이터 증강을 위해 배경 소음을 15%~75%의 비율로 `오디오세트'에 섞은 후, 다양한 거리에 적응할 수 있게 음량을 0.25~1.0배로 조정했다. 훈련 및 평가 데이터 세트는 증강된 데이터 세트를 9:1 비율로 나눠 구성했으며, 시험 데이터 세트는 따로 사무실에서 녹음한 것을 사용했다. 또 모델 최적화를 위해서는 `스펙트로그램(spectrogram)' 등 5개의 음향 특징과 7개의 최적화 기기(optimizer)를 사용해 학습을 진행하고 시험 데이터 세트의 정확도를 측정, 성능을 확인한 결과 87.4%의 시험 정확도를 얻을 수 있었다.

연구진은 이어 학습된 기침 인식 모델을 소리를 수집하는 마이크로폰 어레이와 카메라 모듈로 구성되는 음향 카메라에 적용했다. 그 결과 수집된 데이터는 음원의 위치를 계산하는 빔 형성 과정을 거쳐 기침 인식 모델이 기침 소리로 인식할 경우 기침 소리가 난 위치에 기침 소리임을 나타내는 등고선과 라벨이 각각 표시된다.

연구실 환경에서 기침 인식 카메라의 기침 발생 위치표시
연구실 환경에서 기침 인식 카메라의 기침 발생 위치표시

박 교수팀은 마지막 단계로 기침 인식 카메라의 예비 테스트를 진행한 결과, 여러 잡음 환경에서도 기침 소리와 그 이외의 소리로 구분이 가능하며 기침하는 사람과 그 사람의 위치, 횟수 등을 실시간으로 추적해 현장에서의 적용 가능성을 확인했다. 연구팀은 추후 병원 등 실사용 환경에서 추가 학습이 이뤄진다면 정확도는 87.4%보다 더 높아질 것으로 기대하고 있다.

박용화 교수는 "코로나19가 지속적으로 전파되고 있는 상황에서 공공장소와 다수 밀집 시설에 기침 인식 카메라를 활용하면 전염병의 방역 및 조기 감지에 큰 도움이 될 것ˮ이라고 말했다. 박 교수는 이어 "특히 병실에 적용하면 환자의 상태를 24시간 기록해 치료에 활용할 수 있기 때문에 의료진의 수고를 줄이고 환자 상태를 더 정밀하게 파악할 수 있을 것ˮ 이라고 강조했다.

한편, 이번 연구는 에너지기술평가원(산업통상자원부)의 지원을 받아 수행됐으며, 현재 이 기술은 '딥러닝 기반의 기침 인식 카메라'로 로 특허 출원(출원번호:10-2020-0084770호) 됐다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.