인텔랩 '페이크캐쳐'는 비디오 픽셀의 얼굴 전체에서 '혈류'를 분석·수집, AI 알고리즘은 이러한 신호를 시공간 맵으로 변환한다. 그런 다음 딥러닝을 사용하여 동영상이 진짜인지 가짜인지 즉시 감지

페이크캐쳐 인포그래픽 캡처 이미지
페이크캐쳐 인포그래픽 캡처 이미지

딥페이크(Deepfake)는 인공지능(AI)으로 특정 영상에 특정 인물의 얼굴, 음성 등을 합성한 비디오가 실제 사람들에게 허구의 말과 행동을 하는 것을 보여주는 것이다.

문제는 특정인의 인권, 희롱 및 설득의 원천으로 조작되고 사실적인 정보를 왜곡하거나 악의적으로 사용되면서 그 대상이 연예인이나 정치인 등의 유명인뿐만 아니라 일반인까지 확산되고 있기 때문이다. 

더 큰 문제는 온라인에 공개된 무료 소스코드와 알고리즘으로 손쉽게 제작이 가능하다는 점이다. 특히 진위 여부를 가리기 어려울 만큼 정교해 온라인으로 제공되는 정보의 정당성을 판단하는 방법에 중대한 영향을 미칠 수 있다.

이처럼 전 세계적으로 딥페이크에 대한 폐해로 논란이 확산되고 있는 가운데 그 위협과 피해는 점점 커지고 있다. 최근 가트너 조사에 따르면 기업들은 사이버 보안 솔루션에 최대 1,880억 달러를 투자할 예정이다.

사진:인텔
사진:인텔

그러나 딥페이크 영상을 실시간으로 탐지하는 것도 쉽지 않다. 분석을 위해서는 탐지 애플리케이션에 영상을 업로드 한 뒤, 결과가 나오기까지 몇 시간이 소요되기 때문에 딥페이크로 인한 폐해는 순간적이라도 치명적인 결과를 초래할 수 있다.

이에 지난 2020년에 메타(구 페이스북), MS, AWS 그리고 13 개국 100 개 파트너로 결성된 'AI의 미디어 무결성 운영위원회 파트너십(Partnership on AI)'이 출범하는 등 글로벌 IT기업 및 연구기관들은 딥페이크 폐해에서 벗어날 수 있도록 미디어 조작을 식별하고 혁신적인 얼굴 또는 음성 조작된 비디오를 식별하는 새로운 AI 신기술 개발에 정진하고 있다.

여기에, 인텔랩이 15일(현지시간) 무려 96%의 정확도로 가짜 동영상을 탐지할 수 있는 페이크캐쳐(FakeCatcher) 기술을 개발했다고 밝혔다. 해당 기술은 인텔의 ‘책임있는 AI(Responsible AI)’ 노력의 일환으로 개발되었으며, 이 딥페이크 탐지 플랫폼은 세계 최초로 밀리초 단위 내로 분석 결과를 제공하는 실시간 딥페이크 탐지기다.

일케 데미르(Ilke Demir) 인텔 랩(Intel Labs) 수석 연구원은 “유명한 연예인이 실제로 하지 않은 행동이나 말을 하는 동영상을 본 적이 있을 것”이라며 “딥페이크 영상은 이제 어디에서나 접할 수 있다”고 말했다.

인텔이 공개한 실시간 딥페이크 탐지 기술은 인텔 하드웨어와 소프트웨어를 사용하며, 웹 기반 플랫폼을 통해 서버와 인터페이스 상에서 구동한다.

페이크캐쳐 개요(인포그래픽)
페이크캐쳐 개요(인포그래픽)

소프트웨어로는, 다양한 전문 소프트웨어 도구를 사용해 최적화된 페이크캐쳐 아키텍처를 구성한다. 개발팀은 얼굴과 지형지물 감지 알고리즘을 위해서는 오픈비노(OpenVINOTM)를 사용해 AI 모델을 구동했다.

컴퓨터 비전 블록은 멀티 스레드 소프트웨어 라이브러리인 인텔 통합 성능 프리미티브(Intel Integrated Performance Primitives)와 실시간 이미지 및 영상 처리 도구인 오픈CV를 바탕으로 최적화했으며, 추론 블록은 인텔 딥러닝 부스트(Intel Deep Learning Boost)와 인텔 어드밴스드 벡터 익스텐션 512(AVX0512)로, 미디어 블록은 인텔 AVX2로 최적화했다.

아울러, 개발팀은 오픈 비주얼 클라우드(Open Visual Cloud) 프로젝트를 이용해 인텔 제온 스케일러블 프로세서 제품군을 위한 통합 소프트웨어 스택을 제공했다. 하드웨어로는, 신규 딥페이크 탐지 플랫폼은 3세대 인텔 제온 스케일러블 프로세서위에서 최대 72개 각자 다른 탐지 스트림을 구동할 수 있다.

이미지:본지DB
이미지:본지DB

대부분이 딥러닝 기반 탐지기는 원본 데이터를 확인 후, 비진위성의 징후를 찾고 영상의 문제를 식별한다. 반면, 페이크캐쳐는 실제 인간의 요소, 즉 비디오 픽셀에서 나타나는 인간의 미묘한 ‘혈류’를 가늠, 실제 영상에서 단서를 확보한다. 심장이 혈액을 내보낼 때 정맥의 색이 변한다.

따라서, 해당 탐지기는 원본 영상에서 나타나는 사람의 얼굴에서 혈류 신호를 수집하고, 알고리즘을 통해 시공간 지도로 변환한다. 이 후 딥러닝으로 영상의 진위를 즉시 판단할 수 있다. 이처럼 사용자가 컨텐츠의 진위를 거의 실시간으로 식별할 수 있게 지원함으로써 신뢰 회복을 도울 수 있다.

한편, 이번 발표된 페이크캐쳐를 활용할 사례를 몇 가지 예상해볼 수 있다. 소셜 미디어 플랫폼은 사용자들이 해로운 딥페이크 영상을 업로드 하는 것을 막기 위해 해당 기술을 활용할 수 있다. 방송 매체 또는 미디어는 조작된 영상을 실수로 보도하는 것을 방지하기 위해 해당 기술을 활용할 수 있으며 비영리 단체들은 플랫폼을 활용해 모든 사람들이 사용할 수 있도록 딥페이크 탐지 기능을 공개할 수 있다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지