딥페이크 폐해 막기 위해 페이스북, 마이크로소프트, AWS 등 13 개국 100 개 파트너 결성된 'AI 파트너십' 나서
총 상금 100만 달러 규모 챌린지... 내년 3월 31일까지 개발된 소스코드 온라인 시스템 입력해야

행사이미지(사진:DFDC 홈페이지 캡처)

전 세계적으로 딥페이크(deepfake)에 대한 논란이 확산되고 있다. 딥페이크는 인공지능으로 특정 영상에 특정 인물의 얼굴, 음성 등을 합성한 비디오가 실제 사람들에게 허구의 말과 행동을 하는 것을 보여주는 것이다.

특정인의 인권, 희롱 및 설득의 원천으로 조작되고 사실적인 정보를 왜곡하거나 악의적으로 사용되면서 그 대상이 연예인이나 정치인 등 유명인뿐만 아니라 일반인까지 확산되고 있기 때문이다.

더 큰 문제는 온라인에 공개된 무료 소스코드와 알고리즘으로 손쉽게 제작이 가능하다는 점이다. 특히 진위 여부를 가리기 어려울 만큼 정교해 온라인으로 제공되는 정보의 정당성을 판단하는 방법에 중대한 영향을 미칠 수 있다.

딥페이크는 '생성적 적대 신경망(Generative Adversarial Networks, GAN)'을 사용, 합성 사진이나 영상을 원본이 되는 사진이나 영상에서 만들어낸다. 딥페이크라는 단어는 ‘딥러닝(Deep learning)’과 ‘거짓(Fake)’의 합성어다. 지난 2017년 말 미국에서 ‘딥페이크’라는 네티즌이 온라인 커뮤니티 레딧에 할리우드 배우의 얼굴과 포르노를 합성한 편집물을 올리면서 시작됐다.

문제는 이 새로운 형태의 잘못된 정보(기술)가 나오면 이를 처리 할 새로운 방법이 필요하지만 빠르게 진화하고 감지하는 데 큰 기술적 도전이 되고 있다.

이에 페이스북, 마이크로소프트, AWS 그리고 13 개국 100 개 파트너로 결성된 'AI의 미디어 무결성 운영위원회 파트너십(Partnership on AI)'은 공동으로 이 문제 해결을 위해 활동에 들어갔다. 전 세계의 연구 및 개발자들이 딥페이크 폐해에서 벗어날 수 있도록 미디어 조작을 식별하고 혁신적인 얼굴 또는 음성 조작으로 비디오 식별(Identify videos with facial or voice manipulations)하는 새로운 인공지능 신기술을 개발하도록 '딥 페이크 감지 챌린지(DFDC, Deepfake Detection Challenge)'도 개최하기로 했다.

행사홈페이지 메인
행사홈페이지 메인

최우수상 50만달러, 2등 30만달러, 3등 10만달러, 4등 6만달러, 5등 4만달러 등 총 상금 100만 달러(약 11억8천만원)가 수여되는 이번 챌린지는 데이터사이언스와 인공지능(AI) 기술을 연구하고 관련 경진대회를 주최하는 구글의 자회사 커뮤니티 그룹인 캐클(Kaggle)이 진행한다. 참여하려면 내년 3월 3일까지 대회 규정 준수 서약을 하고 팀 구성을 확정해야 한다. 또 내년 3월 31일까지 개발된 소스코드를 온라인 시스템에 입력해야 한다.

제공되는 학습 데이터 세트는 용량이 너무 크기 때문에 캐글에서 직접 사용할 수 없다. 대신 오프라인에서 훈련하고 외부 훈련된 모델을 외부 데이터 세트로 캐글 노트에 로드하여 테스트 세트에서 추론을 수행하는 것이 좋다. 전체 학습 데이터 세트는 470GB 이상으로 한개당 크기가 10GB 정도로 50 개의 작은 파일로 사용할 수 있게 분리해 제공된다.

현재 오픈된 캐클 퍼블릭 리더보드(Public Leaderboard)를 통해 이미 대회 참가중인 팀들과 등수, 그리고 점수를 볼 수 있다. 누구나 참여할 수 있으며, 챌린지에 참여하려면 캐글 계정(가입)이 있어야 한다. 내년 4월 22일(예정) 프라이빗 리더보드(Private Leaderboard)를 통해 참가들에게 챌린지 수상자를 발표할 예정이다.

현재, 캐글에 공개된 리더 보드 캡처
현재, 캐글에 공개된 리더 보드 캡처

시간이 갈수록 딥페이크는 개인은 물론이고 사회와 국가 등에서 사실을 왜곡하고 조작된 미디어로 지구촌의 평화와 안정을 크게 해칠 수 있다는 목소리가 힘을 얻고 있다. 유명 정치인, 기업인, 언론인 등 정치적, 경제적으로 큰 영향력을 가진 인사들을 뿐만 아니라 나도 그 대상자가 될 수 있는 가짜 동영상이 우후죽순 퍼지면서 진실이 무엇인지 우리는 큰 혼란에 빠져들고 있기 때문이다.

‘백문이 불여일견(百聞不如一見, 百闻不如一见)’ 한서(漢書), 조충국전(趙充國傳)에 나오는 이 성어는 ‘백 번 듣는 것이 한 번 보는 것만 못하다’는 말처럼, ‘보는 것은 믿는 것’에 이처럼 절대적으로 큰 영향을 미치게 되는 것이다. 인터넷과 소셜미디어에는 이런 형태의 딥페이크 동영상이 넘쳐나고 있고, 이로 인해 진짜와 가짜, 진실과 거짓이 무엇인지를 가리는 게 매우 어려워졌다.

이번 인공지능의 대표적인 악의적인 사례에 대응하는 '딥페이크 식별 챌린지'에 데이터 과학자, AI개발자라면 꼭 도전해 봄직하다. 인공지능 시대, 부정적 효과들을 막기 위한 노력에 너무도 소극적이었고, 해결책을 제시하는 데도 무능했다는 평가를 받고 있는 딥페이크 현상 때문이 아니더라도 인공지능의 순기능과 인공지능 시대에 한 획을 그을 수 있는 나의 발전을 위해서 말이다.

참고, '딥 페이크 감지 챌린지(DFDC, Deepfake Detection Challenge)' DFDC 행사 홈페이지(바로가기), 캐글 진행 홈페이지(바로가기)

저작권자 © 인공지능신문 무단전재 및 재배포 금지