인공지능이 가짜 뉴스 분류, 진짜 정보만을 제공
인공지능이 가짜 뉴스 분류, 진짜 정보만을 제공
  • 권현주 기자
  • 승인 2018.07.12 10:55
  • 댓글 0
이 기사를 공유합니다

짐고 폴링(ZimGO Polling)과 닐(Neil)의 뉴스봇(News Bot)은 확장 가능한 필터링 프로세스를 사용하여 가짜 뉴스의 유입 및 배포를 통제, 관리하고 사용자들에게 신뢰할 수 있는 경험치를 제공

‘가짜 뉴스’는 요즘 매우 익숙해진 용어다. 끊임없이 밀려오는 수많은 정보의 흐름 속에서 신뢰할 수 있는 뉴스에 대한 논쟁이 점차 가열되고 있다. 최근 과학학술지인 사이언스(Science)에 따르면 가짜 뉴스는 진짜 뉴스보다 70% 더 많이 리트윗되는 경향이 있으며 진짜 뉴스는 가짜 뉴스 대비, 대중에 도달하는 시간이 6배 더 소요되며, 가짜 뉴스는 진짜 뉴스보다 거의 10배나 더 많이 공유된다.

ZimGo 감성 지능 검색 엔진 (EISE, Emotional Intelligence Search Engine) 이미지(사진:본지DB)
ZimGo 감성 지능 검색 엔진 (EISE, Emotional Intelligence Search Engine) 이미지(사진:본지DB)

최근 비피유홀딩스(BPU Holdings)는 자사의 제품과 서비스에 인공지능(Artificial Intelligence, AI) 및 첨단 기술을 사용하여 신뢰할 수 없는 정보를 차단하고 가치 있는 정보의 품질을 다각화하여 최종 사용자에게 주목을 받고 있다. 또 짐고 폴링(ZimGO Polling)과 닐(Neil)의 뉴스봇(News Bot)은 확장 가능한 필터링 프로세스를 사용하여 가짜 뉴스의 유입 및 배포를 통제, 관리하고 사용자들에게 신뢰할 수 있는 경험치를 제공하고 있다.

짐고 폴링은 비피유의 선거 예측 솔루션으로서 기존의 솔루션에서는 가능하지 않았던 방식으로 트위터 소셜 네트워크를 통해 권한을 위임받은 시민들과 연결해준다. 짐고 폴링은 시민들의 감성을 정확하게 평가하여 선거 전문가 및 후보들에게 경쟁적 우위를 제공하는 최초의 선거 예측 솔루션이다. 짐고 폴링은 트위터에서 수집되는 다양한 정보가 민심을 대변하는 것이며, 선거에 있어서 가장 가치 있는 정보라는 가정을 기반으로 개발된 제품이다.

하지만 결과 추출을 위한 데이터 통계 처리과정에서 필연적으로 대량의 공유 게시물, 리트윗 및 스팸의 영향을 받을 수 밖에 없고, 이를 관리하기 위하여 비피유의 AI가 트위터 API와 상호작용을 통하여 중복게시물과 원치 않는 노이즈의 흐름을 처리한다. 초기 필터링 이후 노이즈가 대부분 제거될 수 있도록 모든 리트윗 게시물이 배제된다. 두 번째 처리 방식은 텍스트 필터링으로 스트림 결과의 전반적인 대기시간에 영향을 미치지 않고 대량의 중복 트윗에서 배포된 확장 가능한 패턴이 제거된다. 동일한 텍스트는 중복 게시물로 인식된다.

또한 유사성 중복제거기술(Similarity Deduplication)은 자동 게시물의 미세한 차이점을 잡아내기 위한 개념 정의 작업을 위하여 사용하고 있다. 이 세 번째 과정에서 비피유는 미세한 변형을 찾아낸다. 예를 들어 대부분의 자동 게시물의 경우에는 링크를 제외하고 동일한 텍스트를 게시하기 때문에 세 번째 필터링 단계에서 이러한 것들을 걸러낸다. 네 번째 과정은 사람들이 게시물을 스팸으로 지정하도록 지원함으로써 관련 없는 게시물을 추적하는 AI의 기능이 향상된다.

닐은 BPU의 개인 뉴스 봇이다. 인공지능 기반의 개인용 뉴스 큐레이터로 신뢰할 수 있는 뉴스 출처로부터 평판 좋은 기사와 흥미로운 이야기를 전달하는 가상 비서이다. 닐은 짐고 폴링과는 달리 각 개인이 선택한 주제에 맞는 최고의 뉴스를 사용자들에게 제공하기 위해 신중하게 선택된 약 3000개 출처의 화이트리스트로 엄격하게 품질관리를 시행한다. 두 번째로 사용자들이 검색하는 필수 및 요청된 뉴스를 정확히 제공할 수 있도록 화이트리스트를 수동으로 확인 후 품질평가 점수를 매긴다. 이 과정에서 텍스트가 너무 짧거나 부실한 텍스트, 너무 많은 링크가 달린 출처를 걸러내는 과정이 적용돼 인공지능이 가짜 뉴스 분류해 진짜 정보만을 제공하는 것이다.

오늘날 지식의 한가지 척도는 정보다. 정보가 공유되는 방식, 그것의 출처, 적용되는 방식 등이 중요하며 어떤 정보가 공유되는지가 가장 중요하다. 요즘... 국가와 정책에 직결되는 거짓 정보부터 특정인을 겨냥한 악의적 도발에 이르기까지, 왜곡 보도와 가짜뉴스가 전광석화처럼 퍼지며 범람한다. 악의도 없고 특별한 피해도 야기하지 않는 가짜뉴스라면 만우절의 장난 정도로 봐 준다지만, 작금의 가짜뉴스는 건전한 사회적 신뢰를 파괴하고 서로 불신하게 하는 암적 존재로 도를 넘어도 한참 넘었다. 인공지능이 감성 분석, 자연 언어 처리 및 머신러닝을 통하여 신뢰할 수 있는 정직한 정보와 뉴스가 우리에게 제공될 수 있다는 기대를 걸어본다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.