본문바로가기

팩트체크의 고민 “어떤 팩트를 검증할 것인가?”


오세욱 (한국언론진흥재단 선임연구위원)


지난 5월 대선을 계기로 ‘팩트체크’에 대한 관심이 상당히 높아졌다. 현재 22개 언론사가 참여하고 있는 ‘SNU 팩트체크’의 등장이 이를 상징한다. SNU 팩트체크는 공직자, 정치인 및 공직자 (예비)후보들이 토론, 연설, 인터뷰, 보도자료 등의 형식으로 발언한 내용의 사실 여부, 이들 집단과 관련해 언론사의 기사나 소셜미디어 등을 통해 대중에게 회자되는 사실적 진술의 사실성, 그 외 경제, 과학, IT, 사회, 문화 등 제반 분야에서 정확한 사실 검증이 필요하다고 보이는 공적 사안 전반에 대한 검증을 목표로 하고 있다. 이를 위해 서울대학교 언론정보연구소가 웹 플랫폼을 마련하고, SNU 팩트체크에 참여하는 언론사들이 이 플랫폼에 사실을 검증한 콘텐츠를 제공하고 있다. 언론사와 대학이 협업하는 비정치적·비영리적 공공 정보 서비스 모델이다. 





[그림 1] ‘팩트체크’에 대한 구글(왼쪽)과 네이버(오른쪽)의 지난 1년간 검색어 트렌드. 2017년 5월을 기점으로 급격히 상승한 것을 알 수 있다.



그런데 왜 갑자기 팩트를 검증한다고 하는 것일까라는 의문이 생긴다. 팩트, 즉 사실의 검증은 오랫동안 원래 언론이 해 오던 고유의 업무다. SNU 팩트체크는 “유권자와 정보 소비자들의 공적 사안에 대한 지식과 이해의 증진에 기여하는 것을 목표로 한다”고 명시하고 있는데, 이것도 기존 언론들이 오랫동안 해 온 일이다. ‘팩트체크’의 필요성이 처음 제기된 것은 1988년 미국 대통령 선거 캠페인 과정이다. 당시 공화당 후보이던 부시(George H. W. Bush)는 상대 후보를 대상으로 엄청난 네거티브 캠페인 광고를 송출했다. 부시는 선거에서 승리했지만 대다수의 언론은 흑색선전으로 점철된 선거 캠페인의 문제점을 지적했다. 이와 함께 사실 확인 없이 선거 캠페인에만 의존한 선거 보도에 대한 비판도 가중됐으며, 이후 1992년 미국 대선 기간 중 CNN 기자였던 브룩스 잭슨(Brooks Jackson)이 최초의 팩트체크 서비스를 처음 선보였다. 여기서 왜 갑자기 팩트체크인가에 대한 답을 얻을 수 있다. 


위키피디아의 정의1)에 따르면, 팩트체크는 비 허구적(non-fictional) 텍스트에 포함된 사실적 진술들의 진실성, 정확성을 확인하는 행위로, 텍스트 작성 후 배포 및 발간 이전에 이뤄지거나(ante hoc, 사전적 팩트체크), 발간 및 배포 이후(post hoc, 사후적 팩트 체크)에 이루어진다. 사전적 팩트체크의 목적은 텍스트에 포함된 오류를 수정해 최대한 정확한 텍스트를 배포, 발간하게 하거나, 오류를 수정할 수 없을 경우 텍스트의 발간을 막게 하는 데 있으며, 사후적 팩트체크의 목적은 텍스트에 포함된 사실적 진술의 오류를 적시함으로써 텍스트의 독자와 대중이 사실을 오해하지 않고 정확하게 인지하도록 하는 것이다. 저널리즘의 신뢰도를 담보하는 측면에서 현재 사후적 팩트체크에 대한 관심이 지속적으로 늘어나고 있으며, 언론의 팩트체크는 대부분 사후적 팩트체크에 주력하고 있다. 사후적 팩트체크를 통해 오류가 발견될 경우 그 주장의 발화자는 언론사와 대중으로부터의 신뢰도를 동시에 상실한다.


한가지 예를 들어본다. A라는 정치인이 “나는 1980년 대에 미국에 유학해 박사 학위를 받았다”고 말했다. B 언론사가 이를 그대로 인용해 “정치인 A 미국 박사 학위 보유”라고 보도했다. 이 경우 B 언론사는 정치인 A의 발언을 직접 듣고 인용해 보도한 것으로 충분히 사실이라고 믿을만 했다. 그런데 알고보니 정치인 A는 박사 과정만 다녔고 학위는 받지 못했지만 이를 과장해 허위 사실을 말한 것이었다. B 언론사는 사실을 보도했지만, 사실을 검증하지 않은 오류를 범했다. 1988년 미국 대선 캠페인 때도 언론은 캠페인이라는 사실을 보도했지만 그 내용의 사실 여부를 검증하지 않았고 이것에 대한 반성이 팩트체크의 등장으로 이어졌다. 그런데 30년 가까이 지난 지금의 경우 디지털이 모든 콘텐츠 영역에 적용되면서 너무나 많은 사실들이 등장하고 있다. 등장하는 사실을 전달하는 것만으로도 언론들이 힘들어 하고 있다. 꼭 모든 사실을 보도해야 하는 것은 아니지만 어쨌든 보도할 사실을 선택하기 위해서는 등장하는 모든 사실에 대해 알 필요는 있다. 너무나 많은 사실들이 등장하는 가운데 언론들은 속보 경쟁도 벌여야 한다. 이에 따라 등장하는 사실들을 모두 검증하지 못한 채 “어쨌든 난 사실을 전달했다”고 넘어가는 상황이 자주 발생하고 있다. 2017년의 맥락에서 팩트체크가 다시 등장한 이유다. 


문제는 팩트체크가 소수 인력에 의해 수행되는 경우가 많다는 점이다. 많아 봐야 20명 내외다. 소수의 인원으로 등장하는 모든 팩트를 검증한다는 것은 사실상 불가능하다. 이에 따라, 팩트체크가 팩트 여부를 검증하는 사람 및 기관, 언론의 정치적 입장에서 이뤄지는 ‘의견 저널리즘(Opinion Journalism)’의 양상을 보이고 있다는 비판이 제기되고 있다. “팩트 체킹은 정치와 정책에 대한 엘리트 논쟁의 영역이라는 의미에서의 의견의 공간에 속한다”는 주장(Graves, 2016)2)이 대표적이다. 왜 이 발언을 검증하는지 왜 이 사실을 검증하는지에 대한 합리적, 객관적 설명이 없다면 팩트체크는 그 근거를 잃을 수 있다. SNU 팩트체크는 한 가지 팩트에 대한 여러 언론사의 검증 내용을 전달하는 방식으로 팩트체크의 내용에 대한 공정성과 객관성을 담보하려고 있지만, 어떤 팩트를 검증하는가와 관련해서는 그러한 장치가 아직 부족하다고 할 수 있다. 팩트의 검증이 필요하다고 보이는 공적 사안 전반이라는 가이드라인은 제시하고 있지만, 공적 사안 전반이 어디까지를 의미하는지에 대한 설명은 없다. 팩트를 검증한다고 하지만, 어떤 팩트를 검증하기로 결정하는데에는 팩트와는 다소 어울리지 않는 편견이 개입할 수 있다. 


이러한 문제를 해결하고자 사람이 아닌 테크놀로지가 검증이 필요한 사안들을 자동으로 선정하려는 시도들이 등장하고 있다. 전 세계에서 벌어지고 있는 일들을 한데 모아 가장 이슈가 되는 사안들을 자동으로 도출하려는 ‘이벤트 레지스트리(Event Registry)’3)와 소셜 미디어 상에서 화제가 되고 있는 사안들을 자동으로 도출하는 ‘소셜 센서(social sensor)’4) 프로젝트 등이 대표적인 사례다. 먼저 이벤트 레지스트리는 실시간으로 전 세계의 뉴스 기사를 수집해 현재 이슈가 되고 있는 사건을 찾고 있다. 글로벌 미디어 모니터링(Global media monitoring)을 통해 10개 국어 이상의 10만 개 이상 언론사의 뉴스를 실시간으로 수집한다. 이후 수집된 뉴스들을 대상으로 자연어 처리를 통해 인명, 지명, 기관, 날짜, 언급된 주제 등을 식별한다. 언어간 분석(Cross-lingual analytics)을 통해 언어에 상관없이 관련된 기사들을 사건 단위로 분석하여 기사들에서 언급되고 있는 사건(event)들을 식별해 현재 전 세계에서 벌어지고 있는 중요한 사건이 무엇인지 찾는다. 이러한 과정을 통해 뉴스 기사에서 식별된 사건들의 내용, 장소, 인물, 시간 등 정보를 추출해 검색 가능한 형식으로 구조화해 저장하고 각 사건들을 관련도에 따라 서로 엮어 맥락화한다. 이렇게 종합한 결과를 아래 그림과 같이 제시한다.



[그림 2] 이벤트 레지스트리의 실행화면. 세계 각 지역별로 식별된 이슈들이 지도상에 표시되고 관련된 내용과 기사들을 요약해 제시한다. 또한, 관련한 기초 통계를 함께 제공한다.



이벤트 레지스트리는 사건뿐만 아니라 이슈가 되고 있는 사람, 기관, 지역 등도 순위화해 제시한다. 따라서, 이용자들은 이벤트 레지스트리를 통해 현재 전 세계에서 이슈가 되고 있는 사안들을 실시간으로 모니터링이 가능하다. 또한, 자동으로 추출된 관련 기초 통계를 통해 왜 이 사안이 이슈가 되고 있는지 등을 수치로 제시가 가능하며 관련한 기초 정보도 실시간으로 제시할 수 있다. 현재, BBC 뉴스, 핀터레스트, 하버드 대학교, 톰슨 로이터, IBM 등이 이벤트 레지스트리를 활용하고 있다. 단, 유료로 제공되며 개별 가격은 문의해야 한다. 


소셜 센서 프로젝트는 수많은 소셜 미디어 플랫폼 상의 모든 콘텐츠들을 실시간으로 수집하고 클러스터링해 관련한 내용에 대해 분석한 후 시간, 장소, 구문 등을 통해 맥락화한 후 최종적으로 신뢰성을 평가하고 있다. 현재 소셜 미디어 상에서 무엇이 이슈인지 분석하고 그 이슈들이 담고 있는 내용들의 신뢰도를 평가하는 작업을 자동으로 진행하고 있다. 이를 통해 광범위한 플랫폼에서 발생하고 있는 현재 이슈들을 식별해 뉴스와 정보로 구분해 이용자에게 제공하는 것을 목표로 하고 있다. 



[그림 3] ‘소셜 센서 프로젝트’의 작동 방식. 



물론, 이 둘은 팩트체크만을 위해 만들어진 툴들이 아니다. 검증하기 위한 팩트를 선정함에 있어서 개입될 수 있는 사람의 편견을 배제하기 위해 활용 가능한 방법 중 사례로 제시한 것이다. 팩트체크를 위한 보다 실제적인 사례는 ‘퍼스트 드래프트(First Draft)’5)를 참고할 수 있다. 퍼스트 드래프트는 프랑스 대선을 앞두고 페이크 뉴스 등에 대항하기 위해 만든 언론사들 간의 팩트체크 협업 조직인 ‘크로스체크(Crosschseck)’를 운영한 비영리 단체다. 퍼스트 드래프트는 온라인에서 어떠한 내용이 화제가 되고 있는지를 실시간으로 추적하고, 이 내용들을 팩트체크에 적용하기 위한 목적으로 네 가지 외부 도구와 자체 개발한 툴을 활용하고 있으며 이들을 통합적으로 활용하고 있다. 


먼저 트렌도라이저(trendolizer)6)는 온라인 상 링크 중 페이스북에서 좋아요가 많은 것, 트위터에서 리트윗이 많은 것, 핀터레스트에서 핀 수가 많은 것, 유튜브에서 조회수가 많은 동영상 등을 실시간으로 수집하고 목록화해 제시한다. 매시간 순위를 갱신하면서 현재 소셜 미디어에서 이슈가 되고 있는 내용을 한눈에 볼 수 있게 해 준다. 다음으로 페이스북의 ‘크라우드탱클(CrowdTangle)’7)을 활용한다. 페이스북이 인수한 크라우드탱글은 페이스북으로부터 독점 데이터를 제공받아 이용자들에게 제공한다. 퍼스트 드래프트는 크라우드탱글 데이터를 활용해 페이스북 페이지 중 특이 사항과 내용들을 모니터링하고 있다. 또한, 뉴스휩 스파이크(Newswhip Spike)8)를 통해 소셜 미디어 상에서 이슈가 되고 있는 뉴스 기사 목록을 제공받고 있다. 마지막으로 지역별로 수집된 트위터의 해쉬태그와 키워드를 수집하는 ‘트렌드맵(Trendsmap)’9)을 통해 지도 형식으로 시각화된 정보를 제공받는다. 그리고 퍼스트 드래프트는 실시간 트윗 수집을 목적으로 자체적으로 만든 ‘소셜 피드 매니저(Social Feed Manager)’10)를 통해 외부 툴들이 제공하지 않는 소셜 데이터 내용도 확인하고 있다. 



[그림 4] 퍼스트 드래프트의 에디터들이 실시간 이슈 추적을 위해 뉴스휩 스파이크, 트렌도라이저, 트렌드맵 등 다양한 소셜 모니터링 툴을 통합적으로 활용하고 있다. 

※ 출처 : https://firstdraftnews.com/uk-real-time-factchecking/



퍼스트 드래프트는 이러한 툴들을 통합적으로 활용해 실시간으로 이슈를 모니터링하고 어떤 팩트를 검증할 것인지를 제시한다. 최종적으로 검증할 팩트를 선정하는 것은 언론사지만 퍼스트 드래프트가 제시하는 검증 대상 팩트들은 이러한 툴들이 제시하는 수치에 따라 가능한 중립적으로 선정되고 있다. 물론, 지금까지 소개한 사례들이 정답이라고는 할 수 없다. 수없이 쏟아지는 팩트들 중 어떤 것을 검증해야할지 선택함에 있어서 개입되는 사람의 어쩔 수 없는 편견을 보완하기 위한 용도로 활용되고 있을 뿐이다. 그 목적을 달성할 수만 있다면 어떠한 툴, 소프트웨어를 활용하든 문제가 되지 않는다. 팩트를 정확하게 검증하는 것만큼이나 어떤 팩트를 검증할 것인지 선택하는 문제가 더욱 중요해질 것이다. 크로스체크나 SNU 팩트체크 등 다양한 언론사 간 연합 팩트체크 조직일수록 이러한 문제가 더욱 큰 이슈가 될 것으로 전망된다. 물론, 기술은 선하지도 악하지도 않으며, 중립적이지도 않다(Kranzberg, 1986)11). 어떠한 도구, 소프트웨어를 활용한다하더라도 그것에 편견이나 왜곡이 전혀 없다고는 할 수 없다. 다만, “객관적 정보에 기반하며, 명확한 기준에 따라 판정한다”는 SNU 팩트체크의 원칙을 지켜나가는데에 이러한 도구, 소프트웨어가 도움이 될 것임은 분명하다.


1) https://en.wikipedia.org/wiki/Fact_checking 
2) Graves, L. (2016). Deciding what's true: The rise of political fact-checking in American journalism. Columbia University Press.
3) http://eventregistry.org/
4) http://www.socialsensor.eu/
5) https://firstdraftnews.com/uk-real-time-factchecking/
6) http://get.trendolizer.com/
7) http://www.crowdtangle.com/
8) https://spike.newswhip.com/#/home
9) https://www.trendsmap.com/
10) https://gwu-libraries.github.io/sfm-ui
11) Kranzberg, M. (1986). Technology and History: "Kranzberg's Laws". Technology and Culture, Vol. 27, No. 3. pp. 544-560.

MBN
머니투데이
한국경제신문
한국일보
조선일보
아이뉴스24
SBS
YTN
중앙일보
뉴스1
아시아경제
매일경제
뉴시스
MBC
국민일보
동아일보
TV조선
KBS
세계일보
동아사이언스
JTBC
오마이뉴스
서울신문

언론사 배너를 클릭하시면, 해당 언론사가 검증한 팩트를 보실 수 있습니다.