지난 12월 9일 동국대 윈컴 정치커뮤니케이션 10주차 두번째 강의(20강)은 소셜미디어 전문가인 유승찬 컨설턴트로부터 빅데이터가 만드는 거대한 변화란 주제로 강의를 들었다. 유승찬 컨설턴트는 빅데이터가 내년 지방선거 정책공약에 민감한 과제로 떠오를 것이라 전망했다. 또 여러 다양한 매체들 중에서도 상대적으로 페이스 북이 영향을 크게 미칠 것이라 전망했다. 페이스 북을 활용하면서 너무 정치적인 이슈만으로 유권자들에게 접근하지 말고 자신의 숨김없는 라이프 스토리로 다가가는 것이 효과적이라고 설명했다. 아울러 텍스트 중심의 접근 보다는 사진이나 인포그래픽 같은 시각적 효과를 살릴 수 있는 자료의 활용이 중요하다고 강조했다.  

다음은 유승찬 커설턴트의 강의 전문이다.

빅데이터가 만드는 거대한 변화 (유승찬)

선거에 관해서 이야기를 해야 되는데 오늘 빅데이터와 SNS를 따로 강의를 해야 하지만 하나로 합치다 보니 이를 감안해서 강의를 하겠다. 빅데이터에 관해서 얘기를 많이 들어보셨을 텐데 빅데이터가 이번 지방선거의 정책공약에 굉장히 민감한 과제로 떠오를 전망이다. 정부 3.0 프로젝트를 본격화하고 있고 자치 3.0이라는 지방 자치단체 프로젝트를 진행하고 있다. 빅데이터에 대해 오늘 깊이는 못 들어가고 가볍게 설명하도록 하겠다. 지금 비가 오고 있다. 요즘에 ‘비’가 마케팅에서 본격적으로 활용되고 있다. 날씨와 마케팅의 상관성에 대한 데이터가 종합되어 파악되고 있다. 전국의 파리바게뜨 매장의 3년간 판매 데이터를 본사에서 집계하고 이 판매 데이터와 날씨와의 상관성을 연구했다. 빵집은 생크림을 만들기 때문에 재고가 남으면 버려야 하고 모자라면 못 판다. 날씨에 따라서 어느 빵이 많이 팔리는지를 분석해서 내일 아침의 판매지수를 본사에서 내려 보낸다. 예를 들어 내일은 소보루 빵이 20% 더 많이 팔리겠다고 예측해서 내려 보낸다. 요즘 날씨가 예전과는 다르게 조금 더 분석돼서 마케팅에 활용되고 있다. 이것이 빅데이터가 실생활에 활용되고 있는 하나의 예이다.

오라일리라는 유명한 정치 블로거가 있다. “아이젠하워 이후 라디오 없이 선거에서 승리할 수 없었고, 케네디 이후에는 TV 없이 선거에서 승리할 수 없었으며, 오바마 이후에는 SNS 없이 선거에서 승리할 수 없었다. 2012년 대선은 빅 데이터 없이 승리할 수 없는 첫 번째 선거가 될 것이다.” 이렇게 얘기를 했다. 그렇다고 이전 미디어들이 없어졌다는 것은 아니지만 새로운 미디어들이 영향을 미치기 시작했다는 것이다. 선거도 기업의 마케팅도 누가 당대의 미디어를 지배하는 지가 관건이다. 당대의 지배적 미디어가 무엇인가? 그것을 누가 장악하는가? 에 따라서 선거의 승패가 바뀐다. 선거와 마케팅에서 가장 강력한 지배적 미디어는 역시 입소문이다. 입소문은 어디서부터 비롯되는가? 이것이 핵심이다. SNS가 TV를 넘어섰다고 얘기하는 것은 아니다. 그러나 선거에 참여하는 유권자의 15% 이상 30% 가까이 SNS에서 정보를 얻고 있다는 보고가 있다. 그러면 TV나 일간지와 같은 전통적 미디어는 예전보다 상대적으로 영향력이 줄어드는 것이다. 그런 변화에 있고, 늘 새로 떠오르는 미디어가 그 시대의 지배적 미디어로 잡는다.

‘36320974’ 이 숫자는 올해 8월에 정보통신진흥원에서 발표한 스마트폰 보급 대수인데 불과 4년 만에 이루어졌다. 이렇게 세상의 변화속도가 빠르다. 전 세계의 25억 명이 스마트폰을 사용하고 있다. 스마트폰을 사용한다는 것은 사람들이 연결되어있다는 것인데 이분들이 그냥 연결되어 있지 않고, 무엇인가를 생산하기 시작했다. SNS를 통해서 사진을 찍어서 올리거나 글을 쓰면서 생산하기 시작했다. “25억 명이 생산자가 되는 시대” 이것이 빅데이터를 가능하게 한 시대적 배경이다. 이번 지방선거에서 디지털 캠페인의 3대 키워드를 빅데이터, 페이스북, 인포그래픽으로 잡았다. 빅데이터는 지방자치정부의 특히, 재난 안전을 비롯한 교통시스템에서 활용 빈도가 굉장히 높아 질 것이다. 여야를 막론하고 굉장히 창의적인 공약이 많이 쏟아질 것이라고 본다. 그리고 SNS에서 중에서도 유독 페이스북을 키워드로 잡았다. 지난 대선 이후에 트위터에 대한 신뢰도가 많이 떨어졌고 트위터를 떠난 사람들이 페이스북으로 대거 이동했다. 페이스북이 지금 제2의 전성기를 맞고 있다. 페이스북 사용자가 1200만 명이고 대부분 20~60대 사이의 유권자들이다. 우리나라 전체 유권자의 50%가 지방선거에 참여한다고 봤을 때 1200만 명이 가지는 비중이나 의미는 매우 클 것이다. 제가 지난 대선 때 담쟁이 포럼과 안철수 캠프에서 활동했었다. 우리에게는 미디어가 너무 많다. 기존의 미디어도 있고 새로운 미디어를 보게 되면 페이스북, 트위터, 홈페이지, 블로그, 카페 등 너무나도 많다. 이것들을 다하려고 하면 실패한다. 그래서 저는 적어도 광역이 아닌 기초단체장 이하 출마자들에게는 홈페이지를 권하지 않는다. 홈페이지는 굉장히 시대착오적인 미디어이다. 운영이 잘 안 되고 콘텐츠를 채우기도 어렵다. 후보가 유권자들 보고 찾아오라고 하는 것이 홈페이지다. 사람들은 트위터, 페이스북에서 놀고 있는데 절대 안 온다. 단지 SNS를 안 하는 분들도 있으니까 블로그는 결합해서 하라고 한다, 이것이 제가 올해 미디어에서 상당히 강조하는 부분이다. 여기에 나중에 카카오톡이나 다른 것도 해야 된다. 그 후보에게 맞는 전략적인 채널을 선택해야 한다. 요즘은 너무 많은 채널과 미디어가 있기 때문에 그 후보에게 맞는 채널을 선택과 집중을 해서 운영하는 것이 굉장히 중요한 포인트이다. 우리가 가만히 있어도 쏟아져 들어오는 것이 너무 많아서 그냥 말로 하는 것, 글로 쓰여 있는 것은 전혀 집중하지 않게 된다. 뭔가 시선을 사로잡을 수 있는 직관적인 것이 매개 되지 않으면 사람들이 다 지나친다. 이것은 지난 오바마 재선 캠페인이 이것을 입증했다. 소셜미디어에서 많이 퍼져나가는 콘텐츠 중 텍스트로 된 콘텐츠는 없다. 동영상 아니면 사진, 이미지이다. 그래서 이미지를 활용하는 것이 이번 지방선거에서 굉장히 중요한 포인트가 될 것이라 본다. 어디에선가는 후보자 얼굴이 사라진 공보물이 나올 가능성이 충분히 있다고 생각하고 있다.

빅데이터는 맥킨지 보고서에서 말하기를 “21세기 원유”이다 라고 했다. 빅데이터 시장이 형성되고 특히, 공공부문 예산의 20%를 절감할 수 있다고 예측을 했다. 제가 보기에는 정확한 예측은 아니다. 그리고 데이터를 분석할 수 있는 인력들이 필요하다. 빅데이터는 규모 면에서 엄청나다. 2013년에 인류가 생산한 데이터양이 2.7 제타 바이트 라고 한다. 1 제타 바이트는 4층짜리 건물에 하드를 꽉 채웠을 때 이 건물이 천 개쯤 되는 것을 말한다. 그러면 2,700개의 건물에 하드를 꽉 채워야 그 데이터를 수용할 수 있는 크기가 올해 생산됐다. 다음 개념이 요타바이트인데 미국의 한 개주 전체를 서버로 채워야 하는 규모이다. 우리가 상상하는 그런 정도의 규모가 아니다. 속도는 하루에 구글 검색창에 검색되는 검색어가 30억 개다. 페이스북에 들어와서 하루에 액션을 취하는 횟수가 30억 개다. 하루의 4억 개의 새로운 트위터가 생산되고 있다. 그리고 우리 주변에 CCTV 등 각종 센서에서 쏟아져 들어오데 이 데이터까지 포함하면 생산되는 속도는 어마어마하다. 그리고 굉장히 다양한 데이터들이 만들어진다. 빅데이터는 충분히 복잡하고 들쭉날쭉하고 어마어마한 데이터들을 얘기한다. 여기서 우리가 가치를 뽑아내는 일을 빅데이터라고 정의한다.

데이터 종류는 기업데이터가 있고, 그리고 거래정보, 공공데이터, 사회적 데이터가 있다. 여기서 공공데이터, 사회적 데이터는 선거와 관련된 분야이다. 그리고 사물데이터가 있다. 사물데이터는 언뜻 감이 안 올 것이다. 최근에 일본 과학자가 엉덩이 과학을 연구했다. 의자에 사람이 앉는 곳에 다양한 센서를 부착한다. 그렇게 되면 그 사람 고유의 엉덩이 하중을 인식할 수 있는데 이것이 지문보다도 더 다양한 것을 인식할 수 있다. 실제로 도요타에서 상용화하려고 준비를 하고 있다. 운전석에 사람이 앉으면 주인이 아닌 사람을 인식하게 하는 것이다. 그래서 주인이 아닌 사람이 앉으면 다른 것을 요구한다든지 그리고 운전습관에 따른 사고와의 관련성은 어떤지 그리고 사람이 피곤했을 때 엉덩이 하중이 어떻게 이동하는지 이런 것들까지 분석하는 사물 정보데이터들을 필요에 따라서 시프트해서 활용하는 이런 것까지 나아가고 있다. 지금은 모바일 인터넷 세계에서 생산되는 차세대 데이터를 사물데이터 정도로 인식하고 있는데 이것들이 활용되고 있다. 오늘은 공공데이터와 사회적 데이터를 중심으로 알아보겠다. 차세대는 인공지능, 사물정보통신이 빅데이터를 이끌 것이다. 지금 인터넷, 모바일이 이것을 이끌고 있다. 그래서 구텐베르크가 인쇄술을 발명한 이후 인류의 데이터가 2배가 되는데 50년이 걸렸다. 지금은 정확히 3년마다 인류의 데이터가 2배가 된다. 그래서 속도나 크기 면에서 엄청나다. 여기서 어떠한 가치를 뽑아낼 것인지 이러한 것들이 전 세계에서 연구를 하고 있다. 아주 쉽게 정리하면 “빅 데이터는 큰 규모를 활용해 더 작은 규모에서는 불가능했던 거시적 통찰이나 새로운 형태의 가치를 추출해 내는 일이다. 이 과정에서 시장, 기업 및 시민과 정부의 관계 등 많은 분야에서 변화를 가져오는 일이다.” 보통 많아지면 달라진다고 얘기를 하는데 인터넷, 스마트폰이 보급되면서 매우 많은 정보들이 생산되기 시작했고, 많은 것들이 쌓이기 시작해서 질적 변화가 시작되는데 이것을 빅데이터라고 보면 된다. 기존에 표본을 뽑아왔는데 표본이라는 것은 사회과학이나 자연과학은 학자가 가설을 세우고, 그것을 실험하거나 설문조사를 해서 일반화하는 과정을 거쳤다. 이런 학자들의 일반화 과정에서 매우 많은 오류가 발견됐다. 지금 여론조사의 경우에도 응답률 등에 의해서 오차가 매우 클 수 있다. 가령 1% 미만의 박빙인 지역에 ±2.5%인 여론조사가 과연 의미가 있는가? 오차율이 5%가 넘고 신뢰 수준이 95% 수준인데 이런 부분을 어떻게 보완할 것인가? 실제로 오바마의 경우에는 경합하는 11개 주 같은 경우에는 거의 전수조사를 했다. 실제로 표본을 3만 5천 명씩 늘려서 작업했고, 그리고 오바마가 수집한 데이터 프로그램을 통해서 하루에 2만 6천 건씩 수집을 해서 시뮬레이션을 했다고 한다. 그래서 오차율을 0.2% 이하로 떨어뜨렸다. 표본량에서 전수조사는 아니더라도 전수조사에 가까운 시대를 우리가 일반적으로 빅데이터 시대라고 한다. 이런 연구들을 많이 하고 있고 소셜미디어가 생기면서 정서가 자료화 되고 있다고 얘기를 한다. 가령 사람들이 책을 무슨 요일에 가장 많이 사는지는 알았지만, 무슨 요일에 책을 가장 많이 읽는지는 몰랐다. 그러나 지금은 알 수 있다. 트위터나 페이스북만 들여다봐도 사람들은 책을 화요일 가장 많이 읽는다. 그러나 사람들이 왜 화요일에 책을 가장 많이 읽는지 정확히 알기는 어렵다. 보통 추론을 할 수는 있다. 사람들이 주 5일제 시대에 주말에 체력이 강화돼서 사람들이 월요일에 술을 많이 마시고 화요일에는 새로운 일을 해봐야겠다고 생각해서 책을 펴든다. 그래서 화요일에는 책 읽는 이야기가 많이 올라온다. 사람들이 화장을 언제 가장 많이 고칠까? 직장인들이 가장 많이 화장을 고치는 시간은 오후 4시이다. 오후 4시에 화장실에서 30분 정도를 시간을 보내야 그 날 근무시간이 빨리 간다. 그래서 4시에 화장을 고치는 일이 가장 많이 올라온다. 밤 10시에도 올라오는데 그때는 사람들이 셀카를 찍는다. 이런 정서가 데이터가 된다는 것은 굉장히 새로운 것이다. 이것이 주식투자에도 사용되고 있다. 실제로 사회적 데이터를 분석해서 주식투자를 하는 전문 업체들이 생기기도 했다. 사람들이 기업평가를 잘해서 주식이 올라간다고 생각을 하지만 실제로 그렇지 않다. 가장 기본적인 것은 기분에 따라 주가가 많이 변동한다. 기분이 좋은 날에 주식을 많이 사고 기분이 안 좋은 날은 주식을 많이 판다는 것이다. 그러면 기분을 알 수 있는 언어를 찾아내는 것이다. 전 세계적으로 기분을 실시간으로 제공하는 회사도 있다. 불행하게도 한국어는 아니고 영어로 된 기분을 표현한 정보를 제공한다. 그래서 기분이 가령 우리 경제에 어떠한 영향을 미칠 것인가 이런 것들에 대해서도 이야기가 많이 되고 있다.

정서가 객관화되고 있는 정서가 자료화되고 있는 시대에 살고 있고 이것이 여론분석을 가능하게 한다. 기존의 여론분석 한계를 소셜미디어 분석을 통해서 바로잡을 수 있는 시스템들이 많이 개발되고 있다. 오바마 행정부는 ‘빅데이터 연구·개발 주도’를 선언했다. 미국은 중국이나 유럽에 밀릴 것은 같은 분위기를 빅데이터 시대로 다시 돌파하려고 하는 거대한 움직임을 보이고 있다. 그래서 빅데이터 분야의 산업 발전에 정부와 기업들이 나서고 있다. 대표적으로 구글의 경향 분석이 있다. 2009년에 신종인플루엔자가 전 세계를 덮쳤다. 인플루엔자가 퍼지기 2달 전 쫌에 논문을 발표했는데 아무도 주목하지 않았다. 인플루엔자가 발병하고 나서 주목을 하기 시작했다. 보통 질병관리본부에서 독감 환자를 예측할 때 보건소나 거점병원에서 독감 환자 범위를 보고를 받는다. 그래서 어느 지역에서 보고를 받는지 환자의 증가속도는 어떻게 되는지를 종합해서 발표하는데 선진국 시스템일 때 보통 2주가 걸린다고 한다. 그러나 전염병에서 2주는 매우 긴 기간이다. 그런데 구글은 2007, 2008년 미국 질병관리본부 자료와 구글 데이터의 상관관계에 대해서 분석을 했는데 독감과 관련된 4억 5천 번의 수학적 모델을 연구했고 그렇게 찾아낸 것이 독감을 예측할 수 있는 45개의 단어이다. 그래서 미국의 실제 데이터와 구글의 경향 검색데이터의 일치율이 97%였다. 그런데 구글의 검색은 실시간이다. 빅데이터에서 핵심은 무엇인가? 100% 정확하지 않아도 되고 원인이 무엇인지 몰라도 된다. 상관성에 따라서 어떤 가치들을 발견해 가는 작업을 하는 것이다. 지금 구글에서는 구글을 많이 사용하는 나라의 독감 예측치를 무료로 제공하고 있다. 그러나 우리나라는 빠져있는데 우리나라는 네이버를 너무 많이 써서 구글에 의미 있는 검색이 들어가지 않는다. 나라의 미래와 관련해서 다행인 것은 우리가 한글을 쓰고 있다는 점이다. 지금 영어권의 빅데이터 분석 발전은 정말 어마어마하다. 이분들이 정복하지 못하는 것이 한글이다. 전 세계 트위터 분석의 1위 업체인 라디안 6가 한국에 들어온 지 벌써 8개월이 지났지만 아직도 헤매고 있다. 아직도 한국어 검색은 한국회사들이 잘하고 있다. 그만큼 한글이 우리나라의 유일한 진입 장벽이다. 그래서 세종대왕께 고마워해야 한다.

이번 지방선거 가게 되면 서울시 심야버스 노선에 대해서 많은 얘기를 하게 될 거다. 서울시가 이번에 심야버스를 신설하면서 빅데이터 분석을 활용했다. 그래서 서울시가 한 달 동안 자정부터 새벽 6시까지 일어난 한국통신 통화기록 3억 건을 가지고 통화 발신지와 수신지의 상관성을 조사했다. 그리고 신용카드 한 달 치 사용기록을 조사해서 신용카드를 결제한 곳과 영수증 발송지의 상관성, 그리고 택시의 승하차 정보 등의 세 가지 데이터를 가지고 심야버스 노선을 결정했다. 노선만 결정한 것만 아니라 배차간격도 결정했다. 옛날 같으면 지역구 국회의원이 우리 동네 앞에 지나가게 해달라고 해서 실제로 노선이 결정되었다. 이것이 빅데이터가 행정 투명성을 높임으로써 전체적인 효율을 높인다. 그런데 교통관리 공단에서 양해로 하나의 노선을 추가로 넣었다. 버스 회사사장이 이 노선이 정말 정확하다고 빅데이터 분석과 상관없이 넣었다. 그런데 그 노선은 조만간 폐쇄된다고 한다. 이렇게 지방정부에서 대중교통뿐만 아니라 다양한 부문에서 빅데이터들이 활용하게 될 것이고 여기에 대한 정책 개발들이 많이 진행될 것이다. 지금 우리나라에서 빅데이터를 가장 잘 활용하고 있는 단체가 서울시를 정점으로 부산 해운대구, 광주 광산구청이 세계적 수준에서도 빠지지 않을 만큼 잘하고 있다. 지금 삼각 축을 형성하고 있는데 이것으로 어떻게 확산시킬 것인지 고민을 하고 있다.

소셜미디어에서 교통 분석만으로도 어떤 후보가 유리한지 알 수 있다. 이것들을 좀 더 나아가면 여론 조사 결과와 통합시켜서 분석해 낼 수 있는 도구들이 만들어질 수 있다. 제가 지난 대선 때 3700만 건을 분석을 했다. 그런데 박근혜 후보가 요즘에는 제가 잘 모르겠다. 국정원이 선거에 개입했다고 해서 어느 정도의 규모에서 어떻게 이루어졌는지를 잘 알 수가 없어서 자신을 할 수는 없다. 제가 본 데이터로는 박근혜 후보가 한 번도 문재인, 안철수 후보보다 밀린 적이 없다. 그리고 긍정어 비율도 문재인 후보가 27%, 박근혜 후보가 33%인 상태에서 선거를 치렀다는 것이 제가 분석한 데이터이다. 그리고 10월, 11월을 보게 되면 안철수, 문재인 후보의 긍정 어구가 동반하락 하면서 박근혜 후보의 긍정 어구가 44%까지 올라갔다. 이것은 단일화 과정에서 상처가 얼마나 많았는지를 보여주는 것이다. 단일화 과정에서 양 진영이 서로 싸우면서 서로 끌어내리는 동안 박근혜 후보는 상대적으로 프레임을 잘 세웠다. 단일화 과정에서 박근혜 캠프가 세운 프레임 전략이 이념 정치세력 vs 민생 정치세력의 대결이었다. 실제로 유세 과정에서 이러한 것들을 보여줬고, 이때 처음으로 이명박 전 대통령을 공격하면서 “노무현도 이명박도 민생에 소홀했다.”라는 메시지를 던졌다. 그래서 단일화는 정치 싸움이고 나는 정책을 만들어간다는 전략을 세워서 단일화 시기를 돌파했다.

최근 정치 관련 데이터들을 보면 노무현, 박정희, 북한 삼부자가 다 20위 안에 올라있다. 죽은 양쪽 정상 4명이 20위 안에 다 올라있다. “우리 민주주의는 죽은 사람들에 의해 운영되고 있다.”고 혹자는 이야기 한다. 그만큼 지금 과거와 이념의 갈등으로 일 년을 보냈다고 볼 수가 있다. 그리고 최근 데이터를 보면 국정원, 검찰, 경찰들이 정당들을 확실히 앞질렀다. 국정원이 검색어 횟수에서 새누리당의 5배 정도 된다. 그래서 정치가 실종되었고 국정원 공안 프레임 안에서 지금까지 정치가 운영됐다는 것을 객관적으로 확인할 수가 있다. 작년 총선 직후에 민주당 대표경선에서 김한길, 이해찬 후보가 붙었을 때 저는 섬뜩한 경험을 한 적이 있다. 김한길 대세론이었고 서울 선거만 남겨놓고 있을 때, 이해찬 대표가 질렀다.  박근혜 후보를 “악질적 매카시즘”이라는 표현을 써서 버즈량을 확 끌어올린 적이 있다. 그래서 그때 박근혜 후보보다 하루 버즈량이 이해찬 후보가 더 치고 올라갔다. 이것이 승부수였다. 선거에서 어떻게 2등이 승부수를 띄우는가? 이런 것을 보여준 사례이고 소셜미디어의 여론 버즈량은 여론조사의 선행지표로 활용된다. 소셜미디어에서 버즈량이 급히 상승하면 여론조사에서도 따라서 올라가는 선행지표로 활용될 수 있다. 이런 데이터는 이번에도 의미 있게 봐야 할 것이다. 19대 총선 때, 18대 총선 대비 투표율에서 트위터 활동이 활발했던 상위 30개 지역구는 11.36%가 올랐고, 트위터 활동이 저조했던 하위 30개 지역구 상승률은 5.39%였다. 그래서 트위터 활동과 투표율이 상관성이 있다는 것이 데이터로 보였다. 트위터 활동이 활발할수록 상대적으로 투표율이 높아진다고 볼 수 있다.

오픈 데이터는 Open Government의 전제조건이라고 얘기를 많이 한다. 오픈 저널리즘이 있다. 영국 가디언지나 뉴욕타임스가 요즘에 앞서서 시도하고 있다. 미국 하원의원 활동비 추문을 조사하는 과정이었는데 이 활동비가 부당하게 쓰이고 있다는 보도를 다른 언론에서 했다. 그래서 감시자가 특종을 놓쳐 약간 열이 나서 의원들의 458000여 건에 달하는 영수증을 검증하기 시작했다. 그런데 기자들이 검증할 수가 없으니 영수증 전체를 홈페이지에 올렸다. 그리고 독자들에게 검증을 요청했다. ‘스타터 리딩’이라고 해서 독자들이 의심이 갈만한 영수증을 골랐고 여기에 대한 심층 취재를 통해서 특종을 한 이러한 사례들이 오픈 저널리즘이라고 한다. 이처럼 정부데이터를 공개하게 되면 이러한 일들이 벌어진다는 것이다. 기존에는 통제했던 정보들을 데이터를 공개하면 데이터를 보고 여기서 의심이 가는 것들을 찾아내는 이런 작업들이 활발해질 것이다.

오픈 데이터 등 정부데이터의 문제가 올해 전 세계의 뜨거운 화두이다. G8에서 ‘오픈 데이터 헌장’이 발표되었다. 우리나라에만 있는 일이 아니고 전 세계적으로 오픈 데이터 운동이 벌어지고 있다. 정부데이터를 공개함으로써, 정부의 효율성과 투명성을 높이겠다는 것이 G8 정상의 얘기였다. 그래서 원칙은 국가안보나 사생활의 극심한 침해가 우려되지 않는 모든 데이터를 공개한다는 것이다. 또, 질과 양의 원칙이 있는데 양은 충분해야 되고 질은 우수해야 된다. 정부가 데이터를 공개했는데 도저히 무슨 말인지 이해할 수 없는 데이터라면 활용할 수가 없기 때문이다. 오픈 데이터와 관련해서 이번 지방선거에서 데이터 생산 시스템 자체가 쟁점이 될 수 있다. 그러한 공약을 내걸 수 있다고 본다. 가령 미국 같은 경우에는 쉬운 언어 쓰기 조례를 만들었다. 쉬운 언어를 써야 사람들이 데이터에 접근했을 때 어떠한 의미인지 알 수 있기 때문이다. 오바마 대통령은 쉬운 언어 쓰기를 법률로 제정했다. 어쨌든, 데이터 공개의 시대에 데이터는 알아볼 수 있는 형태로 기록되어야 한다. 이것이 대원칙이다. 그런 운동들이 우리나라에서 벌어질 수 있다. 가령 의약품의 설명서를 보면 복잡하고 어려워서 발생하는 손실액이 수천억 달러에 이른다는 보고가 있다. 실제로 약을 잘못 남용해서 벌어진 사고와 같이 여러 문제가 있다. 어떻게 쉽게 써나갈 것인가 이런 것들이 문제가 될 것이다. 다음은 누구나 이용할 수 있다는 원칙이다, 여기서 중요한 것이 정부데이터를 어떠한 플랫폼에 어떠한 방식으로 공개할 것인가 연구가 진행되고 있다. 미국이나 EU나 싱가포르 같은 경우에는 데이터를 분석할 수 있는 솔루션을 아예 홈페이지에 붙였다. 데이터를 수작업해서 분석할 수 없으니까 원활하게 분석할 수 있는 솔루션을 붙여서 사람들이 이 데이터를 더 폭넓게 활용할 수 있도록 하고 있다.

박근혜 정부도 G8 다음날 정부 3.0 계획안을 발표했는데 G8 발표와 비교해서도 전혀 손색이 없는 혁신적인 내용을 담고 있다. 이명박 정부 때부터 준비됐던 정책인데 박근혜 대통령이 받은 것인데 이것을 정확히 알고 받은 것인지는 알 수가 없다. 왜냐하면, 데이터 공개는 굉장히 철학적인 문제이다. 데이터를 통제하면서 특권을 누렸던 사람들이 있다. 고위 관리와 기업의 유착관계라든지 이것들이 사라지기 때문에 굉장히 신중하고 철학적으로 추진하지 않으면 성공하기 어렵다. 어쨌든 공공데이터를 전면 공개한다. 사실을 있는 그대로 원문까지 공개한다. 발표할 때 이러한 예를 들었다. 4대강 입찰정보가 어떻게 입찰되었는지 원문까지 다 공개하겠다고 했다. 이것이 실현되면 상당히 투명해질 것이다. 그래서 현행 31만 건을 1억 건으로 늘리겠다는 것이다. 국민 생활에 큰 영향을 미치는 정보나 대규모 예산이 투입되는 정보, 행정 감시가 필요한 정보를 다 공개하겠다는 것이다. 이것은 굉장한 것이다. 정부 예산이 1년에 400조 가까이 되는데 이 예산 내용을 다 알 수가 있고, 이 예산 내용을 다 들여다 볼 수 있는 전문가들이 필요할 것이다. 그렇게 되면 앞으로 국회의원이나 지방에서 정치하시는 분들도 이 데이터를 들여다 볼 수 있는 능력을 갖춰야 이 데이터를 더 효과적으로 활용하고 이것을 정책에 어떻게 사용할지를 연구해야 된다. 지금 전국의 자치단체를 돌아다녀 보면 교육을 굉장히 많이 하고 있다. 주요정책에 국민 참여를 보장하겠다고 박근혜 정부 발표에 포함되어 있다. 그런데 이 개념이 굉장히 어려운 개념이다. 오픈 플랫폼 정책이나 플랫폼 정부라는 것도 등장을 했다. 과연 실행될 것이냐 아직은 회의적으로 본다. 일단 예산이 부족하다. 새로운 무언가를 하기에는 어려운 상황이고 이런 것을 하기 위해서는 국회가 법률로 뒷받침해주어야 효율적으로 추진될 수 있는데 6월 27일 날 1차로 데이터 공개 법안이 통과되었다. 그다음에 후속적으로 제정되어야 하는 법률들이 많은데 제가 국회의원들을 10명 만나서 그 법이 통과되었는지 물어봤는데 그 법이 통과되었다는 것을 아는 사람이 한 명도 없다. 무엇인가에 도장을 찍기는 했는데 무엇에 도장을 찍었는지는 모르는 것이다. 이 정도로 데이터 공개 문제에 대해서 굉장히 후진적이다. 저는 정말 안타깝다. 제가 아까 4년 만에 세상이 스마트폰 세상으로 바뀌었다고 했는데 우리나라는 스마트폰이 다른 나라보다 일 년 늦게 들어왔다. 왜냐하면, 위치정보보호법이 통과가 안 돼서 늦었다. 1년 늦게 들어와서 열풍이 불었다. 그래서 네이버에 있는 개발자 반 이상이 나와서 앱 개발 회사를 차렸다. 그런데 성공한 사례가 없다. 그런데 일본은 어마어마하게 앱시장에서 성공을 거뒀다. 지금 1년은 상상도 할 수 없을 정도로 긴 시간이다. 지금 빅데이터 시대가 왔는데 우리가 지금 여기에 대해서 사회적으로도 공론화가 안 되고 국회에서는 잘 이해도 못 하고 있다. 이 상태가 지속된다는 것은 국가의 미래를 볼 때 굉장히 안타깝다. 통합 빅데이터 솔루션은 지금 정부 차원에서 용역을 주었는데 세 개 업체 컨소시엄으로 솔루션을 개발하고 있다. 법안을 조속히 처리해서 신성장동력으로 당장 15만 개의 일자리를 만들고 24조 원의 효과를 보겠다는 것이 정부의 방침이었다‘ 지금은 정부에서 이 이야기를 더는 하는 사람도 없고 새누리당도 그렇고 민주당도 마찬가지다. 단지 앞서 있는 지방단체에서는 많이 연구하고 있다. 우리나라 최초로 부산 해운대 구청에 빅데이터 분석팀이 만들어졌다. 그리고 광산구청 같은 경우에는 재난 안전 시스템에 대해서 빅데이터 분석을 시도하고 있다.

서울시는 심야버스뿐만 아니라 서울시가 안전사고로 배상할 경우가 생기는데 그 배상의 70%가 도로 패임에서 발생한다. 그런데 도로 패임이라는 것이 서울만 해도 굉장히 광범위해서 공무원들이 일일이 조사하는 것도 한계가 있다. 사고가 난 후에야 파악한다. 서울시가  버스에 센서를 부착하기 시작했다. 그래서 진동으로 도로 어디가 파였는지 위치정보 시스템과 결합해서 실시간으로 어느 지점에 어느 도로가 파였는지를 분석할 수 있는 시스템을 구축했다. 이런 시스템들을 이미 외국 도시들은 많이 활용하고 있다. 이런 안전시스템을 만드는데 빅데이터가 굉장히 많이 활용된다. 전 세계의 도시들이 데이터를 개방하고 있고 데이터 플랫폼 연구도 하고 있다. 의료, 복지, 교통, 물류, 세금, 기상, 안보, 일자리까지 전방위에 걸쳐 빅데이터 시스템을 도입해서 효과적으로 활용하려고 노력하고 있다. 대표적으로 한가지 예만 더 들겠다. Los Angeles와 같은 도시는 매우 큰 도시이다. 일 년 예산이 230억 달러다. 우리나라 예산의 60% 가까이 된다. 선진국일수록 복지 문제가 굉장히 중요한 과제다. 복지에서 가장 큰 문제는 부정수급자 문제이다. 최근에 이것을 빅데이터 분석을 통해서 찾는 시스템을 만들었다. 소셜네트워크 정보와 위치정보를 통합해서 부정수급자를 찾아내는 방법으로 아주 간단하다. 예를 들어서 일단 전 보육원을 데이터베이스하고 보육원생, 선생님, 원장의 데이터베이스를 비교 검토해서 일단 도저히 보육원이 있을 수 없는 위치에서 보육원 신고를 한 곳부터 찾아낸다. 또 보육원생으로 10년 전에 신고했던 사람이 다시 신고한 경우, 같은 것들을 추적해서 70%의 부정수급자를 적발했다. LA에서 개발된 이 시스템은 보육예산에서뿐만 아니라 다른 분야에서도 적용될 수 있다.

아마 이번 지방선거에서 많이 거론될 것이다. 실제로 안전행정부에 지방 자치 3.0 추진단이 있고 여기서 각 지방정부 단위로 우수사례들을 모아서 중앙정부 예산을 지원한다. 3.0 정책에 앞서 가는 단체들에 대해서 중앙정부 예산을 지원하는 성과보수 시스템을 만들었다.

오바마 대선 캠프의 참모들은 영국과 호주 등의 선거에 스카우트가 되기도 했다. 오바마 캠페인이 생산한 것이 빅데이터 선거였다. 데이터를 통합하고 분류해서 맞춤형 선거전략을 만들어내는 것을 잘했다. 이런 선거전략을 수출하게 되면 단지 선거를 수출하는 게 아니라 그 나라의 데이터를 알게 된다. 오바마 캠프의 ‘일각 고래’ 프로젝트는 기존의 유권자 데이터에 사회적 데이터와 다양한 데이터들을 통합시켜서 유권자 맞춤형 선거 전략을 진행했다. 1억 6천만 명의 유권자에 대해 유권자 자신이 알고 있는 것보다 더 많은 정보를 가지고 있었다. 그래서 이메일을 보내는데 그 이메일의 종류가 160가지로 분류가 되었다. 우리는 이메일을 한꺼번에 보내는 것도 어려워하지만 여기서는 160가지의 이메일을 분류해서 보냈다. 관심사에 따라서 이메일의 내용이 달랐다. 방송에서 종종 저에게 이런 질문을 한다. “작년 대선에서 우리나라의 빅데이터 활용은 어땠는가?” 저는 답한다. “데이터도 없었다.” 빅데이터 차원의 문제를 넘어섰었다. 저는 오바마 캠페인에서 두 가지 점을 주목한다. 하나는 이렇게 세상이 빨리 변화할 때는 방법적 새로움이 그 사람의 이미지를 결정할 수 있다. 빅데이터는 그러한 측면에서 굉장히 유용했다고 본다. 실제로 오바마 캠페인이 진행되는 동안 미국 언론이 오바마의 정책보다 오바마의 선거 방식 보도를 훨씬 더 많이 했다. 오바마는 이런 선거를 한다는 것이 거의 매일 보도가 됐다. 폴리티코라는 언론매체는 “2008년 선거가 SNS 선거였다면 2012년 선거는 빅데이터 선거였다”고 규정을 했다. 그런데 오바마 캠페인의 승인에 대해 캠프의 수장이었던 짐 메시나는 “전통적 캠페인과 디지털 캠페인의 융합이었다.”라고 얘기했다. 메시나는 “ 빅데이터 센터 운영과 집집마다 방문하는 것은 똑같이 중요했다.”고 애기한다. 이것은 굉장히 중요한데 왜냐하면, 트위터나 페이스북도 사람이 하는 것이다. SNS 조직과 기존의 전통적인 선거 조직의 전략적 교집합을 누가 만드는가? 사실은 오바마가 이것을 만든 것이 중요했다. 트위터 조직 따로 오프라인 조직 따로 가게 되면 별 의미가 없다. 왜냐하면, 오프라인에서 사람을 만나는 것은 굉장히 어렵다. 선거기간 내내 몇 번 만나기가 어렵다. 그러나 이 사람을 소셜미디어에서는 실시간으로 늘 소통할 수 있기 때문에 이 전략적 교집합을 누가 만들 것인가가 굉장히 중요하다고 본다. 결국은 선거는 한 표를 누가 더 받을 것인가 하는 싸움이기 때문에 그 표를 얻기까지 어떠한 과정을 거칠 것인가 고민을 해야 된다. 초반에도 말씀했지만, 트위터가 되었든 페이스북이 되었든 한 가지를 굉장히 집중적으로 이해하려 노력할 필요가 있다. 그래야 그것을 제대로 활용할 수가 있고 어느 하나의 미디어만 잘 활용해도 굉장히 효과가 크다. 왜냐하면, 지금은 우리나라 정치인들이 실제로 잘 활용을 못 하고 있다.

일단 트위터를 하든 페이스북을 하든 흥미가 있어야 된다. 우리나라 정치인들의 97%가 트위터를 한다. 18대보다 15~20%가 늘어났다. 그런데 그곳에서 설교하고 있다. 트위터는 소통의 미디어라고 얘기하지만 거의 다 설교만 하고 있다. 야권이건 여권이건 다 자기가 하고 싶은 이야기만 하고 끝이다. 그러니 트위터가 어떻게 확산이 되겠는가? 확산이 안 된다. 그런데 SNS에 들어오는 사용자들이 절대 그런 마음으로 들어오지 않는다. 이분들과 소통하는 법을 모르면 확장성이 굉장히 제한될 수밖에 없다. 그것을 알아가는 것이 중요하다. 어떤 콘텐츠들이 많은 반응을 얻는가를 보시면 비디오와 사진에서 많은 반응을 얻는다. 그런데 국회의원들은 사진, 동영상은 잘 안올리고 99%가 텍스트만 올린다. 그리고 여기에 링크 거는 것을 굉장히 좋아한다. 그러나 사람들은 링크 타고 잘 안 들어간다. 트위터나 페이스북이나 그 안에서 메시지를 전달하는 것이 굉장히 좋다. 사람들이 링크를 타기 시작하면 그것은 자기 것이 아니다. 그래서 메시지를 생산할 때 조금만 앞서서 세련되게 이미지를 결합할 줄 알면 더 효과적이다. 보통 남자분들이 화장실 변기 앞에 많은 문구를 보지만 잘 실천하지 않는다. 하지만 변기에 벌레 한 마리를 그려놨더니 99%가 앞으로 달려들어서 그 벌레를 조준하고 있다고 한다. 가령 무엇을 하라고 하는 것보다 유도하는 게 더 효과적이다. 특히, SNS는 더욱 그렇다. 이런 방식들을 사용해야 된다.

지난 6.2 지방선거 때는 SNS 사용률이 굉장히 낮았지만 영향력은 굉장했다. 지금은 SNS 하는 사람들이 많기 때문에 잘해야 한다. 대충할 것이면 안 하는 게 낫다. 왜냐하면, SNS는 자기를 알리는 공간이라고 생각하는데 치명적인 실수를 하는 공간이기도 하다. 특히, 술 좋아하는 분들은 굉장히 조심해 한다. 술 드시고 SNS에서 실수 한번 하면 선거가 끝나는 것이다. 그래서 하시려면 정말 제대로 해라. 대충 이것저것 다 하다 보면 아무것도 못 할 것이다. 그리고 실제로 SNS 인력도 좀 강화해야 한다. 전 세계에서 페이스북을 가장 잘 활용하는 회사는 스타벅스이다. 우리나라에 다양한 종류의 커피전문점들이 많은데 스타벅스는  특히, 여성들에게 좋은 이미지를 가지고 있다. “Happy to be here "과 같이 이미지 전략을 잘 활용하고 있다.

이제는 SNS 하는 것만으론 매우 불충분하고 잘해야 한다. 그리고 아까 전통적 미디어를 이야기했는데 우리나라 미디어들이 너무 진보, 보수 편 가르기가 많이 되어있다. 그래서 초반에는 미디어에 나가서 이름을 알리려 할텐데 시간이 지나서 선거일이 다가올 때쯤에는 정말로 SNS만 들여다본다. 대선후보들도 그랬다. 선거 막판에 가면 자기가 할 말을 전략적으로 잘 안 실어 준다. 자기 미디어를 얼마만큼 영향력 있게 잘 확보하고 있느냐가 중요하다. 특히 지방선거에서 기초단체로 가면 중앙언론이 영향을 미칠 수가 없다. 중앙언론에서는 수도권, 광역이나 접전지역이나 돼야 거론이 되지 기초단체는 별로 영향을 못 미친다. 그래서 지방선거에서 SNS가 더 중요한 미디어로 떠오른다. 자기를 알릴 방법이 별로 없고 지역 단위로 어떻게 조직을 구성할 것인가? 조직할 때, 늘 트위터 계정, 이메일 계정을 꼭 받아야 한다. 그것만 있으면 소통을 할 수 있다. 그래서 선택과 집중을 강조했고 전략을 써야 한다. SNS는 메시지 전달 능력은 기본적으로 있고 솔루션을 통하지 않더라도 여론분석을 할 수가 있다. 또한, 반응 체크도 할 수도 있다. 우리가 가지고 있고 통제할 수 있는 채널, 미디어를 어떻게 잘 활용할 것인가에 대해서 연구하는 것이 중요하다.

우리나라 사람들은 E-mail을 굉장히 소홀하게 생각한다. e-mail의 이용률이 아직도 트위터나 페이스북보다 훨씬 높다. 중요한 것은 지금 쓰고 있는 e-mail을 많이 확보하는 것이다. 보통 사람들은 많은 e-mail을 가지고 있지만 쓰고 있는 것은 하나이다. 지금 쓰는 e-mail을 어떻게 확보 할 것인가? 전화번호를 확보하기보다 훨씬 쉽다. 우리는 e-mail을 개인정보라고 생각하지 않는다. 자기 지역 유권자 e-mail을 많이 확보해야 한다. 그리고 어떠한 메시지로 소식지를 보낼지를 고민을 많이 해야 한다. 인지도와 호감도를 같이 상승하는 방법이 무엇이고 어떻게 일관된 메시지를 전달할 것인지 고민해야 한다. 지방선거 출마하시는 분 중에 트위터를 가보면 세상 온갖 만사에 다 반응하시는 분들이 있다. 정치 평론을 하시는 분들이 있다. 특히, 야권 출마자들이 정치평론을 상당히 좋아한다. 이것은 리더가 지녀야 할 자질을 잊어버린다. 적어도 지도자가 되려는 분들은 지도자가 되려고 하는 것에 맞는 메시지를 가져야 한다. SNS에서 어떠한 메시지를 가지냐가 굉장히 중요하다. 저는 전략적 교집합이라는 말을 많이 쓰는데 이것이 조직의 효과를 굉장히 키울 것이라고 본다.

제가 십계명을 만들었는데 오늘은 2계명까지만 말씀드린다. 첫 번째, 이야기를 만들어야 한다. 이것을 만드는 분과 만들지 않는 사람의 차이는 선거 후반부에 가면 극명하게 나타난다. 지방선거는 안보 프레임이나 정치 프레임은 잘 안 먹힌다. 6.2 지방선거가 천안함 사건 3개월 뒤에 있었다. 그래서 여당은 안보프레임으로 6.2지방선거를 하려고 했지만, 그때 터져 나온 게 무상급식이었다. 대통령은 국민들이 뽑기 때문에 국가의 안보도 중요하고 여러 가지 요소들을 고려해서 뽑는다. 그런데 지방자치는 주민이 뽑는다. 주민의 안전, 복지가 굉장히 중요하다. 실제로 성남시장이 김정은이 내일 쳐들어온다고 하는 것은 잘 안 먹힌다. 그래서 후보자의 이야기가 굉장히 중요하다. 후보자 이야기를 만들 때 솔직해야 한다. 장단점을 드러내는 것이 소셜미디어 시대에 그 사람의 매력을 더 돋보이게 하는 길이다. 자기가 아무리 잘났다고 장점만 있는 게 아니다. 그래서 우리나라는 자서전을 쓰면 재미가 없는 것이 다 잘한 이야기만 쓰고 잘 못한 이야기를 안 쓰니까 재미가 없다. 그래서 자기의 단점을 스토리화 할 수 있는 사람이 사람들에게 감동을 주는 것이다. 저는 역대 우리나라의 선거에 단 하나의 발언을 꼽자면 노무현 대통령이 권양숙 여사의 할아버지가 빨치산이라는 이야기가 나왔을 때 “그러면 마누라를 버리라는 말입니까?”라고 반문을 한 적이 있다. 이것은 굉장히 폭발력이 있었다. 이야기를 만들 때는 다 끄집어 내셔야 된다. 지금까지 찍었던 사진을 다 집어내서 후보자가 되시는 건 자기 삶을 돌아보는 과정이라 본다. 그것을 잘 하셔야 되고 그것이 자기가 솔직하고 자기에게 진실한 것이 유권자에게 더 영향력이 있는 것이다. 그것은 굉장히 중요하고 그것을 한번 해보는 게 좋을 것이다. 드러내도 괜찮은 약점은 드러내는 것이 스토리를 더 강화한다고 본다. 이러한 트윗이 가장 많이 퍼진다. 사진과 약간의 설명을 많이 만들어야 한다. 최근에 검색어 1위에 올랐던 ‘손학규의 대모험’이라는 트윗 계정이 있다. 손학규 대표가 독일에서 돌아오시고 나서 정치인 손학규를 완전히 패러디해서 정치인으로서의 권위주의를 완전히 탈색시킨 이야기들을 자주 볼 수 있다. 하루 만에 6,000명이 팔로우를 했다. 그리고 평균 리트윗이 300회가 넘었다. 그만큼 콘텐츠 자체를 화제를 불러일으킨 사례이다. 사람들에게 손학규를 다시 환기시키는 계기가 되었다. 이렇게 해서 장안의 화제를 불러일으키기도 했다. 물론 국정원 사태로 다시 묻히기는 했다. 제가 지난주에 소셜미디어를 보면서 굉장히 놀랬던 것 하나가 처음으로 여야대표가 버즈량이 10위권으로 올라왔다. 그러나 올라오자마자 다시 장하나 의원 사태가 터지고 또 급랭 되고 다시 국정원으로 흘러갔다. SNS에서 메시지는 굉장히 단순화하더라도 이미지와 메시지를 잘 결합하는 것이 중요하다. 물론 정치적 파이팅도 하고 정책적 접근도 하더라도 그것만 하면 사람들이 너무 지겨워한다. 사람들이 트위터를 팔로워하다가  탈퇴하는 이유 중 2위가 정치적 포스팅이 잦아서이다. 그러므로 살아가는 이야기도 좋고 고양이와 개를 키우시는 분들은 그런 사진으로 호감을 사고 정서적인 공감이 많이 감흥을 준다.

두 번째, 사진, 인포 그래픽, 동영상을 최대한 활용하라. 이것을 하시는 분들은 소셜미디어에서 다 성공할 것이라고 본다. 이렇게 강조하고 강조해도 또 텍스트만 올린다. 제가 민주당 의원들에게 강의도 많이 했는데 늘 하고 싶은 말이다. 그래서 이 인포 그래픽에 대해서 보시면 데이터로 이야기를 만들어서 디자인을 하고 SNS에 공유하는 것이다. 정치 캠페인의 데이터는 세 가지가 있다. 하나는 후보의 인생이 있다. 후보의 인생을 데이터로 생각해라. 인생을 어떻게 그래픽화 할 것인가? 사진이 있으면 사진도 좋고 없으면 그래픽을 만들어보라. 두 번째는 정책이다. 정책과제를 어떻게 정서적으로 접근할 수 있게 만들 것인가 고민해야 한다. 또 하나는 상대후보와의 비교나 혹은 경기도의 후보면 서울시와 비교를 통해서 데이터 몇 개의 비교를 통해 왜 우리가 서울시보다 부족하냐고 할 수도 있다. 그래서 경기도 미래의 자존심을 건드릴 수도 있다. 인포그래픽을 어떻게 활용해 나아갈 것인지 앞으로 지방선거 과정에서 중요하다. 좋은 이미지들을 많이 생산해서 유권자들에게 즐거움을 주는 선거가 되었으면 한다. 끝으로 바람은 촛불 하나는 꺼뜨리지만, 모닥불은 살린다는 말이 있다.

SNS 기사보내기

기사제보
저작권자 © 폴리뉴스 Polinews 무단전재 및 재배포 금지