데이터, 미래의 권력이 되다
소비자의 행동을 예측하는 시대가 온다 볼륨배지시즌배지

Written by 장병탁  고유주소 시즌2 / Vol.19 브랜드의 미래 (2011년 02월 발행)

“만약, 구글이 전 세계에 존재하는 모든 종교를 통합하여 새로운 신을 만든다면 어떻게 될까?” 이 글의 시작은 바로, 이 발칙한(?) 상상에서부터 시작되었다. (물론 구글로부터 확인한 바는 전혀 없지만) 이것이 실제가 된다면, 사람들은 구글신에게 무엇을 원할까? 자신의 소원을 이뤄달라고 빌지 않을까? 그런가 하면 모든 신이 그렇듯 구글신은 인간에게 무엇을 바랄까? 혹, 구글신 십계명이 생기지 않을까? 결론까지는 내리지 못했으나, 우리가 얻은(?) 것은 머지 않은 미래에 인간의 행동을 예측할 수 있는 ‘무언가’가 등장하리라는 몇 가지 (그것도 확실한) 단서였다. 그 단서의 단초는 지금 이 순간 당신이 구글을 비롯하여, 페이스북, 트위터 등에 당신 스스로가 ‘자발적’으로 입력 혹은 저장한 데이터다. 좀 더 정확히 말하면, 인간의 뇌를 탐하는 인공지능(AI, Artificial Intelligence) 컴퓨터가 그 데이터를 해독했기 때문이다. 그렇다면 본론은 이것이다. 만약, 인간의 행동을 예측 가능한 그 무언가가 생겨나는 미래, 브랜더와 마케터는 지금 무엇을 준비해야 할 것인가 말이다. 우리는 먼저, 인간의 행동패턴을 분석하는 하나의 방법론인 복잡계네트워크를 연구하는 경희대학교 물리학과 박주용 교수와 AI 컴퓨터를 연구하는 서울대학교 컴퓨터공학과 장병탁 교수를 만나보았다. 과연, 구글신이 가능할 것이라고 생각하냐는 질문으로 포문을 열었다.

The interview with 서울대학교 컴퓨터공학과 교수 장병탁, 경희대학교 물리학과 교수 박주용

 

 

구글신은 과연, 가능하다고 보는가?
장병탁(이하 ‘장’) 우리가 알고 있는 것보다 인공지능 컴퓨터는 이미 우리의 삶 곳곳에서 쉽게 접할 수 있다. 가장 단적인 예로 아마존 사이트에만 접속해 봐도 예전에 내가 샀던 책들을 분석해서 내가 좋아할 만하다고 생각되는 책들을 추천해 주지 않나. 이것이 모두 인공지능 컴퓨터 덕분이다. 컴퓨터는 끊임없이 진화한다. 다시 말해, 만약 나에 대한 정보를 10개 알고 있다면 나에 대한 분석 정확도가 떨어진다.

 

그런데 그것보다 100배의 데이터를 가지고 있다면 그만큼 분석 정확도는 높아진다. 컴퓨터는 끊임없이 데이터를 모으고, 분석하고, 학습하며 진화하고 있을 뿐만 아니라 네트워크를 통해서 각각 연결되어 있다. 그렇기 때문에 구글신은 가능하다. 물론, 이론상으로는 말이다.

 

박주용(이하 ‘박’) 사람은 상황에 따라 다르게 행동할 것 같지만, 실은 규칙성 있는 행동을 한다. 그러니까 일정한 패턴이 있다는 것이다. 각 사람의 행위들을 시간 좌표 위에 올려놓으면 행위 네트워크를 만들 수 있다. 그렇기 때문에 각 사람에 대한 데이터만 있다면 그 사람의 행동에 대한 예측은 80% 이상 가능하다. 게다가 요즘은 특정인이 아니라 일반인들이 페이스북, 트위터 등에 자신의 일상을 과감히(?) 올린다.

 

이러한 아주 구체적이고 세세한 데이터까지 다 모을 수 있다면 각각의 사람들이 어떤 규칙과 법칙을 가지고 행동하는지 파악이 가능하다. 그러니까 각 사람에 대한 충분한 양의 데이터를 모을 수 있다는 전제 하에 구글신은 가능하다.

 

 

어쨌든, 구글신은 있을 법 하다는 것. 이것이 가능한 이유는 이 두 가지 때문이다. 인간의 행동에는 패턴이 있고 그 패턴을 분석할 수 있는 데이터가 있다는 것. 무엇보다 중요한 점은 이러한 패턴을 분석할 수 있는 데이터는 이제 기하급수적으로 늘어나고 있다는 것이다. 그런데 장병탁 교수와 박주용 교수는 이런 말로 끝맺음을 했다.

 

“분명 인간은 규칙적인 패턴을 가지고 움직인다. 그런데 불확실성의 영역이 있다. 불확실성의 영역은 패턴에서 벗어나 있다. 그렇기 때문에 중요한 것은 이 불확실성의 영역에 있는 것까지 얼마나 예측할 수 있는가, 이다.”

 

예를 들어, 출근길은 대부분 동일한 패턴을 보이는데, 어떤 날은 커피가 마시고 싶어 샛길로 빠질 수 있다. 그렇다면 패턴에서 이탈하게 된다. 이것이 바로 불확실성의 영역이다. 이러한 불확실성의 영역에 있는 것들을 분석하기 위해서는 데이터 속에 숨겨진 ‘의미’까지 파악해 내야 한다.

 

 

자, 본론은 이제부터다.

 

 

인간의 뇌를 탐하다, AI(Artificial Intelligence)

1997년 5월 7일, 뉴욕 맨하튼 51번가의 에쿼터블센터 35층. 이곳에서는 전 세계인의 관심을 한몸에 받고 있는 체스 대회가 한창 진행 중이었다. 선수는 3살부터 체스 신동이라 불리며 22세에 세계 최연소 체스챔피언이 된 게리 카스파로프와 IBM에서 만든 슈퍼 컴퓨터인 딥블루였다. 결과는 (알고 있다시피) 딥블루의 승! 이 대회는 20세기 가장 인상적인 사건으로 기록되며 인간의 영역을 넘보는 똑똑한 컴퓨터의 출현을 예고하는 시그널이었다.

 

실제로 《특이점이 온다》의 저자 레이 커즈와일이 1985년 그의 저서에서 “1998년이면 컴퓨터가 인간을 능가할 것”이라고 전망한 것보다 1년을 앞당겼다. 사실, 카스파로프는 1초에 2개의 수를 생각할 수 있지만, 딥블루는 1초에 2억 개의 수를 생각할 수 있다. 어쩌면 해보나마나 한 게임이었는 지도 모른다. 그런데 중요한 것은 바로 전 해인 1996년에 치러진 게임에서는 카스파로프가 보기 좋게 딥블루를 이겼다는 데에 있다. 단 1년 만에 딥블루는 체스에 관련한 데이터를 모두 분석, 조합하며 진화한 것이다.

 

수많은 데이터를 통해 인간의 행동을 예측하는 연구는 현재, 어느 정도까지 진행되고 있나?
잘 알려진 바와 같이 구글은 사람들이 검색어로 입력한 ‘독감’이라는 단어를 통해 ‘구글 독감 동향(Google Flu Trends)’프로그램을 만들었다. 이 프로그램은 실제로 미국질병통제예방센터보다 2주나 빠르게 독감 발생 경보를 알아냈다. 이것은 *데이터 마이닝 기법 중의 하나인 텍스트 마이닝 기법이라고 하는데, 실제로 데이터 마이닝 기법은 현재, 각 기업에서 트렌드 분석을 할 때 가장 많이 활용되는 기법 중의 하나다.

 

텍스트 마이닝은 하루에도 수 백 개씩 발표되는 논문을 쉽게 살펴볼 수 있도록 하기 위해 개발된 것인데, 요즘은 마케팅의 기법으로 사용되고 있다. 인터넷에 올려진 컨텐츠들을 분석해서 특정 지식의 연관관계를 분석해 보고, 이 컨텐츠의 발생 경향을 분석하여 트렌드를 예측하기도 한다. 특히 요즘은 페이스북이나 트위터 등에 올려진 정보를 수집하여 현재 사람들이 가장 관심있어 하는 것이 무엇인지 쉽게 살펴볼 수 있다. 이미 미국의 유명 시장조사기관인 가트너는 미래에 주목해야 할 기술 4위로 이러한 소셜 미디어 분석을 꼽기도 했다. 그러나 아직은 초보적인 수준이다. 인공지능 컴퓨터가 얼마나 발전하느냐에 따랐다.

 

지금 우리 연구실에서 재미있는 실험을 한 가지 하고 있다. 스마트폰에 센서 칩을 장착하고 10초마다 한 번씩 로깅하게 했다. 이 센서 칩은 GPS는 물론이고 사람의 움직임까지 기록할 수 있으며, 심지어 내가 있는 공간의 조도까지 측정할 수 있다. 또 소리까지 기록한다. 이렇게 10초 단위로 기록을 할 경우, 예를 들어 하루에 내가 구글에 몇 번 접속했는지부터 언제 어디에 있었는지, 야외에 있었는지 실내에 있었는지, 거기에 보폭이 큰지 작은지 등 아주 세세한 것까지 측정이 가능하다.

 

생각해보라. 이러한 데이터가 계속 쌓이면 내 삶의 패턴 분석이 가능해진다. 패턴이 분석되면 나의 삶에 대한 실질적인 예측이 가능해지는 것이다. 그럼, 아침에 눈을 떴을 때 컴퓨터에 접속하면 각각의 사람들에게 그날 하루에 대한 실질적인 예측을 해줄 수 있다. 만약, 컴퓨터가 사람의 기분과 감정 상태까지 해독할 수 있다면 이러한 예측은 더 예리하고, 정확하며, 면밀할 수 있다. 현재 수많은 연구소에서 인간의 목소리 혹은 표정으로 *감정 상태를 파악할 수 있는 컴퓨터가 연구되고 있으니 이런 미래를 머지 않아 곧 만나게 될 것으로 보인다.

 

 

구글 독감 동향은 '독감'이라는 검색어를 분석하여 독감 발생경보를 예측한다.

 

  

* 데이터를 해독하다, 데이터 마이닝
데이터 마이닝은 수많은 데이터 간의 숨겨져 있는 유용한 상관관계를 발견하는 것이다. 비단, 발견하는 데에만 그치는 것이 아니라 미래에 실행 가능한 정보를 추출해낸다. 데이터 마이닝 기법 중 가장 많이 사용하는 방법 중의 하나가 텍스트 마이닝인데, 텍스트 마이닝은 정형화되지 않은 수많은 텍스트 사이의 상관 관계를 분석하여 카테고리화를 하거나, 혹은 각각의 텍스트를 연결해 가상지도를 그려봄으로써 패턴을 찾고 의미를 분석해보는 것이다.

텍스트의 경우 대부분 단순한 데이터처럼 명확한 정보가 아니라 주관적인 의견이 대부분이기 때문에 이러한 것들 사이의 유의미한 상관관계를 분석해보는 것은 그리 쉬운 것은 아니다. 이러한 텍스트 마이닝 기법은 최근 마케팅에서 많이 활용되고 있다.

텍스트 마이닝으로 소비자들을 분석하는 SAS의 데이비스 부회장은 “트위터나 페이스북의 관계망을 분석해 소비자 가운데 다른 소비자에게 더 높은 영향을 미치는 사람을 찾아내는 것이다. 예를 들어 또래집단에서 인기가 좋은 청소년을 찾아 타깃 고객으로 정하면 마케팅 효율이 훨씬 높아진다”고 말하면서 “지금까지의 통계 분석이 과거를 바탕으로 현재 무엇을 해야 하는지 파악하는 데 중점을 뒀다면 앞으로의 통계 분석은 현재 일어나는 일을 바탕으로 앞으로 무엇을 해야 할지 결정하는 데 도움을 줄 것”이라고 말했다.

 

 

* 난 당신의 기분을 알아요, 감성 컴퓨터
<퓨처파일》의 저자 리처드 왓슨은 “감정을 지닌 인공지능 컴퓨터는 비교적 가까운 미래에 등장할 것이다”라고 말하면서 “운전자의 감정 상태에 따라 더욱 강화된 안전 시스템을 작동시키는 자동차, 사람의 감정을 정밀하게 읽어내는 컴퓨터, 목소리를 분석하여 그 사람이 거짓말을 하고 있는지를 정확하게 파악하는 음성 인식 시스템, 우리가 슬플 때 기분이 좋아지는 방송 프로그램을 내보내는 텔레비전이나 라디오 등을 이제 곧 당신의 집에서 볼 수 있게 된다”라고 말했다.

실제로 영국 케임브리지대학에서는 사람의 표정을 인식하고 그것을 통해 사람의 감정을 읽어내는 컴퓨터를 개발했다. 실험 결과 비교적 감정 표현이 분명하게 드러나는 배우들에 대해서는 85%의 정확도로 감정을 읽어 냈고, 일반인들에 대해서는 그보다 조금 낮은 65%의 정확도로 읽어 냈다. 리처드 왓슨의 이야기가 실재가 된 것이다.

 

 

사실, 인공지능 컴퓨터라 하면 SF 영화를 떠올릴 수밖에 없다. 현재의 인공지능 컴퓨터는 어느 정도까지 개발되어 있는가?
얼마 전 미국 캘리포니아대학에서 스타크래프트 인공지능 토너먼트가 열렸다. 흥미로웠던 것은 이 토너먼트는 사람과 컴퓨터와의 대결이 아닌, 인공지능을 가진 컴퓨터끼리의 대결이었다는 것이다. 또 미국 스탠퍼드대학에서 얼마 전 무인자동차를 하나 선보였다. 이 무인자동차 안에는 센서와 인공지능 컴퓨터가 들어 있었는데, 센서를 통해 들어오는 데이터를 컴퓨터가 분석하여 경로를 열어가는 방식으로 모하비 사막의 험준한 사막 지형을 완주하는 기록을 세웠다. 이미 혼다자동차도 앞 차와의 거리가 급격히 좁혀지면 스스로 속도를 줄이고, 운전자의 조작없이 차선을 벗어나면 스스로 차선 한가운데로 주행방향을 조절하는 시스템을 실용화하지 않았나.

 

그런데 이것은 매우 빠른 정보처리를 통해 계산 결과를 도출하는 과정을 더욱 빠르고 정확하게 만드는 것일 뿐이다. 그러니까 엔지니어링일 뿐이다. 테크닉적인 부분을 통해 똑똑한 기계는 얼마든지 만들 수 있다. 그러나 정말 인공지능이라고 하면, 인간처럼 ‘*생각하는 컴퓨터’다. 이러한 컴퓨터의 개발은 아마도 시간이 더 필요할 듯하다.

 

 

 

 

* 빠른 것이 전부가 아니다, 인간의 뇌를 모방하다. AI컴퓨터
미스터 왓슨. 얼핏 들으면 젠틀하고, 똑똑한 남성 쯤으로 생각할 수 있을 것이다. 그러나 이것은 젠틀한 지는 모르겠으나 어쨌든 똑똑한 컴퓨터다. IBM에서 개발한 왓슨은 현재 최고의 지능을 자랑하는 AI 컴퓨터다. 왓슨이 주목을 받는 이유는 여태까지의 인공지능 컴퓨터와는 그 수준부터가 다르기 때문이다. 다름 아닌 미국의 유명한 퀴즈쇼 중의 하나인 제퍼디 우승자들과 비공식적 경기를 통해 높은 승률을 보이고 있기 때문. 제퍼디는 질문이 암시적이고 복잡한 게 특징이다.

예를 들어 이 쇼에서는 “브로콜리와 비슷한 흰색 채소는?”이라는 질문 대신 “폴란드에선 브로콜리의 친척 뻘인 칼라피오르(콜리플라워의 폴란드어)를 먹는다”는 문제를 낸다. 그러면 사람들은 ‘콜리플라워’가 정답인 걸 금세 알아채지만, 제 아무리 인공 지능 컴퓨터라 해도 이것은 유추해내기가 힘들다. 그러나 왓슨은 사람이 지식을 학습하듯 백과사전과 신문·잡지, 교과서와 소설 등을 읽는다. 거기에 사람이 지식을 쌓듯이 읽은 내용을 스스로 분류한다.

예를 들어 ‘채소’는 ‘배추’나 ‘콜리플라워’와 연관이 있는 단어임을 통계적으로 추론하는 것이다. 이렇게 분류된 지식을 이용해 몇 가지 답안을 만든 뒤 각 답 안의 정답확률을 다른 지식과 비교해 계산한다. 더 재미있는 것은 확률이 높을 경우 왓슨은 기계장치를 작동해 버저를 누르고 확률이 낮으면 멈칫거린다는 것이다. 그러나 아직 왓슨은 AI 컴퓨터의 궁극인 ‘생각’하는 것에는 못 미친다. 생각하는 컴퓨터를 실현시키기 위해서는 인간의 뇌 구조에서 일어나는 창발 현상을 재현해내지 않으면 안되기 때문이다.

 

 

마이크로소프트에서는 인간의 기억을 모두 저장하는 이른바 ‘마이라이프비츠 프로젝트’를 하고 있는 것으로 알려져 있다. ‘토탈리콜(Total Recall)’이 실제가 될 날이 얼마 남지 않은 듯 하다. 이러한 개개인의 데이터가 많이 모인다면 구글신은 실제로 ‘신’이 될 수도 있겠다.
여기서 바로 중요하게 보아야 할 것이 있다. 24시간 인간의 모든 것을 기록해둔 이 수많은 데이터가 한 인간의 아이덴티티인가이다. 그것은 아니다. 그야말로 데이터일 뿐이다. 만약, 내가 페이스북에 지속적으로 “아, 바람 쐬러 가고 싶다”라고 썼다고 하자. 만약 이 데이터를 분석할 때 텍스트를 그대로 분석한다면 아마도 나는 ‘여행을 좋아하는 사람’으로 분류될 수 있을 것이다.

 

그러나 실상은 전혀 다른 의미, 극단적으로는 ‘가기 싫다’라는 정반대의 의미일 수도 있다. 사실, 컴퓨터는 A라는 ‘인풋(Input)’을 주면 A라는 ‘아웃풋(Output)’을 내놓도록 설계되었다. 그러니까 컴퓨터는 스스로 무언가를 만들지 않는다는 것이다. 그런데 사람은 다르다. A라는 인풋을 주었을 때 어떤 아웃풋을 내놓을지는 100% 예측할 수는 없다. 복잡계 네트워크에서는 이것을 비선형(non-linear)이라고 하는데, 이러한 비선형적인 관계들을 정확하게 분석하려면 인간의 뇌와 비슷한 구조의 컴퓨터가 있어야 하는 것이다.

 

사람들이 혼동하는 것이 있는데, *인간의 뇌와 컴퓨터의 구조가 비슷하다고 생각하는 것이다. 그러나 전혀 다르다. 단순하게 말해, 컴퓨터는 빠르고 정확함을 추구하는 도구지만, 인간의 뇌는 그렇지 않다. 반면 연상을 하며, 그러한 연상들이 모여 창발(emergency)이 일어난다. 따라서 진짜 구글신이 신이 되려면 뇌가 인지하고, 지각하고, 학습하는 구조로 컴퓨터가 동일하게 설계되어야 한다.

 

스위스 로잔공대와 IBM이 공동으로 연구하고 있는 ‘블루진 프로젝트’라는 것이 있다. 인간의 뇌의 구조를 컴퓨터로 설계해보는 프로젝트인데, 쥐의 뇌를 작은 로봇에 연결하여 어떻게 움직이는지를 관찰한 다음, 이것을 그대로 복제했다. 2005년부터 시작된 이 연구는 현재까지 생쥐의 대뇌 신피질에서 일어나는 작용을 세포 단위로 복제했다. 이 연구가 성공할 경우, 뇌의 뉴런에서부터 신경 네트워크까지 모델링하여 뇌의 동작을 시뮬레이션할 수 있게 될 것이다.
그럴 경우 인공 뇌를 만들 수 있으며, 결국 인간이 어떻게 인지하고, 지각하고, 학습하는지에 대한 비밀을 알게 된다. 현재 우리도 이러한 컴퓨터를 개발하고 있는 중이다. 이른바 ‘상상하는 컴퓨터’인데, 먼저 실험자에게 여러 편의 영화를 보여 준 후, 나중에 영화 장면을 보여주면서 그 장면에 맞는 대사를 적게 했고, 반대로 대사를 보여주면서 그에 맞는 장면을 기억하게 했다.

 

우리는 이 상황에서 발생하는 뇌의 움직임을 모방하여 프로그램을 만들어 컴퓨터에 적용시켰다. 이 실험은 다름 아닌 컴퓨터로 하여금 스스로 연상작용을 하게끔 하는 실험이다. 현재의 진행 상태는 컴퓨터가 80% 정도 연상작용을 통해 정답을 맞추고 있다는 것이다. 이처럼 컴퓨터 스스로가 정말, 지각하고 인식하는 능력이 생긴다면 아마도 그때에는 정말 구글신이 신이 될 수도 있을 것이다. 그러나 중요한 것은 많은 시간을 요한다는 것이다.

 

 

수많은 자동차 브랜드에서는 무인자동차를 만드는 것에 총력을 기울이고 있다.

 

 

* 너무나도 다른, 컴퓨터 vs. 뇌
컴퓨터는 디지털식으로 한 번에 하나씩의 연산을 (혹은 몇 개의 적은 단위로) 빠르게 처리한다. 반면 뇌는 디지털과 아날로그 기법을 함께 쓰는데, 연산은 보통 신경전달물질 등의 기제를 통해 아날로그 식으로 (연속적으로) 처리한다. 뉴런들의 계산 속도는 너무나 느리지만 중요한 것은 뇌 전체가 병렬 처리 구조를 가진다는 것이다. 무수한 뉴런들이 동시에 각자의 작업을 수행하기 때문에 결과적으로 한 시점에 최대 수백억 가지의 계산을 처리하는 셈이 된다. 이러한 병렬 구조는 패턴 인식 능력의 핵심이고, 패턴 인식 능력은 바로 인간 사고 능력의 중심이다.

그러나 뇌와 컴퓨터의 가장 다른 점은 ‘창발적 속성’이다. 인간의 지적 행동은 카오스적이고 복잡한 뇌 활동으로부터 창발적으로 생겨나는 것이다. 따라서 오늘날의 AI 컴퓨터 연구는 바로, 뇌 구조를 최대한 모방하는 정보연산 및 연결구조를 구축하는 것이다. 그런 의미에서 IBM의 블루진 프로젝트가 사람들의 관심을 받는 것이다. 이 프로젝트가 성과를 달성할 경우, 진정한 의미의 인공지능 컴퓨터의 탄생을 눈앞에 목도하게 되기 때문이다.

 

 

데이터를 분석하는 인공지능 컴퓨터가 등장하는 미래사회를 어떻게 바라보는가?
긍정적인 측면을 바라본다면, 아주 단순하게 말해 불필요한 수고는 줄 것이라고 생각한다. 생각해보면 내비게이션이 생기면서 초행길을 가기 위해 드는 번거롭고, 불편한 것들이 모두 줄었다. 대신 초행길을 가더라도 내비게이션의 안내에 따라 운전을 하며 창밖을 볼 수도 있고, 음악을 들으며 사색에 잠겨볼 수도 있는 시간이 생기지 않았는가. 또한 컴퓨터가 할 수 없는 영역이 훨씬 더 늘어날 것이라 생각한다. 철학적인 영역과 예술과 같은 창조적인 영역말이다.

 

그런데 만약, 인간의 뇌를 닮은 컴퓨터가 개발이 된다면 이마저도 컴퓨터의 영역으로 넘어갈 수 있다. 즉, 뇌신경 네트워크의 발달 과정에서 창발하는 성질들을 이해하고 그 메커니즘을 해독할 수 있는 컴퓨터라면 단순한 행위 예측 뿐만이 아니라 결정권을 가질 수도 있기 때문이다. 소설에 나오는 구글신처럼 말이다. 그렇기 때문에 지금의 학자들이 생각해야 하는 것은 바로, 그 경계선을 긋는 일이다.

 

이 소설을 읽으면서 들었던 생각인데, 나도 소설 속의 존처럼 만약 내 행동 패턴을 예측할 수 있는 컴퓨터가 만들어져서 나에게 오늘 무언가를 하라고 얘기했을 때, 과연 이것이 나를 향한 최선의 것인지 아니면 그저 확률적으로 가장 좋은 것인지 점점 생각해보게 될 것 같다. 결국, 인간의 자아는 점점 더 강해지지 않을까.

 

 

데이터로 세상을 지배하는 사람들, 뉴머러티Numerati
The interview with 서울대학교 산업공학과 교수 조성준
뉴머러티라는 말은 아직, 생소한 말이다. 숫자로 세상을 지배하는 사람들에 대해 좀 더 설명해달라.
정확한 데이터 분석을 통해 미래를 예견하고 예측하는 사람들이라 할 수 있다. 단순히 이럴 것이다, 가 아니라 명확한 근거 자료를 통하여 미래의 실행 가능한 것들을 예측해주는 것 말이다. 이것은 마케팅에서 뿐만이 아니라 근로자의 생산성을 높이는 것, 유권자의 부동표가 어디에 있는지, 질환의 발병 시기는 언제인지, 심지어 테러리스트가 어디에 숨어 있는지까지 예측할 수 있다. 이런 것이 가능하게 된 것은 다시 말하면 ‘데이터’ 때문이다. 컴퓨터와 인터넷의 등장으로 모든 것이 저장 가능해졌기 때문에, 분석하고 해독하는 것 역시 가능해진 것이다. 물론, 이러한 데이터 마이닝 기법을 성장시킨 것은 인공지능 컴퓨터다.
실제적으로 데이터 마이닝 기법은 브랜드에서 어느 정도 사용되고 있나?
은행이나 통신사 쪽의 브랜드에서 주로 활용해왔다. 왜냐하면 이러한 브랜드에서 사람들의 데이터를 모으기가 가장 용이했기 때문이다. 만약, 새로운 플래티넘 카드가 출시되었다고 하자. 출시 후 한달 동안 이 카드를 사용한 사람들이 10만 명이고, 이 카드가 목표로 하는 사용자는 100만 명이라고 하자. 그렇다면 나머지 90만 명을 모으기 위해 어디에 타깃을 어디로 두어야 하는지부터 알아보아야 할 것이다. 과거에는 이 10만 명을 성별, 나이, 직업, 사는 곳 등으로 분석했다. 그래서 40대 남성으로, 강남 지역에 살며, 기업의 중역 등으로 생각했다. 

그런데 이제는 10만 명의 데이터들의 상관관계를 분석하는 데이터 마이닝 기법을 통해 10만 명에 대한 좀 더 정확한 패턴과 관계를 찾아낼 수 있다. 예를 들어, 이들은 일주일에 두 번 영화를 보며, 격 주로 골프를 즐기고, 한 달 동안 카드 결제가 가장 활발하게 이루어진 곳은 외식업인데, 외식 중에서도 일식이며… 이렇게 분석이 되면 타깃으로 바라보아야 할 대상이 넓어지고, 또 깊어진다. 이번 학기만 해도 석박사 졸업생들이 카드사로 스카우트 됐다. 공대 석박사들을 카드사에서 콜링하는 이유가 무엇이겠나. 그만큼 데이터의 분석이 곧, 미래라는 것을 오랜 경험을 바탕으로 알기 때문이다. 외국에서는 이미 데이터 마이닝 기법이 많이 활용되고 있지만, 아직 우리나라는 초기 단계다.

 


 
만약, 이 데이터 마이닝 기법을 통해 브랜딩을 좀 더 잘 할 수 있는 산업군은 어디라고 생각하는가?
내가 요즘 주목하고 있는 곳은 리테일retail 쪽이다. 리테일 분야만큼 라이프스타일이 분명하고 명확하게 드러나는 곳이 없다. 아주 간단한 예로, 어떤 소비자가 1년 내내 콜라를 사다가 몇 개월간 계속해서 다이이트 콜라를 산다면 다이어트 중임을 쉽게 분석해낼 수 있는 것처럼 소비자들이 어떤 물건을 어떤 시간적 간격으로 사느냐에 따라 취향을 비롯하여 심지어는 월급이 얼마인지 조차 유추해낼 수 있다. 거기에 스마트 카트까지 등장한다면 어떻겠는가?
 
실제로 미국의 액센추어 연구소에서 개발한 스마트 카트는 현재 미국의 마트 체인점 중의 하나인 스톱앤드숍에서 시험 중이다. 이 스마트 카트는 센서 칩 컴퓨터를 달고 있는데, 마트를 방문한 소비자가 스마트 카트에 자신의 고객 카드를 긁으면 카트에 장착된 모니터에 “어서오십시오, OOO 님!”하며 친절한 멘트가 뜬다. 그리고 그의 그간 쇼핑 목록을 분석하여 현재 필요한 상품을 보여준다. 그 상품 중 소비자가 어떤 상품을 선택하면 스마트 카트에 달린 GPS가 그 상품이 있는 곳까지 친절하게 안내한다. 

심지어 그가 자주 애용하던 와인이 오늘 특별 세일을 하고 있다면 세일 정보까지 모니터에 띄워준다. 생각해보라. 현재 어떤 소비자에게나 안겨주는 쿠폰과는 전혀 다른 방법의 마케팅이다. 실제로 연구에 따르면 소비자는 자신이 사려는 목록의 11%를 잊어버린다고 한다. 그런데 이미 데이터 마이닝 기법을 통해 나의 쇼핑 목록을 나보다 더 친절하게 안내해주는 마트가 있다면 그곳에 가지 않겠는가.
데이터 마이닝 기법을 통해 브랜드가 소비자와 지금보다 훨씬 더 친밀한 1:1로 만날 수 있는 계기가 될 것 같다.
그렇다. 만약, 햇반을 사는 소비자가 있다면, 햇반을 사는 이유는 전부 다르다. 어떤 사람은 캠핑을 위해, 어떤 사람은 비상 식량으로, 또 어떤 사람은 혼자 사는 사람으로 버리는 밥을 줄이기 위함일 수도 있다. 데이터 마이닝 기법을 통해 이러한 유형의 사람들을 각각 구분한다면 그 사람에게 맞는 맞춤 마케팅을 진행할 수 있다. 그런가 하면, 브랜드 쪽에서는 충성도가 있는 소비자인지 그렇지 않은 소비자인지도 단번에 알 수 있다. 실제로 각각의 통신사에서는 소비자들의 데이터를 분석하여 다른 통신사로 이탈할 소위, 이탈 순위를 매겨 놓았다. 이렇게 할 경우 각각의 충성도에 따라 전혀 다른 방법으로 소비자에게 다가갈 수 있다.

 


 
브랜드들이 이 데이터 마이닝 기법을 활용하면 미래에 어떻게 성장할 것이라고 생각하는가?
소비자 분석법으로 FGI를 자주 사용한다. 그런데 사람들은 절대, 말과 행동이 일치하지 않는다. 말이라는 것은 현재의 자신의 모습이 아닌 그저 ‘이상’을 따를 뿐이다. 데이터 마이닝은 인간의 행동을 연구하는 것이다. 행동만큼 정확하며, 실제적인 것이 없다. 그러니까 행동으로 드러난 것이 바로 정답이라는 것이다. 만약 같은 산업군의 브랜드가 있는데, 어떤 브랜드에는 데이터 마이닝 팀이 있고, 어떤 브랜드에는 없다고 하자. 십년 후는 전혀 다를 것이다. 소비자들은 전자의 브랜드를 훨씬 더 친밀한 브랜드로 인식하고 있을 것이다.

 

 

유니타스브랜드 문의

About Us

찾아오시는 길

교육, 컨설팅, 제휴 문의

  • 070-5080-3800 / ahneunju@stunitas.com