People

[스타벅스코리아 1호 데이터 사이언티스트 차현나 파트너] 숫자가 아닌 인간의 언어로 스토리텔링 

 

완벽한 중립보단 확실한 방향성·목표가 중요... 특정 현상을 데이터로 설명할 수 있어야

▎사진:차현나
미국의 경영 전문지 하버드비즈니스리뷰(HBR)가 2012년 10월 ‘21세기의 가장 섹시한 직업, 데이터 사이언티스트’라는 기사를 내면서 이제 데이터 분석을 넘어 데이터 과학의 시대가 왔음을 알렸다. 링크드인의 DJ. 파틸과 페이스북의 해머배커가 자신들의 직업을 설명하기 위해서 ‘데이터 사이언스’라는 용어를 만들어낸 지 4년 만의 일이다. 하지만 데이터 사이언티스트가 무엇을 하는 직업인지 정확히 알고 있는 사람은 드물다. [데이터 읽기의 기술]을 쓴 스타벅스코리아의 첫 데이터 사이언티스트 차현나 파트너는 “(유통 등 일반기업에서) 데이터 사이언티스트는 스토리텔러”라고 말했다. 그는 이화여대 소비자심리학과에서 학사·석사를 했고, 2013년 같은 대학에서 소비자의 의식과 무의식이 다를 수 있다는 내용의 ‘명시적과 암묵적 브랜드 이미지에 따른 광고와 브랜드의 태모 및 적합도’ 논문으로 박사학위를 받았다. 글쓰기를 좋아하는 차현나 파트너는 신간에 들어간 일러스트도 모두 직접 그렸다. 지난 10월 말 홍대 스타벅스에서 첫 책을 내자마자 다음 책 집필을 시작한 그를 만났다. 먼저 기자가 아이스 아메리카노 톨 사이즈 한잔을 결제한 영수증부터 내밀었다.

책 내용 중에 영수증을 분석한 내용이 흥미로웠다. 이 영수증으로 기자의 소비습관을 분석할 수 있나?

“비회원으로 구매했기 때문에 한계는 있다. 만약 회원이었다면 과거 구매 이력과 함께 자세하게 분석할 수 있다. 평소에는 중구 사무실 근처 지점을 많이 갔다면 홍대에서 구매한 게 이례적인 일일 것이고, 항상 다양한 곳에서 구매했다면 미팅이 많은 사람이라고 추정할 수 있다. 회원은 구매 위치를 추적할 수 있다.”

데이터는 의사결정에 확신 줘

카카오뱅크 체크카드로 샀다고 나오는데, 이걸로 내 소득 수준이라든지 이런 것은 파악하지 않나?

“현금인지 해외 카드인지 정도만 남긴다. 해외 카드라면 외국인일 수 있구나 하고 추정하고, 해외 카드 사용자가 홍대점에 많이 몰린다면 외국인을 위한 메뉴 개발 등으로 이어질 수는 있다. 하지만 어떤 사람이 무슨 카드를 사용하는지까지 저장하지 않는다. 물론 카카오뱅크의 데이터 사이언티스트라면 우리 고객들이 어디서 어떻게 소비하는지 추적할 수는 있을 것 같다. 영수증 한장은 한순간에 해당한다. 여러 개의 영수증이 쌓여야 한사람의 소비패턴을 분석할 수 있다.”

남아공의 스탠드업 코미디언 트레버 노아는 미국에 와서 경제에 대해 물어보면 모르겠다고 대답하는 사람들이 야구 얘기를 하면 온갖 통계를 다 들면서 예측한다고 농담했다. 그런데 올해 프로야구 한국시리즈에서 우승한 두산 베어스의 김태형 감독은 한 인터뷰에서 데이터보다는 선수들을 관찰해서 의사결정을 한다고 말했다.

“데이터에 감을 더하는 것은 맞다. 이 영수증을 보면 왜 아이스 아메리카노를 샀는지 알 수 없다. 매장에 있는 직원은 더 잘 알 수 있다(실제로 기자가 주문할 때 땀을 많이 흘리고 있었다). 데이터가 없던 시절에도 잘 나가는 기업과 성공하는 사업가들은 소비자들을 잘 파악했다. 데이터는 감에 대한 확신을 준다. 하지만 시간이 흐르면서 이런 의사 결정권자들도 자신의 감, 결정이 틀리지 않을까 하는 의문을 가질 수 있다. 데이터는 의사결정에 확신을 준다.”

데이터 분석에서 시간의 변화가 가장 중요한가?

“시간은 모든 데이터의 연결고리다. 호텔 업계에서 특정 시기에 매출이 떨어진다면 그 시기의 뉴스, 날씨 등 여러 정보를 시간으로 연결할 수 있다. 그러면 이유를 알 수 있고, 어떻게 대처해야 하는지를 알 수 있다. 업계에서는 최소 2년 동안의 데이터는 쌓여야 예측이나 추정을 할 수 있다고들 한다. 그래야 덜 주관적이고 의미 있는 데이터 분석을 할 수 있다. 데이터를 잘 쌓아놓는 그룹사가 잘 되고 있다고 생각한다.”

어느 회사가 데이터를 가장 잘 활용하나?

“이름을 말하긴 그렇고, 예를 들면 그룹 통합 멤버십을 하는 곳이 계열사마다 만드는 곳보다 5년 후에 더 잘 될 것이다. 통합 멤버십은 개인정보 허가도 개별적으로 받는 것보다 효율적이고, 데이터가 담긴 통, 즉 서버를 통합할 수 있어 비용 절감도 된다.”

임원이나 내부 조직원들의 목소리를 듣는 게 데이터 분석을 하는데 오히려 방해가 되지는 않나?

“나는 그런 방향성이 반드시 필요하다고 생각한다. 이번에 낸 책을 쓸 때 가제가 ‘데이터의 목적’이었다. 사람들은 데이터 분석을 할 때 아무런 편견 없는 상태에서 굉장히 객관적인 결과를 낼 것이라고 기대한다. 그런 경우도 물론 있다. 하지만 데이터는 목적이 아니라 수단이다. 어떤 생각을 입증하거나 어떤 현상을 뒷받침하기 위해 데이터 분석을 하는 경우가 많기 때문에 방향성이 없으면 힘을 잃는 경우가 많다.”

매출 혹은 수익 등에 집중하자는 의미의 방향성인가?

“데이터는 돈을 벌기 위해 필요하다. 기업에서는 돈을 벌어야 하고, 그러려면 돈을 쓰는 사람을 이해해야 한다. 소비자가 어떤 상황에서 기꺼이 돈을 지불하는지를 이해하기 위해서 데이터를 분석한다. 기업이 소비자가 원하는 것이 이런 것이구나 하고 알아야 그에 맞는 제품을 만들 수 있다. 바로 그런 상품이 매출을 높여준다. 소비자, 시장을 이해하기 위한 것이 데이터다. 임원의 방향성이란 말은 이 숫자를 만들라는 지시가 아니라 지금 우리가 어떤 것을 시도했는데 안 됐다면 왜 그랬는지를 분석해보자는 식으로 목표를 정해주는 것이다.”

실제 사례를 들어줄 수 있나?

“데이터로 어떤 가설을 만들다기보다는 특정 현상을 데이터로 설명하는 것을 선호한다. 제주도에 있는 매장들 데이터와 다른 지역의 매장들 데이터를 분석하면 분명히 다를 거라고 생각하고 분석했다. 분석의 결과는 조각으로 나온다. 그런 조각들의 퍼즐을 맞추면, 소비자의 모습이 어렴풋이 보인다. 이런 모습인 것 같다고 결론이 나면 내부에 공유를 한다. 이 때 스토리텔링을 하는 거다. 우리가 제주도에서 이런 것들을 하면 소비자들이 좋아할 것이라는 식이다. 지금 제주도에서는 매 시즌 신제품이 나온다. 결과적으로 프로젝트가 성공해서 이런 일들을 계속할 수 있었다. 리저브 매장, 드라이브 쓰루, 외국인 상권 등의 주제로 데이터 분석 프로젝트를 계속할 수 있었다.

현장 파악하고 실무진 설득해야


그렇다면 데이터 분석이란 건 결국 스토리텔링인가?

“데이터 사이언티스트는 데이터 엔지니어, 데이터 애널리스트, 데이터 마케터 등의 역량을 조금씩 다 가지고 있어야 역량을 발휘할 수 있다. 만약 애플리케이션(앱)을 만들거나 자율주행차를 만드는 회사에서라면 곧바로 데이터 알고리즘을 만들면 된다. 즉, 기술이 실제 활용될 때를 알고 있어야 하고 이를 위해서는 데이터와 관련된 것들을 어느 정도는 다 알고 있어야 데이터 사이언티스트가 제 역할을 할 수 있다. 스스로 생각해서 분석을 하는 것과 특정한 데이터들을 뽑아주는 일은 다를 수밖에 없다.”

데이터계의 제너럴리스트, 스토리텔러라고 이해하면 되나?

“시장에서 데이터를 실제로 활용하려면, 시장을 알아야 하고, 비즈니스 감각이 있어야 한다. 실무진을 설득하지 않으면(데이터 분석 결과가) 시장에 나갈 수 없다. 내부를 설득해야 데이터가 실제 시장에 적용될 수 있다. 직접 설명하기도 하고, 내부 세미나를 통해서 실무진에게 인사이트를 주는 역할을 한다. 이런 과정이 없이 데이터를 분석하고 숫자 차트를 만드는 데 그치면 그 결과가 사장될 수 있다. 그래서 설득 과정이 중요하다. 내 경우에는 실제 매장을 방문하는 것을 좋아한다. 해외에 나가도 스타벅스 매장을 방문한다. 현장을 많이 보면 도움이 된다.”

과거에도 기업에서 이런 역할을 하는 사람들이 있었는데 이름이 데이터 사이언티스트로 바뀐 것인가.

“내가 학교 다닐 땐 물론 데이터 사이언티스트란 단어가 없었다. 시기에 맞춰 나왔다고 생각한다. 엔지니어, 애널리스트, 마케팅 등 데이터와 관련된 사람들이 자신에게 주어진 역할만 하면 됐던 과거와는 달리 스마트폰이 나오면서 모든 게 달라졌다. 스마트폰은 오프라인과 온라인을 연결해준다고 생각한다. 과거에는 웹사이트에서 접속한 이력과 같은 데이터들을 확보할 수 있었지만, 오프라인에서는 데이터를 모을 방법이 영수증밖에 없었다. 지금은 스타벅스의 경우 사이렌 오더라든지 멤버십 등을 이용해서 데이터를 쌓을 수 있게 됐다. 유동인구도 과거에는 사람을 눈으로 다 셌다면, 이제는 통신사나 카드사 등에서 이 지역에서의 전파의 양으로 사람 수를 추정을 할 수 있게 됐다. 오프라인의 실제 상황으로부터 데이터를 생산하는 양이 기하급수적으로 늘어났다. 이제는 데이터를 연결하는 게 중요해졌기 때문에 데이터 사이언티스트가 부각됐다. 데이터를 인문학 등 여러 가지와 연결해서 사람의 언어로 설명해주는 사람들이 필요해진 것이다.”

6~7년 전 해외에서 데이터 사이언티스트를 만나서 얘기를 해봤는데, 굉장히 쉽게 설명하고, 빠르게 결과물을 냈다. 그런데 지금도 어떤 데이터 사이언티스트들의 말은 전혀 이해할 수가 없다.

“나도 대학원 랩이나 연구소에 있으면서 신뢰도가 어떻고 하는 얘기를 많이 하던 때가 있었다. 내 주변의 모두가 다 알고 있는 단어로 대화를 해왔기 때문에 별 문제를 못 느꼈다. 그런데 언젠가 외부 미팅을 나가서 쉽게 설명을 한다고 했는데, 상대방이 특정 단어를 이해하지 못하는 경우가 있었다. (어떤 단어였나?) 회귀라는 단어였다. 단어는 모두 알테니까 어렵게 나온 결과를 쉬운 표현으로 바꿔야겠다는 생각만 했지, 회귀라는 단어를 설명할 거라고는 생각을 못 했었다. 그 이후부터는 스토리텔링을 좀 더 쉽게 하려고 노력했다. 데이터를 인간의 언어로 전환을 해야 실제 의사결정을 하시는 분이 결정을 할 수 있겠구나 하는 생각을 했다.”

누구와도 쉽게 소통해야

스토리텔러로서의 데이터 사이언티스트는 모든 기업에서 동일한가?

“그렇지 않다. 일반 IT 기업에서는 다르다. 데이터로 알고리즘을 만들면 곧 제품으로 나오는 회사에서는 스토리텔링이 필요 없다. 하지만 한번 환산을 해야 제품이 나오는 일반 기업에서는 스토리텔러가 필요하다. 그리고 내가 아는 데이터 사이언티스트들은 모두 말을 잘 한다. 데이터가 어떤 함의를 가지고 있는지를 잘 설명할 수 있는 사람이 좋은 데이터 사이언티스트다. 누구와도 쉽게 소통이 되야 한다.”

데이터 분석이 정교해지면서, 동전의 앞뒷면처럼 개인정보 보호에 대한 논쟁도 거세지고 있다.

“아무리 데이터 분석이 정확해도, 자연인 차현나에 대해서는 기업들이 모를 수 있다. 그리고 찾아본 상품의 광고가 뜨거나, 어떤 물건이 다 떨어질 때가 됐으니 사라는 식의 권유를 하는 것을 받아들이는 데도 개인차는 있을 수 있다. 뭐가 틀리다 맞다고 말하기는 힘들다. 앞으로는 점점 더 진화하게 될 텐데, 그럴수록 개인정보 데이터가 유출되지 않게 사전에 보안 이슈를 철저하게 하는 기업이 더 경쟁력을 갖추게 될 것은 확실하다.”

차현나 파트너가 책을 쓴 계기는 데이터 사이언티스트라는 직업이 회자되면서 주변 사람들로부터 받는 질문이 폭증했기 때문이기도 하다. 한 변호사 친구는 부동산 통계를 분석하고 싶은데 무엇부터 배워야 하냐고 물었다. 차 파트너의 대답은 “먼저 목적부터 파악하라”는 것이었다. 그는 “자신이 프랑스 사람을 좋아하게 돼서 러브레터를 쓰고 싶은 상황에서 프랑스어를 처음부터 배우겠다는 식의 접근법은 더디고 지치는 일”이라고 풀어 말했다.

- 한정연 기자 han.jeongyeon@joongang.co.kr

1509호 (2019.11.18)
목차보기
  • 금주의 베스트 기사
이전 1 / 2 다음