데이터의 홍수 속에서 기업에 돈 되는 정보를 도출해내는 ‘데이터 사이언티스트(Data Scientist)’가 미국에서 인기 직업으로 뜨고 있다. 인터넷 보급과 소셜 네트워크 서비스(SNS)의 확산 등으로 기업·정부 등이 수집하는 각종 데이터 양이 폭증하고 있지만 이를 분석할 인력은 부족하다.컨설팅 업체인 맥킨지 글로벌 인스티튜트는 2020년까지 미국에서 필요한 데이터 사이언티스트 등 전문 분석가가 14만~19만명이라고 전망한다. 데이터 매니지먼트 직종에는 150만명 이상이 필요하다. 통계조사 단체인 타보르 커뮤니케이션의 최근 분석자료에 따르면 미국에서 활동하는 빅데이터 관련 전문가의 수는 3966명이다. 이 중에서 최근 미국 기업이 애타게 찾는 데이터 사이언티스트는 822명에 불과했다.통찰력·호기심·커뮤니케이션 능력 필요기업에 전문 인력을 소개하는 오데스크 코프(oDesk Corp)에 따르면 데이터 사이언티스트의 올해 1분기 시간당 임금은 2년 전 같은 시기보다 522% 증가했다. 하버드 비즈니스 리뷰가 지난해 10월 특집논문으로 다룬 ‘데이터 사이언티스트: 21세기의 가장 섹시한 직업(Data Scientist: The sexist job of the 21st century)’의 예측이 현실화된 것이다. 하버드 비즈니스 리뷰는 당시 링크드인(LinkedIn)의 사례를 통해 데이터 사이언티스트의 중요성을 강조했다.링크드인은 서비스 초창기에 회원들이 다른 유저들과 인맥 맺기를 하는 데 서툴렀다. 소셜 네트워크 사이트로서는 큰 난관에 부닥친 상황이었다. 이 시기에 스탠퍼드대 물리학 박사 출신인 골드만이 상황을 바꿔놨다. 데이터 사이언티스트인 그는 링크드인 홈페이지에 ‘당신이 알 수도 있는 사람들(People You May Know)’이라는 메뉴를 신규 서비스로 추가했다. 대부분의 간부들은 프라이버시 문제를 우려해 이를 반대했다. 하지만 설립자인 호프만이 골드만의 의견을 받아들여 신규 서비스를 전격 실시했다.‘People You May Know’ 메뉴에는 ‘삼각 관계 (Triangle Closing)’의 원리가 적용됐다. 이 서비스는 서로 알고 있지만 링크드인 서비스에서 연결되지 않은 사람을 보여주기 위한 것이었다. 만약 A라는 사람이 B와 C를 알고 있다면 B와 C도 서로 아는 사이일 가능성이 크다. 골드만의 신규 서비스는 인터넷에서 큰 반향을 일으켰다.링크드인은 ‘People You May Know’ 서비스로 회원 가입이 급증하면서 세계적인 소셜 네트워크 사이트로 부상했다. 회원 수 1억3000만명을 넘기며 세계 최대의 프로페셔널 네트워킹 사이트로 자리 잡은 링크드인의 수닐 쉬르구피 인터내셔날 데이터 서비스 책임자는 “데이터 사이언티스트는 방대한 데이터를 수집하고 가공해 통계학자가 분석한 모든 영역의 일을 할 수 있는 뛰어난 인재”라고 말했다.다른 글로벌 기업에서도 데이터 사이언티스트의 활약이 눈부시다. EMC는 데이터 사이언티스트들로 구성된 애널리틱스 랩을 운영하며 마케팅 전략 수립에 활용하고 있다. IBM도 200여명의 수학·통계 전문가들로 구성된 데이터 특수팀이 500개 이상의 관련 특허를 취득하면서 미래 전략을 구축하고 있다.데이터 사이언티스트는 기존의 데이터 분석에서 한 단계 더 나아가 데이터에 대한 통찰력을 갖고 새로운 가치를 창출하는 일을 한다. 이들은 빅데이터를 구조화해 분석 가능한 자료로 만든 뒤 의미 있는 결과를 이끌어내는 것이다. 따라서 데이터 사이언티스트는 데이터 코드도 사용할 수 있어야 한다. 또 이 분야의 문외한인 마케팅 관계자나 의사결정권자들이 데이터 분석 결과를 쉽게 이해할 수 있는 커뮤니케이션 능력도 갖춰야 한다.통계학과 컴퓨터공학·수학·경제학·산업공학·심리학·핵물리학·신경의학·해양생물학 등 다양한 전공 출신들이 데이터 사이언티스트로 활동한다. 스탠퍼드대의 경제경영대학원 수전 애티 교수는 “수학과 통계학이 현대 경제의 영역 대부분에서 이처럼 중요해진 적은 없다”고 평가할 정도다. 데이터 사이언티스트는 새로운 가치를 만드는 일을 하기 때문에 이공계 분야뿐만 아니라 사회과학과 인문과학 등 다양한 분야의 전문성을 필요로 한다.이들이 다루는 빅데이터의 양은 이전 세대의 통계 전문가들이 다루는 데이터의 양과는 비교할 수 없을 만큼 큰 차이가 있다. 또 원하는 해결책을 도출하기 위해서는 광범위한 컴퓨터 암호도 만들어 분석한 데이터에서 회귀분석과 상관관계 분석, T검증 등을 통해 빅데이터 속에 숨은 일정한 패턴을 찾아내야 한다.1990년대 증시의 ‘퀀트’ 열풍 비견이런 측면에서 데이터 사이언티스트에게는 항상 ‘왜’라는 질문을 던지는 호기심이 있어야 한다. 문제의 핵심을 파악해 답을 찾으려고 검증 가능한 가설을 세울 수 있는 능력이 없으면 데이터 사이언티스트로 성공하기 어렵다. 이 같은 특징 때문에 이들을 기존에도 있는 데이터 ‘매니저’가 아니라 데이터 ‘사이언티스트’라고 부르는 것이다.빅데이터는 지난해 세계경제포럼에서 차세대 10대 기술 중에서 첫째로 선정될 정도로 중요성이 커졌다. ‘21세기의 원유’로 비유되는 빅데이터에 대한 의존도는 의학과 범죄예방·공중보건·정치·스포츠·에너지·광고 등 전방위로 확산되고 있다. 또한 의사결정을 위한 빅데이터 의존도가 더욱 커지고 있다.전문가들은 빅데이터가 기업의 매지니먼트에서 큰 축을 맡을 것으로 내다본다. 기술조사 업체 IDC에 따르면 2020년 한 해에 생산·복사·소비되는 디지털 데이터 분량은 4만 엑사바이트(40조 기가바이트)로 2005년 130엑사바이트에 비해 300배 넘게 급증할 것으로 추정된다.문제는 이 같은 방대한 양의 정보량을 분석해 기업이 필요로 하는 패턴과 전략을 세울 수 있는 데이터 사이언티스트를 쉽게 구할 수 없다는 점이다. 수요가 느는데다 졸업생들의 사회 진출을 돕기 위한 현실적 필요 때문에 미국 대학들은 데이터 사이언스 과정을 잇따라 개설하고 있다. 스탠퍼드대와 노스웨스턴대·콜롬비아대·뉴욕대 등이 데이터 사이언스 과정을 잇따라 만들거나 개설을 앞두고 있다.1980~1990년대에 뉴욕의 월스트리트에서 ‘퀀트(Quanti tative Analyst, 금융 데이터 분석가)’가 각광을 받자 대학들이 금융공학 관련 학과를 만든 것과 비슷한 상황이다. 하지만 데이터 사이언티스트의 시장수요가 퀀트보다 오래 지속될 것으로 보인다. 전문가들은 기업이나 국가의 정책 수립에 빅데이터의 활용이 더욱 커짐에 따라 데이터 사이언티스트의 중요성과 수요도 그만큼 높아질 것으로 본다.