日 금융사 테스트에서 경쟁사 압도
|
그럼 딥러닝이 기존 AI를 어떻게 변화시켰을까. 전통적인 방식의 AI는 입력한 규칙을 따르는 판단 기준 시스템이라 학습 데이터가 많을수록 정확한 출력값을 제공할 수 있다. 하지만 사전에 정의되지 않은 패턴이나 입력값을 정의하기조차 어렵다면 어떻게 할까. 신경망 수조 개가 결합된 형태로 구축된 딥러닝 알고리즘을 활용하면 데이터가 갖는 의미를 이해하지 않고도 풀어갈 수 있다. 그는 “딥러닝을 활용하면 게임 이용자 분석 말고도 회계, 총무, 법무, 재무 등 거의 모든 비즈니스 업무에서 자동화가 이뤄질 수 있겠다는 생각에 올거나이즈를 창업했다”고 말했다. 이 대표의 설명이 이어졌다.글로벌 회사에 왜 이런 검색 솔루션이 필요한가.기업은 매일 수많은 업무 자료를 쏟아낸다. 글로벌 시장으로 눈을 돌리고, 사업 영역을 확장하다 보면 문서 양이 상상을 초월한다. 체계적으로 자료를 정리할 틈은 당연히 없다. 지금 이 순간에도 워드, 엑셀, 파워포인트, PDF 문서가 수없이 생산된다. 문제는 제대로 정리하지 않으면 같은 업무를 반복하거나 기존 문서를 찾는 데 더 많은 시간과 에너지를 소모한다는 점이다. 기업 생산성도 떨어진다. ‘회사에 쌓이는 문서에서 답을 바로 찾아줄 수는 없을까’란 물음에서 시작됐다.데이터 학습이 결국 돈과 시간 싸움이란 얘기인가.기존 경쟁사들이 해온 방식이다. 수천, 수만 개 데이터와 데이터를 설명하는 레이블(label)을 같이 학습시켰다. 예를 들면 호랑이 이미지와 ‘호랑이’라는 설명을 같이 학습시키는 식이다. 결국 무지막지한 레이블링 작업이 남고, 사람이 편하자고 도입한 AI가 새로운 수작업을 떠안는 꼴이 된다. 데이터 레이블링을 외주업체에 맡기게 되지만, 빅데이터가 쌓이는 시대에는 그에 드는 시간과 비용을 감당하는 건 불가능한 일이다. 하지만 딥러닝 기법을 활용하면 데이터를 정제하는 과정 없이 바로 쓸 수 있다.딥러닝을 활용하는 건가.그렇다. 자기지도학습(Self-Supervised Learning)이 대표적인 예다. 레이블 없이 데이터 자체만으로 학습할 수 있는 딥러닝 기법이다. 예를 들어 사내 10만 건 이상의 이메일을 모아 중간 단어를 빈칸으로 바꾼 후 들어갈 단어를 맞히도록 하니 레이블된 데이터로 학습한 모델보다 나은 성능을 보여주었다. 데이터는 많지만, 레이블이 없을 때 자기지도학습이 진가를 발휘한다. 일본 미쓰이스미토모파이낸셜그룹의 테스트 결과에서도 별도의 레이블 작업 없이 검색 정확도 76%를 기록한 비결이다.다른 사례는 없나.한국 회사를 예를 들어보자. 회사 내부에 지역 은행이나 신용보증기금 같은 기관에 협조를 구하는 문서가 있다. 사내에서 이메일이나 문서를 주고받다 보면 신용보증기금을 ‘신보’로 축약해서 표현하는 경우가 많다. 신용보증기금뿐이겠나. 이렇게 축약어를 일일이 찾아 레이블 작업을 하지 않고, 회사 내부 모든 문서와 이메일, 가이드, FAQ, 규정 등을 통으로 학습시켜 신용보증기금과 신보가 같은 기관이라고 추론하도록 한다.한글 문서도 판독이 쉽지 않을 텐데, 주요 고객이 일본 회사다.교환학생으로 일본에 체류한 적이 있고, 일본 게임회사에서 일한 경험도 있어 익숙한 곳이다. 하지만 언어 때문에 일본 시장 문을 두드린 건 아니다. 올거나이즈에서 언어적 차이는 크게 중요하지 않다. 딥러닝 입장에서 일본어는 그냥 인식해야 하는 텍스트 중 하나일 뿐이다. 호랑이를 예를 들면 호랑이 이미지가 입력 벡터라면 ‘호랑이’라는 텍스트는 출력 벡터가 된다. 입출력의 벡터값이 빅데이터 속에서 패턴, 즉 행렬을 이루고 이를 학습한다. 이게 바로 텍스트를 벡터 공간에서 검색 가능한 영역과 대응해주는 딥러닝 자연어 처리 기술이다. 카이스트에서 자연어 처리 분야 석사학위를 받은 덕이 꽤 컸다. (웃음)일본어, 영어, 중국어, 한국어 등 총 4개 국어를 지원한다고 들었다. 그래도 언어장벽이 있지 않나.언어적 차이보다 업종별 도메인 날리지(domain knowledge, 전문지식)에서 오는 차이가 크다. 인지검색 결과도 업종별로 확연히 다르다. 물론 나라별, 회사별로 약간씩 문화 차이는 있지만, 기록 관리와 매뉴얼 문화가 철저한 곳이라면 그 어디라도 우리 솔루션이 통한다.올거나이즈가 두 번째 창업이다. 직장에 다닌 적도 있다.대학 졸업 후 2004년에 국내 굴지의 통신사에 공채로 입사했다. 여기서 가정용 AI 로봇을 만드는 TF 팀에 배치됐다. 당시 미국 아이로봇사의 청소로봇 룸바가 히트를 치면서 국내에서도 가정용 로봇 개발에 집중하던 때였다. 스마트폰도 없던 시절, 기획부터 하드웨어·소프트웨어 설계까지 3년간 정말 열심히 일했다. 하지만 글로벌 컨설팅사가 사업성이 없다고 평가하면서 시장에 출시도 못 해보고 무산됐다. 이때 깨달은 바가 커 창업에 뛰어들었고, 2009년 초 일본 게임회사에 취직해 낮에는 일하고 밤에는 창업 준비를 했다.일본에서 창업을 준비했다.그랬다. 일본 게임사에서 일하며 짬을 내 벤처캐피털 관계자를 만나고, 팀을 꾸리려고 그간 알고 지내던 일본인 친구에게도 합류를 권했다. 늘 그렇듯 법인조차 없는 상황에서는 설득이 쉽지 않다. 그러다 우연히 한국에서 만난 노정석 아블라컴퍼니 대표와 파이브락스를 공동 창업하게 됐고, 이후 올거나이즈 창업에까지 이르렀다.벌써 미국·일본·한국 기업을 고객으로 유치했다. 대응이 가능한가.가능하다. 우리 조직도 글로벌하다. 크게 두 조직 계열을 두고 있는데 개발팀의 경우 거주 지역에 상관없이 채용하고 있다. 몇몇 개발자는 인도, 캐나다, 미국, 제주 등에서 일한다. 온라인에서 만날 시간대만 정하면 된다. 영업 조직은 나라별로 배치할 수밖에 없다. 현재는 미국, 일본, 한국 등지에 현지사무소를 열고 기업 고객을 만나기 때문이다. 물론 고민도 있다.고민이 뭔가.소통 문제 아니겠나. 회사 공용어는 영어지만 직원들 국적이 워낙 다양하다 보니 속내를 다 털어놓지 못하는 직원도 있으리라. 처음에는 한 회의실에 6~7명이 모여 콘퍼런스콜(전화 회의)을 하거나 화상회의를 했는데 얘기에 아예 끼지 못하는 직원도 있더라. 그래서 모두 회의에 참여할 수 있게 했다. 외국어가 서툴러도 상관없다. 통역하면서 소통하는 한이 있어도 자유롭게 의견을 내도록 독려했다. 업무상 번아웃도 결국 정보 공유에서 소외됐다는 좌절에서 비롯된다고 믿는다.올거나이즈의 목표는 무엇인가.글로벌 도큐멘테이션(자료 문서화·체계화) 플랫폼이 되는 것이다. 인간이 생각하고 일해 얻은 결과물의 총체는 문서다. 영수증, 문서, 발표 자료, 메모, 공문, 보도자료 등 모든 것이 문서화돼 공유되고 거기에 담긴 지식이 축적된다. 기업을 비롯해 사회에 지식이 축적되고 정확한 정보가 공유될수록 우리 생활이 한층 더 윤택해진다고 믿는다. 단기적으로 보험·금융·제조·IT 분야에서 기업 내 전용 검색엔진과 콜센터 소프트웨어 시장만큼은 꽉 잡고 싶다.- 김영문 기자 ymk0806@joongang.co.kr