Tech

이창수 올거나이즈 대표 

문서 속 ‘답’ 찾아주는 인공지능 

사용자가 질문하면 문서에서 답을 찾아주는 인공지능(AI) 기술을 개발한 스타트업이 있다. 끊임없이 문서를 생산하는 기업이 주요 고객이다. 기존에는 키워드를 좇았지만, AI가 텍스트로 된 모든 것을 읽어내면서 검색 과정이 확 줄었다.

▎올거나이즈는 올해 3월 한·미·일의 기존 투자자로부터 1000만 달러(약 110억원) 규모의 투자를 유치했다. 이번 투자로 누적 투자금은 약 1500만 달러를 기록했다. 올거나이즈의 인지검색 솔루션은 한국의 KB증권· 현대카드·스마일게이트, 일본의 미쓰이스미토모파이낸셜그룹 (SMBC)·카오·일본전력개발(J-Power)뿐 아니라 미국의 트래블러스(Travelers) 등 글로벌 기업 100여 개에서 사용 중이다. / 사진:올거나이즈
의외의 분야가 있다. 기업 내 전용 검색엔진(Enterprise Search)과 콜센터 소프트웨어 시장이 그렇다. 큰 기업이라면 이런 문제는 자체 소프트웨어로 뚝딱 해결할 것 같지만, 실상은 그렇지 않다. 글로벌 시장 조사기관 리서치앤드마켓은 지난해 기준으로 관련 시장 규모가 38억 달러(약4조4000억원)에 달하고, 2027년이면 80억 달러에 이를 것이란 전망을 내놨다. 현재 미국과 일본이 최대 시장인데 IBM과 아마존(켄드라)이 거의 독점하다시피 한다.

IBM의 아성에 도전한 한국 스타트업 올거나이즈가 있다. 일본 미쓰이스미토모파이낸셜그룹(SMBC)이 실시한 검색 정확도 테스트에서 글로벌 기업을 앞서며 존재감을 드러냈다. 올거나이즈의 인공지능(AI) 인지검색 솔루션은 별도 학습과정 없이 76% 정확도를 기록했고, 2주 동안 사내 문서 4000건을 학습해 정확도를 93.4%까지 끌어올렸다. 기존 솔루션은 초기 정확도 40%대에 머물렀고, 학습 기간도 1년이나 걸렸지만, 정확도는 90%를 간신히 넘겼다. 입소문이 퍼지자 SMBC를 비롯해 일본전력개발(J-Power), 카오 같은 중후장대 기업이 올거나이즈의 문을 두드렸다. 매출도 지난해에 이어 올해도 3배 이상 성장을 점치고 있을 정도로 입지를 빠르게 다지고 있다.

日 금융사 테스트에서 경쟁사 압도


▎올거나이즈의 인지검색 답변봇 ‘Alli(알리)’ 서비스 소개 이미지.
인지검색 솔루션이 뭘까. “AI로 자주 묻는 질문(FAQ), 매뉴얼 등 비정형 문서에서 직원 혹은 고객의 질문에 대한 답을 자동으로 찾아내는 솔루션입니다. 예를 들어 2020년 바뀐 규정에 따라 사무실을 공사할 때 고려해야 하는 사항이 있는데 바뀐 규정이 뭔지부터 검색하려면 시간이 오래 걸립니다. 정확한 답인지도 모르죠. 콜센터 직원은 더 난감할 따름입니다. 매 시간 고객이 질문을 쏟아내는데 회사 문서를 일일이 검색해야 합니다. 맞는 답인지는 나중 문제죠. 틀리면 곧바로 항의가 빗발칩니다. 우리는 AI가 질문과 답변을 만들어 스스로 학습용 데이터를 만들게 하고, 학습해서 답을 찾게 했습니다.”

지난 8월 13일 진행한 언택트 인터뷰에서 이창수(42) 올거나이즈 대표가 이렇게 설명했다. 현재 미국 샌프란시스코에 있는 그는 “사무실 직원은 통상 하루 8시간 근무 중에 2.5시간을 정보 검색에 쓴다는 시장조사업체 결과가 있다”며 “콜센터만 해도 AI가 FAQ, 매뉴얼 등을 학습해 간결한 답변을 보여주면서 상담사 1인당 처리 건수가 3배 이상 늘었다”고 덧붙였다. AI가 질문과 답변이 갖는 연관성을 정밀하게 판독하고 머신러닝(기계학습)으로 정확도를 높인 셈이다. 이 기술을 기반으로 현재 올거나이즈는 임직원 AI 비서, 문서업무 자동화, 고객 서비스 자동화, 리뷰 자동 분석 등 총 4개 부문에서 기업 솔루션을 제공하고 있다.

이 솔루션들은 다 이 대표의 경험에서 얻은 지혜의 소산이다. 그는 대기업에 다니다 스타트업을 창업해 미국 글로벌 기업에 인수돼 수석부사장(Senior Vice President)까지 올랐다가 다시 창업에 뛰어든 연쇄창업가다. 한국과학기술원(KAIST) 전산학과 자연어 처리 연구실 석사 과정을 밟던 이창수 대표는 박사, 연구원으로 이어지는 일반적인 진로 대신 대기업에 취직했다. 그의 눈에는 논문보다 야후 같은 포털의 영향력이 더 커 보였기 때문이다. 박사 과정을 미루고 찾아간 곳이 SK텔레콤의 통신지능(CI) 사업본부였다. 이곳에서 그는 팀원들과 AI 로봇을 개발했지만, 시장 진출이 좌절됐다.

대기업에서 나온 그는 절치부심 끝에 2010년 데이터분석 업체 파이브락스를 차렸다. 4년 만에 미국 모바일 광고업체 탭조이에 400억~500억원대에 인수되면서 국내 IT 업계가 떠들썩했던 적도 있다. 인수 직후 이 대표는 탭조이 본사 부사장으로 취임하면서 미국 샌프란시스코로 이주했고, 서울 지사는 탭조이의 글로벌 연구개발(R&D) 기지가 됐다. 당시 파이브락스는 모바일 게임 이용자들의 행동 패턴을 분석해 광고와 과금 체계의 효율성을 높이는 솔루션 업체였다. 이 대표는 “광고주는 게임 앱 사용자에게 어떤 상황에서 어떤 광고를 보여주면 가장 큰 효과를 낼지 분석한다”며 “게임 이용자가 온전히 자신의 의지대로 아이템을 구매한다고 생각하지만, AI가 분석한 유사 행동 패턴에 따라 아이템을 보여주고 구매를 유도한다”고 설명했다.

그는 탭조이에서 딥러닝의 발전에 주목했다. AI는 인간의 지적 능력을 컴퓨터를 통해 구현하는 기술, 머신러닝은 컴퓨터가 데이터를 스스로 학습해 예측이나 판단하는 기술, 딥러닝은 인공신경망 알고리즘을 활용하는 머신러닝 기술을 말한다. 즉, 딥러닝이 등장하면서 머신러닝의 실용성이 강화됐고, AI의 영역이 확장됐다고 이해하면 된다.

그럼 딥러닝이 기존 AI를 어떻게 변화시켰을까. 전통적인 방식의 AI는 입력한 규칙을 따르는 판단 기준 시스템이라 학습 데이터가 많을수록 정확한 출력값을 제공할 수 있다. 하지만 사전에 정의되지 않은 패턴이나 입력값을 정의하기조차 어렵다면 어떻게 할까. 신경망 수조 개가 결합된 형태로 구축된 딥러닝 알고리즘을 활용하면 데이터가 갖는 의미를 이해하지 않고도 풀어갈 수 있다. 그는 “딥러닝을 활용하면 게임 이용자 분석 말고도 회계, 총무, 법무, 재무 등 거의 모든 비즈니스 업무에서 자동화가 이뤄질 수 있겠다는 생각에 올거나이즈를 창업했다”고 말했다. 이 대표의 설명이 이어졌다.

글로벌 회사에 왜 이런 검색 솔루션이 필요한가.

기업은 매일 수많은 업무 자료를 쏟아낸다. 글로벌 시장으로 눈을 돌리고, 사업 영역을 확장하다 보면 문서 양이 상상을 초월한다. 체계적으로 자료를 정리할 틈은 당연히 없다. 지금 이 순간에도 워드, 엑셀, 파워포인트, PDF 문서가 수없이 생산된다. 문제는 제대로 정리하지 않으면 같은 업무를 반복하거나 기존 문서를 찾는 데 더 많은 시간과 에너지를 소모한다는 점이다. 기업 생산성도 떨어진다. ‘회사에 쌓이는 문서에서 답을 바로 찾아줄 수는 없을까’란 물음에서 시작됐다.

데이터 학습이 결국 돈과 시간 싸움이란 얘기인가.

기존 경쟁사들이 해온 방식이다. 수천, 수만 개 데이터와 데이터를 설명하는 레이블(label)을 같이 학습시켰다. 예를 들면 호랑이 이미지와 ‘호랑이’라는 설명을 같이 학습시키는 식이다. 결국 무지막지한 레이블링 작업이 남고, 사람이 편하자고 도입한 AI가 새로운 수작업을 떠안는 꼴이 된다. 데이터 레이블링을 외주업체에 맡기게 되지만, 빅데이터가 쌓이는 시대에는 그에 드는 시간과 비용을 감당하는 건 불가능한 일이다. 하지만 딥러닝 기법을 활용하면 데이터를 정제하는 과정 없이 바로 쓸 수 있다.

딥러닝을 활용하는 건가.

그렇다. 자기지도학습(Self-Supervised Learning)이 대표적인 예다. 레이블 없이 데이터 자체만으로 학습할 수 있는 딥러닝 기법이다. 예를 들어 사내 10만 건 이상의 이메일을 모아 중간 단어를 빈칸으로 바꾼 후 들어갈 단어를 맞히도록 하니 레이블된 데이터로 학습한 모델보다 나은 성능을 보여주었다. 데이터는 많지만, 레이블이 없을 때 자기지도학습이 진가를 발휘한다. 일본 미쓰이스미토모파이낸셜그룹의 테스트 결과에서도 별도의 레이블 작업 없이 검색 정확도 76%를 기록한 비결이다.

다른 사례는 없나.

한국 회사를 예를 들어보자. 회사 내부에 지역 은행이나 신용보증기금 같은 기관에 협조를 구하는 문서가 있다. 사내에서 이메일이나 문서를 주고받다 보면 신용보증기금을 ‘신보’로 축약해서 표현하는 경우가 많다. 신용보증기금뿐이겠나. 이렇게 축약어를 일일이 찾아 레이블 작업을 하지 않고, 회사 내부 모든 문서와 이메일, 가이드, FAQ, 규정 등을 통으로 학습시켜 신용보증기금과 신보가 같은 기관이라고 추론하도록 한다.

한글 문서도 판독이 쉽지 않을 텐데, 주요 고객이 일본 회사다.

교환학생으로 일본에 체류한 적이 있고, 일본 게임회사에서 일한 경험도 있어 익숙한 곳이다. 하지만 언어 때문에 일본 시장 문을 두드린 건 아니다. 올거나이즈에서 언어적 차이는 크게 중요하지 않다. 딥러닝 입장에서 일본어는 그냥 인식해야 하는 텍스트 중 하나일 뿐이다. 호랑이를 예를 들면 호랑이 이미지가 입력 벡터라면 ‘호랑이’라는 텍스트는 출력 벡터가 된다. 입출력의 벡터값이 빅데이터 속에서 패턴, 즉 행렬을 이루고 이를 학습한다. 이게 바로 텍스트를 벡터 공간에서 검색 가능한 영역과 대응해주는 딥러닝 자연어 처리 기술이다. 카이스트에서 자연어 처리 분야 석사학위를 받은 덕이 꽤 컸다. (웃음)

일본어, 영어, 중국어, 한국어 등 총 4개 국어를 지원한다고 들었다. 그래도 언어장벽이 있지 않나.

언어적 차이보다 업종별 도메인 날리지(domain knowledge, 전문지식)에서 오는 차이가 크다. 인지검색 결과도 업종별로 확연히 다르다. 물론 나라별, 회사별로 약간씩 문화 차이는 있지만, 기록 관리와 매뉴얼 문화가 철저한 곳이라면 그 어디라도 우리 솔루션이 통한다.

올거나이즈가 두 번째 창업이다. 직장에 다닌 적도 있다.

대학 졸업 후 2004년에 국내 굴지의 통신사에 공채로 입사했다. 여기서 가정용 AI 로봇을 만드는 TF 팀에 배치됐다. 당시 미국 아이로봇사의 청소로봇 룸바가 히트를 치면서 국내에서도 가정용 로봇 개발에 집중하던 때였다. 스마트폰도 없던 시절, 기획부터 하드웨어·소프트웨어 설계까지 3년간 정말 열심히 일했다. 하지만 글로벌 컨설팅사가 사업성이 없다고 평가하면서 시장에 출시도 못 해보고 무산됐다. 이때 깨달은 바가 커 창업에 뛰어들었고, 2009년 초 일본 게임회사에 취직해 낮에는 일하고 밤에는 창업 준비를 했다.

일본에서 창업을 준비했다.

그랬다. 일본 게임사에서 일하며 짬을 내 벤처캐피털 관계자를 만나고, 팀을 꾸리려고 그간 알고 지내던 일본인 친구에게도 합류를 권했다. 늘 그렇듯 법인조차 없는 상황에서는 설득이 쉽지 않다. 그러다 우연히 한국에서 만난 노정석 아블라컴퍼니 대표와 파이브락스를 공동 창업하게 됐고, 이후 올거나이즈 창업에까지 이르렀다.

벌써 미국·일본·한국 기업을 고객으로 유치했다. 대응이 가능한가.

가능하다. 우리 조직도 글로벌하다. 크게 두 조직 계열을 두고 있는데 개발팀의 경우 거주 지역에 상관없이 채용하고 있다. 몇몇 개발자는 인도, 캐나다, 미국, 제주 등에서 일한다. 온라인에서 만날 시간대만 정하면 된다. 영업 조직은 나라별로 배치할 수밖에 없다. 현재는 미국, 일본, 한국 등지에 현지사무소를 열고 기업 고객을 만나기 때문이다. 물론 고민도 있다.

고민이 뭔가.

소통 문제 아니겠나. 회사 공용어는 영어지만 직원들 국적이 워낙 다양하다 보니 속내를 다 털어놓지 못하는 직원도 있으리라. 처음에는 한 회의실에 6~7명이 모여 콘퍼런스콜(전화 회의)을 하거나 화상회의를 했는데 얘기에 아예 끼지 못하는 직원도 있더라. 그래서 모두 회의에 참여할 수 있게 했다. 외국어가 서툴러도 상관없다. 통역하면서 소통하는 한이 있어도 자유롭게 의견을 내도록 독려했다. 업무상 번아웃도 결국 정보 공유에서 소외됐다는 좌절에서 비롯된다고 믿는다.

올거나이즈의 목표는 무엇인가.

글로벌 도큐멘테이션(자료 문서화·체계화) 플랫폼이 되는 것이다. 인간이 생각하고 일해 얻은 결과물의 총체는 문서다. 영수증, 문서, 발표 자료, 메모, 공문, 보도자료 등 모든 것이 문서화돼 공유되고 거기에 담긴 지식이 축적된다. 기업을 비롯해 사회에 지식이 축적되고 정확한 정보가 공유될수록 우리 생활이 한층 더 윤택해진다고 믿는다. 단기적으로 보험·금융·제조·IT 분야에서 기업 내 전용 검색엔진과 콜센터 소프트웨어 시장만큼은 꽉 잡고 싶다.

- 김영문 기자 ymk0806@joongang.co.kr

202109호 (2021.08.23)
목차보기
  • 금주의 베스트 기사
이전 1 / 2 다음