Tech

[2024 대한민국 AI 50] 배성환 RSN 대표 

20년간 쌓아온 소셜 데이터와 분석력의 가치 

이진원 기자
설립 20주년을 맞은 RSN은 온라인 정보 모니터링 전문기업으로, 시대 변화에 따라 빅데이터 수집·처리·분석 자동화 플랫폼, 생성형 AI 등 신기술을 더하며 기능을 고도화했다. 하지만 목적은 하나다. 대중의 여론·트렌드 동향을 실시간으로 신속하고 정확하게, 깊이 있게 파악하려는 것이다. 특히 최근 생성형 AI가 활성화하면서 RSN이 지난 20년간 쌓아온 데이터·언어 분석 모델이 더욱 빛을 발하고 있다.

▎배성환 대표는 경희대 전자계산공학과 졸업, 숭실대 공학박사, 삼보컴퓨터 연구소, RSN 대표(현), 한국IT전문가협회 회장(현).
“현재 26만 개 도메인에서 유의미한 텍스트를 웹크롤링으로 매일 최대 2500만 건을 수집하고 분석하죠. 소셜 빅데이터는 언론 기사, 댓글, 소셜미디어 업로드 내용 등을 모두 포괄합니다. 소셜 빅데이터는 여론 동향을 파악하는 데 매우 중요합니다. 정보는 고여 있을 때보다 빠르게 캐내서 공유할수록 훨씬 가치가 더해집니다.”

지난 20년간 소셜 데이터 수집량 1800억 건을 자랑하는 RSN의 배성환 대표는 누적 데이터의 양과 질의 가치를 강조했다. RSN이 보유한 소셜 빅데이터의 가치는 생성형 AI 시대를 만나 한층 더 높아졌다.

전처리 및 항목별 3000만 라벨링으로 분류된 소셜 데이터는 생성형 AI 학습을 위해서도 중요한 양분이기 때문이다. 배 대표는 “최근 전처리·라벨링 데이터를 학습용으로 제공한 바 있으며 요청이 늘고 있다”고 내비쳤다.

비정형 구어체 언어 데이터의 품질을 묻는 질문에 배 대표는 “노이즈 정화 및 필터링 기능을 위한 모델을 구축하고 있다”며 “예를 들어 띄어쓰기·오탈자 자동 보정과 함께 비속어·신조어·반어법 사전이 있어 표준어로 치환한다”고 설명했다. “이러한 보정 과정을 통해 분석 성능을 높인다”고 설명했다.

“특히 신조어와 새로운 밈을 찾아내는 프로그램도 보유하고 있습니다. 하지만 언어는 수시로 변하기 때문에 공을 들여 사전을 지속적으로 만들어가야 합니다. 기존 사전으로 분석할 수 없는 단어들을 계속 모아서 담당자가 모니터링을 합니다. 그리고 시스템에서 벗어난 단어는 관리자들이 치환해서 새로 사전에 추가해가며 관리하고 있죠.”

배 대표는 RSN이 자연어처리 사전을 개발하게 된 배경도 설명했다. 그는 “광고기획사에서 신조어를 모아달라는 요청이 지속적으로 있었고, 수행하다 보니 우리 분석 모델에 이 기능을 장착하게 됐다”고 말했다.

RSN이 지난 20년간 매출 성장과 흑자 경영을 지속하고 기술 역량을 쌓을 수 있었던 요인은 바로 이처럼 고객사의 다양한 니즈를 적극적으로 개발로써 대응해왔기 때문이라고 그는 강조했다. 실제 RSN은 최근 5년간 매출액 16.3% 성장, 2023년 매출 규모는 178억원으로 그동안 건실한 흑자 성장을 일궈왔다. 그래서 그동안 투자 유치의 필요성도 딱히 없었지만, 최근 2025년 상장을 추진하며 100억원 규모의 pre-IPO 투자를 받았다.

“RSN은 기업 대상 분석 솔루션 서비스 기업인 까닭에 기성 서비스가 아닌 맞춤형 수요가 크고 다양합니다. 기업별로 니즈에 대응하면서 유의미한 결과를 쌓아왔고 좋은 방법론은 내재화·세분화해 분석 서비스를 강화해갈 수 있었죠. 그 결과 과거 예산 수억원이 필요했던 분석 프로젝트도 점점 기간과 비용을 축소해 효율성을 확보했고 고객의 의뢰는 점점 증가했습니다.”

RSN의 소셜 데이터 분석 플랫폼 루시는 3억 개 말뭉치를 기반으로 900여 개 산업군별 특화된 모델로 가동된다. 루시 플랫폼은 고객사의 니즈와 목적에 따라 서비스형 플랫폼(PaaS)으로 맞춤화했으나, 최근 RSN는 시장 확대를 위해 서비스형 소프트웨어(SaaS) 형태로도 경량화·세분화했다. 그리고 목적에 따라 ▶글로벌 경영전략 및 의사결정을 위한 루시 글로벌 MI ▶국내 시장 및 소비자 트렌드 분석을 위한 루시 K트렌드 ▶소셜미디어 인플루언서 분석을 위한 루시 오디언스 ▶뷰티산업에 특화한 루시 K뷰티 인사이트, K뷰티 리포트 등으로 나눴다.

고객은 전자·통신, 유통·커머스, 방송·광고, 자동차·제조, 금융·보험, 주류·음료, 코스메틱·패션, 교육, 공공기관 등으로 다양하다. 기업의 PR팀·마케팅팀·리서치팀·전략팀, 정부기관 공보실, 홍보대행사 등이 리스크관리, 시장분석 및 소비자 반응 파악, 마케팅전략 수립 등을 위해 RSN의 루시 플랫폼을 주로 이용한다.

RSN은 지난 20년간 국내 많은 기업·공공기관과 프로젝트를 진행한 까닭에 굵직굵직한 이슈에 대해서 동향 파악 업무와 함께 했다. 배 대표는 지난 2020년 코로나19와 관련해 유관기관의 긴박했던 브리핑에 대한 일화를 소개했다.

“당시 코로나19가 확산해 긴장하고 있을 때 유관기관은 매일 오전 10시에 브리핑을 했어요. 이를 위해 우리는 매일 오전 8시와 오후 8시에 그날그날의 국민의 우려 사항, 가짜뉴스, 정부 브리핑에 대한 피드백 등을 보고했죠. 실시간 뉴스와 소셜미디어에서 국민의 주요 여론 동향을 살폈어요. 이를 위해 우리 직원들도 매일 새벽까지 근무하며 긴박하게 돌아갔던 때가 기억납니다.”

배 대표는 이와 더불어 최근 정부기관 사업의 해외 여론 동향 보고, 대기업 소비재의 제품 이상 조기 발견, 보험사의 실손보험 거짓 청구 탐색, 신용카드사의 카드발급 이상 감지 등 여러 사례를 언급했다. 배 대표는 “부정 이슈 등에 대해 고객사가 리스크관리를 적절하게 할 수 있도록 도와 보람 있었다”며 “RSN의 설립 초기에는 리스크관리 의뢰의 비중이 높았으나, 최근에는 점점 산업별로 시장 분석, 경쟁사 분석 등 마케팅전략 수립을 위한 의뢰가 늘고 있다”고 설명했다.

AI기능으로 통찰력 발굴 효율성 높인다


▎배성환 대표는 빅데이터라는 개념이 아직 희미했던 2004년, 일찍이 비정형 빅데이터 분석 기술을 확보하고 RSN을 설립했다.
배 대표는 경희대 전자계산공학과를 졸업하고 삼보컴퓨터 연구소에서 개발자로 커리어를 시작했다. 그리고 그곳에서 국내 최초 워드프로세서 ‘보석글V’ 개발에 참여한 1세대 소프트웨어 전문가다. 빅데이터라는 개념이 아직 희미했던 2004년, 일찍이 비정형 빅데이터 분석 기술을 확보하고 RSN을 설립했다. 특허 등록된 그의 기술은 ‘대량문서 기반 성향분석시스템’이다. 그리고 바로 외부 빅데이터 분석 플랫폼(PasS)을 개발해 삼성그룹, 연합뉴스 등과 계약을 맺고 서비스하기 시작했다. 2010년대 들어 소셜미디어가 활성화하자 ‘SNS를 통한 이슈 확산도 분석 시스템’을 개발하는 등 시대의 변화와 수요에 따랐다. 지난 2018년에 소셜 빅데이터 분석 SaaS 플랫폼 루시2.0을 개발했고 현재 2024년에는 생성형 AI 기술을 더한 루시3.0 출시를 계획하고 있다.

“저희는 국내 기업들의 수요에 따라 시장 변화에 적응했고 안정적으로 성장했어요. 2000년대 초반 온라인 문서에 대한 저작권 논쟁으로 ‘이 사업을 계속할 수 있을까’ 위기도 있었죠. 아이러니하게도 온라인 저작권 이슈는 AI의 학습 데이터에 대한 논란으로 이어져 현재도 진행되고 있어요. 아직 디지털콘텐트 저작권에 대한 가이드라인이 법제화되지 않았기 때문이죠. 모름지기 비즈니스는 법적인 테두리 안에서 해야 하는데 규제도, 한계도 정해지지 않았기 때문에 비즈니스 테두리를 잘 몰라 그동안 보수적으로 경영해왔습니다.”

그의 말처럼 온라인 콘텐트 기반의 비즈니스를 하면서 부딪치는 저작권 이슈는 시대가 변해도 명쾌하게 해결되지 않은 숙제다. 그는 “수집한 콘텐트는 원문 자체를 활용하지 않고 가공해서 니즈가 있는 고객에게 제공한다”며 “우리는 원저작자의 저작권을 보호하기 위해 원 게재 링크에 방문할 수 있도록 트리거 역할을 하도록 설계돼 있다”고 말한다. 그리고 “숨겨진 정보를 발굴하고 원저작자의 수익 침해 없이 게재했을 때 방문 유저수가 늘고 광고 수익에 기여할 수 있도록 하는 것이 검색엔진의 논리”라고 부연했다.

한편, 최근 AI 적용 기술이 확대되면서 대중 여론과 트렌드 분석 기술이 가까운 미래에 어떻게 변화할지 그에게 물었다.

“현재 생성형 AI의 답변은 범용 지식을 전달하는 수준입니다. 아직 산업별·기업별로 특화된 정보나 깊은 통찰력이 담긴 답을 하지는 못합니다. 이미 많은 이가 생성형 AI를 익숙하게 이용하고 이에 대한 기대를 하고 있어요. 그래서 올해 하반기 출시될 루시3.0 버전부터는 생성형 AI 기능을 추가해 현재 베타테스트 중입니다. 주요 토픽에 대한 모델링 결과를 질의응답형으로 제공할 수 있죠. 예를 들어, ‘경제 뉴스 중 주요 이슈 3가지를 추려줘’라고 요청하면 경제 뉴스 3000건의 군집을 만들고 가장 많이 언급된 이슈의 대표 기사를 제공하죠. 이는 우리 솔루션의 대시보드에서 고객이 통찰력을 발굴하기 위해 소요하는 시간과 노력을 더 줄일 수 있을 것으로 기대합니다.”

배 대표가 인터뷰에서 밝힌 RSN의 기술 확보 배경, 안정적 성장 요인에 대한 전반적인 스토리는 모두 그의 철학과 연결돼 있다. ‘고객 중심’이라는 매우 단순하고 실리적인 경영 철학이다.

“제 철학은 ‘고객의 수요와 시장에 따른다’입니다. 이는 제가 삼보컴퓨터 개발자일 때 깊게 깨달은 가르침이죠. 개발자들은 기술이 가능한지 아닌지에 따라 개발을 결정하고 개발자 만족 중심으로 사고하는 경향이 있죠. 그래서 삼보컴퓨터에서 워드프로세서, 엑셀, 파워포인트 등을 만들었지만 결국 시장 수요를 만들지 못해 회사는 망했어요. 고객 목소리와 니즈를 외면하지 않고 그들이 필요로 하는 것을 제공하려고 노력하다 보니 여기까지 왔습니다.”

- 이진원 기자 lee.zinone@joongang.co.kr _ 사진 최기웅 기자

202407호 (2024.06.23)
목차보기
  • 금주의 베스트 기사
이전 1 / 2 다음