Special Report

Home>이코노미스트>Special Report

[ICT업계 차세대 먹거리 ‘통·번역’ 전쟁은 지금] 인공지능으로 문맥 파악하는 시스템 구현 

 

이창균 기자 smilee@joongang.co.kr
구글·네이버 등 사람 뇌 학습법 본뜬 신기술 적용…오역 줄고 문장 자연스러워져

국내외 정보통신기술(ICT) 기업들이 최근 통·번역 시스템 강화에 소매를 걷어붙이고 나섰다. 플랫폼 이용자들의 만족도를 높여 이용률을 끌어올리면서 새로운 IT 기기 사업 등에 다각도로 활용할 수 있는 유망 분야로 인식해서다. 해외 기업으로는 구글이, 국내 기업으로는 네이버가 대표적인 가운데 다른 기업도 관련 서비스를 잇따라 선보이고 있다. 이들이 어떤 신기술을 선보이고 있는지, 미래 통·번역 전쟁은 어디로 이어질지 짚어봤다.


▎인공지능을 활용한 자동 통·번역 서비스가 IT 기업들의 차세대 먹거리로 떠올랐다. 이에 기업들은 다양한 방식으로 서비스 강화에 나서고 있다.
지난 4월 25일 개봉해 국내에서 엿새 만에 500만 관객을 끌어 모은 미국 영화 [어벤져스: 인피니티 워(Avengers: Infinity War)]는 오역 논란으로도 관심을 모았다. 등장인물 하나가 중요한 순간 나지막이 내뱉은 “We are in the endgame now”라는 말이 ‘다 끝났으니 포기해야 한다’는 뉘앙스의 “가망이 없어”라는 자막으로 소개된 게 논란의 핵심이었다. 일부 관객들은 ‘endgame’이 체스 등에서 ‘종반전’을 가리킬 때 쓰는 말이며, 작중의 맥락을 고려해도 “최종 단계야” 또는 “마지막 단계야”로 번역했어야 맞다고 문제를 제기했다. 청와대 국민청원 게시판엔 해당 번역가의 작품 번역 참여를 반대하는 글까지 올라왔다. 이에 해당 영화의 국내 홍보 업체는 “해석의 차이였을 뿐”이라며 “번역된 내용의 수정을 따로 논의하진 않을 것”이라고 일축했다.

미국과 영국 등의 주요 외신 보도로도 소개된 이번 논란에 국내외 ICT 기업들이 비상한 관심을 보이고 있다. 좀 더 정교한 통·번역 시스템을 플랫폼 내에 갖추거나 모바일 애플리케이션으로, 새로운 기기 형태로 선보이는 데 힘쓰고 있는데 이 같은 논란을 계기로 서비스 발전 방향에 대해 깊이 있게 고심할 수 있어서다. ICT 업계 한 관계자는 “인공지능(AI) 기술이 발달하면서 통·번역 서비스가 차세대 먹거리로 떠올랐다”며 “완성도 높은 (통·번역) 서비스에 대한 수요가 그만큼 급증했다”고 분위기를 전했다. 이들은 신규 이용자 유입과 기존 이용자 만족도 제고라는 두 마리 토끼를 동시에 잡는 데 통·번역 서비스가 도움이 될 뿐만 아니라, 광고 매출 증대와 같은 현실적인 문제에도 자연스레 영향을 미칠 수 있다고 보고 있다. 더 나아가 장기적 관점에서 고부가가치 창출 전략을 마련하는 데도 유용하다는 판단이다.

RBMT→SMT→NMT로 거듭 진화


▎사진:cnet 제공
이런 시각에서 통·번역 서비스 강화에 사활을 걸고 있는 대표적 기업으로 해외의 경우 구글, 국내에선 네이버가 있다. 검색 엔진의 글로벌 최강자인 구글은 AI 통·번역 시장에서도 두각을 나타내고 있다. ‘구글 번역(translate.google.com)’이 세계 100여 가지 언어로 매일 5억 명 이상의 번역 요청을 처리하고 있어서다(지난해 기준). 구글 번역은 사람의 뇌가 학습하는 과정을 본뜬 ‘인공 신경망 기반 기계 번역(NMT)’이라는 신기술을 지난 2016년 도입해 도약에 성공했다. 애초 구글은 야후 등 경쟁사들처럼 1968년 설립된 프랑스 번역 솔루션 업체 시스트란(Systran)이 제공하는 기술을 쓴 번역 서비스를 제공하고 있었다. 그러다가 ‘통계 기반 기계 번역(SMT)’ 방식으로 전환, 2007년부터 새 번역 서비스를 선보인 바 있다.

SMT 이전에 나왔던 ‘규칙 기반 기계 번역(RBMT)’은 철저히 개별 단어 위주로 번역 작업을 하는 방식이었다. 예를 들어 ‘나는 소년이다’를 뜻하는 ‘I am a boy’라는 문장이 있다면 AI가 ‘I=나’ ‘am=이다’ ‘boy=소년’으로 먼저 인식한 다음 언어별로 주어와 서술어의 순서가 다르다는 규칙(문법)을 적용, 번역해서 보여준다. 이런 RBMT의 경우 문맥은 물론 단어의 다양한 뜻마저도 제대로 파악하지 못한다는 뚜렷한 한계점을 지니고 있었다. 예컨대 ‘모자를 쓰다’와 ‘편지를 쓰다’라는, 전혀 다른 뜻의 문장 안에 들어간 ‘쓰다’란 단어를 무조건 ‘Write’로 번역하는 식이었다.

이와 달리 SMT 방식에선 ‘Wear’로도 번역이 가능할 만큼 AI 기술이 발달한 상태였다. SMT는 언어 데이터를 모으기 위해 유엔(UN)과 유럽 의회(유럽연합(EU)의 입법 기관)의 방대한 구술 기록을 활용한다. 특정 단어가 다른 단어와 쌍을 이룰 때 통계적으로 가장 많이 내포한 뜻을 찾아내기 위해서다. 그러면서 RBMT보다 정확도를 높일 수 있었다. 그럼에도 한계는 존재했다. 해당 언어권에서만 쓰는 단어나 관용적 표현은 대체로 이해하지 못한다. AI가 소고기 요리인 ‘육회’를 ‘6회’와 똑같은 말로 받아들여 영어로는 ‘Six times’로 번역하는가 하면, ‘너에게 반했다’는 말을 ‘I was against you’라고 오역하는 식이다. 또 이용자가 입력한 텍스트를 직접 번역하는 대신, 먼저 텍스트를 영어로 번역한 다음에 이를 이용자가 요구한 언어로 변환한다. 이러다 보니 각종 오역에서 자유롭지 못한 채 “아직 정확도가 떨어진다”는 비판에 시달려야 했다.


이보다 AI가 대폭 향상된 NMT 방식에선 단어를 번역한 다음에야 이를 조합하는 기존 방식을 따르지 않는다. 대신에 전체 문장을 AI가 통째로 인식해서 번역한다. 빅데이터 학습을 통해서다. 예컨대 ‘너는 군인이다(You are a soldier)’와 ‘너는 교사다(You are a teacher)’라는 두 가지 문장이 주어지면 AI가 둘 사이 유사성을 파악하고 학습한다. 이후 다른 비슷한 문장이 나오면 곧바로 응용해서 번역한다. 아울러 가장 적절한 번역 결과를 도출해내기 위해 문맥을 한층 폭넓게 살피기도 한다. 단어 자체보다 문장의 전체적인 의미 파악에 더 집중한다는 얘기다. 이 과정에서 언어별로 다양하게 적용되는 어순을 고려함은 물론이다.

이런 식으로 SMT 방식에선 ‘Six times’로 번역되던 ‘육회’가 NMT 방식에선 ‘Raw meat’로 알맞게 번역될 만큼 AI 수준이 높아졌다. 김슬기 KT경제경영연구소 연구원은 “SMT가 교과서를 달달 암기하는 주입식 학습에 따른 방식이었다면, NMT는 AI가 스스로 학습하는 방식이라 많은 이용자가 쓰면 쓸수록 데이터가 방대하게 축적되면서 번역 품질도 계속 향상되는 특징이 있다”고 분석했다. 비유하자면 NMT는 학구열이 있는 유학생이 해외에서 현지 언어로 수많은 현지인과 소통하면서 직접 언어 구사력을 키우는 방식이라는 것이다. KT경제경영연구소는 보고서에서 “원어민의 언어 구사력을 100점 만점에 100점으로 봤을 때 전문 통·번역사는 90점, NMT는 70점, SMT는 40점 수준”이라고 덧붙였다.

100점 만점에 SMT는 40점, NMT는 70점


▎2016년 처음 선보인 네이버 ‘파파고’는 서비스 개편에 적극적인 모습으로 많은 이용자의 지지를 받고 있다. 오른쪽은 네이버가 연내에 출시할 동시통역 블루투스 이어폰 ‘마스(MARS)’.
마이크 슈스터 구글 리서치 사이언티스트는 지난해 공식석상에서 구글이 번역 서비스를 중시하는 이유를 다음과 같이 소개했다. “전 세계 인터넷 콘텐트의 50%가 영문으로 이뤄졌지만, 영어는 세계 인구의 20%만이 사용한다. 이용자들이 언어 장벽을 극복하고 각종 정보에 보다 쉽게 접근하도록 하기 위해 번역 서비스 강화를 추진하고 있다.” 이어 그는 “통역사 같은 전문가를 고용하면 번역 품질이 더 높아질 순 있겠지만, 구글 번역은 전문적 번역보다 평균적이면서 일반적인 번역 수준에서 완벽을 추구해나가고 있다”고 설명했다. 구글은 지난해 말 ‘픽셀’ 시리즈 스마트폰과 연동해 40개 언어의 실시간 동시통역이 가능한 블루투스 이어폰 ‘픽셀버드’를 출시하기도 했다. 두 사람 중 한 사람이 이어폰을 장착하면 상대방은 스마트폰을 통해 서로 다른 언어로 대화할 수 있다.

네이버 ‘파파고(papago.naver.com)’는 현재 국내에서 이런 구글의 가장 강력한 경쟁상대 중 하나로 꼽힌다. 네이버 산하 기술 연구소인 네이버랩스가 마찬가지로 NMT 방식을 적용, 2016년 선보인 통·번역 서비스 파파고는 국내 1위 포털이 내놓은 야심작답게 한국어를 구글 번역보다 더 매끄럽게 다뤄내고 있다. 파파고는 에스페란토어(1887년 폴란드의 라자로 루드비코 자멘호프 박사가 창안한 국제 공용어)로 ‘앵무새’라는 뜻이다. 사람들이 한 말을 앵무새가 잘 따라하는 것처럼 사람의 언어를 정확히 번역해준다는 의미를 담았다. 파파고는 구글 번역만큼 많은 언어를 지원하고 있지는 않지만, 연속적인 서비스 개편을 통해 이용자들의 지지를 얻고 있다. 실제 네이버는 4월 27일 “파파고 PC 홈페이지에 NMT 방식의 웹사이트 번역 기능을 추가했다”고 밝혔다. 번역하려는 웹사이트 주소를 입력하고, 언어를 고르면 번역 결과를 바로 확인할 수 있다. 네이버는 해당 기능을 파파고 애플리케이션 등에 순차 적용할 예정이다. 김준석 네이버 파파고 리더는 “NMT 방식의 웹사이트 번역을 위해 여러 기술적 문제를 해결한 상황”이라며 “특히 기사와 사전 등의 콘텐트 형태로 된 해외 웹사이트를 번역할 때 유용할 것”이라고 했다.

지금껏 파파고의 NMT는 번역하려는 문장들의 글자 수가 5000자를 넘지 않는 경우에만 적용됐다. 5000자를 넘는 경우에 대해선 SMT 방식만 제공됐지만, 이번 개편으로 이 같은 제한이 없어졌다. 네이버는 현재 10개인 파파고의 지원 언어도 연말까지 14개로 늘릴 계획이다. 영어·중국어 등 기존 지원 언어에 아랍어·러시아어·독일어·이탈리아어 4개가 추가된다. 또 한국어뿐 아니라 일본어 중심의 일본어-영어, 일본어-한국어, 일본어-중국어 등 해외 이용자들을 위한 번역 품질 개선에 나서기로 했다. 이와 함께 네트워크 연결이 없이도 NMT 방식이 가능한 오프라인 번역 기술도 개발하고 있다.


▎삼성전자 ‘갤럭시S9’은 스마트폰 카메라로 특정 문장을 비추기만 해도 자동 번역해주는 기능을 탑재했다. / 사진:Gadget Hacks 제공
물론 이 같은 기술 발달과, 기업들의 노력에도 서비스의 품질 향상에 대한 이용자들의 목소리는 이어지고 있다. 5월 3일 기자가 영화 어벤져스 신작에서 오역 논란을 낳았던 문제의 그 대사 ‘We are in the endgame now’를 파파고에 입력하자 ‘우리는 이제 끝장이다’라는 번역 결과가 나왔다. 영화 팬들의 지적대로 ‘우리는 이제 최종(마지막) 단계에 있다’라고 번역해주지는 못했다. 같은 날 구글 번역에 ‘주상 전하납시오’라는, 외국인은 뜻을 알아차리기가 쉽지 않은 문장을 입력하자 ‘About Us’라며 오류를 보였다. NMT 방식의 수준 높은 AI로도 여전히 개선점이 존재한다는 얘기다.

이어폰 동시통역과 카메라 자동번역까지 가능


그럼에도 고품질 통·번역 서비스에 대한 국내 IT 기업들의 도전은 점차 거세지고 있다. 구글 픽셀버드의 경우처럼 네이버는 파파고 성능 개선에서 한걸음 더 나아가 파파고와 연동하는 블루투스 이어폰 ‘마스(MARS)’를 올해 안에 출시할 계획이다. 두 사람이 이어폰 한 쌍을 나눠 가지고 각자 장착한 다음, 서로 다른 언어로 대화를 하면 동시통역을 해주는 방식이다. 마스는 지난 1월 미국 라스베이거스에서 열린 세계 3대 IT 전시회, ‘국제전자제품박람회(CES) 2018’에 출품돼 ‘최고혁신상(Best of Innovations)’을 받았다. 경쟁사인 카카오도 AI 플랫폼 ‘카카오 아이’를 활용한 새 번역 서비스를 최근 선보였다. NMT 방식이 적용됐으며 모바일 메신저 ‘카카오톡’에서 한국어로 메시지를 전송하면 영어·중국어·일어 중 하나로 번역한다. 국내 번역기 중 최초로 예사말과 존댓말, 구어체와 문어체를 구분한다.

소프트웨어 전문 기업들만의 얘기가 아니다. 통·번역 서비스 강화에 초점을 둔 하드웨어의 사례들도 곳곳에서 보인다. 삼성전자가 지난 3월 출시한 ‘갤럭시S9’은 스마트폰 카메라로 특정 문장을 비추기만 해도 자동 번역해주는 기능(구글 번역을 활용)을 AI 비서 ‘빅스비 비전’에 탑재해 화제를 모았다. 전문가들은 AI 기술의 비약적인 발달에 힘입어 이런 흐름이 한층 가속화할 것으로 전망한다. NMT 분야의 권위자인 조경현 미국 뉴욕대 교수는 “이용자가 이미지나 이모티콘 같은 부수 정보를 입력할 때 AI가 문맥을 보다 수월하게 파악하는 경지까지 NMT 방식이 진화하면서 통·번역 품질도 지금보다 향상될 수 있다”고 말했다.

[박스기사] 대기업 뺨치는 중소기업 통·번역 서비스 - 한컴인터프리 ‘지니톡’ 매끄러운 통·번역


“이 칩 맛있지 않나요?” 5월 2일 저녁, 인파로 북적이는 서울 강남역 10번 출구의 한 음식점 안. 혼자 감자칩 요리를 먹던 기자가 앞에 외국인이 있다고 가정해 이렇게 말했다. 그러자 손안의 스마트폰이 유창한 영어로 1초 만에 통역을 해줬다. “이즌 디스 칩 딜리셔스?(Isn't this chip delicious?)” 지난 2월 ‘2018 평창 동계올림픽’때 공식 통·번역기로 쓰였던 ‘한컴 말랑말랑 지니톡(이하 지니톡)’ 모바일 애플리케이션을 통해서다. 지니톡은 과거 ‘벤처 신화’를 썼던 중소 규모의 국내 IT 기업, 한글과컴퓨터의 자회사 한컴인터프리가 선보였다.

‘칩’은 언뜻 쉬워 보이지만, 지금껏 실외 시끄러운 장소에선 제대로 통역되지 않던 까다로운 단어다. 실제로 이날 국내외 다른 유명 통·번역기를 써보자 칩을 ‘집’으로 잘못 알아듣고 “이즌 디스 하우스 딜리셔스?(Isn't this house delicious?)”라는 엉뚱한 말을 했다. 내친 김에 고유명사가 들어간 좀 더 어려운 말을 해봤다. 지니톡은 이를 잘 알아듣고 속뜻을 외국인도 알기 쉽게 풀어줬다. “강원도는 막국수가 유명해”라는 기자의 말에 네이버 파파고가 “Gangwondo is famous for Makguksu”라고 하고, 구글 번역은 아예 막국수를 영어식 발음으로 옮기기조차 버거워 할 동안 지니톡은“Gangwondo is famous for its buckwheat noodles”라고 했다. 막국수의 본질이 메밀국수(buckwheat noodles)라는 사실을 유일하게 짚은 것이다.

‘번역기의 혁명’. 지니톡을 써본 누리꾼들은 이 같은 평을 남겼다. 지니톡은 지난해 10월 국정감사 현장에서도 화제가 됐다. 당시 평창 올림픽을 앞두고 국회 과학기술정보방송통신위원회 소속 송희경 자유한국당 의원이 “음성 인식율과 통역 정확도가 뛰어난데도 잘 알려져 있지 않다”며 지니톡을 직접 시연해 보였다. 송 의원이 “근처에 맛있는 집이 어디야?”라고 하자 구글 번역이나 파파고는 ‘맛있는 집’을 ‘nice house’로 잘못 통역했지만 지니톡은 ‘delicious restaurant’라고 정확히 말했다.

지니톡은 순수 국내 기술로 탄생했다. 한국전자통신연구원(ETRI)이 원천 기술을 개발한 다음 사업화를 위해 한글과컴퓨터와 손잡았다. 지니톡이 다른 통·번역기보다 일부 우수한 성능을 보이고 있는 이유는 애초 통역기가 소음이 있는 장소에서 주로 쓰인다는 점을 고려, 인공지능이 주변 소음과 발화자의 목소리를 잘 구별해 내도록 개발돼서다. 또 개발 단계에서부터 NMT 방식의 단점을 보완하는 데 관심을 가져서다. 예컨대 NMT 는 대체로 번역 정확도가 높으면서도 빅데이터 기반이라 사용 빈도가 낮은 문장에 대한 번역 정확도는 떨어지는 경향이 있다. 지니톡은 이를 보완하기 위해 RBMT 방식을 혼용했다. 통상 RBMT 는 NMT 대비 뒤떨어진 기술로 여겨졌지만, 문법 자체의 다양한 용례를 짚어내는 데는 효과적이라 두 방식의 혼용을 통해 한층 매끄러운 통·번역이 가능해졌다는 설명이다.

한컴인터프리 관계자는 “총 2534개의 한국어 문장에 대해 음성 인식률을 자체 평가해본 결과 오류율이 2.9%로 경쟁상대인 구글 번역(6.4%)·파파고(3.6%)보다 낮은 것으로 나타났다”고 말했다. 지니톡은 한국어와 영어 외에도 아랍어와 러시아어 등 29개 언어를 지원한다. 회사 측은 향후 지니톡을 통역 전문 로봇 형태로 상용화하는 방안도 검토 중이다. 지니톡의 사례는 ICT 업계 차세대 먹거리인 통·번역 시스템이 일부 대기업의 전유물이 아니며, 기술만 있다면 국내 중소기업들에도 얼마든지 승산이 있는 분야라는 사실을 보여준다.

/images/sph164x220.jpg
1433호 (2018.05.14)
목차보기
  • 금주의 베스트 기사
이전 1 / 2 다음