Tech

[챗GPT가 촉발한 AI 혁명, 급변하는 흐름 읽기] 배경훈 LG AI 연구원장 

챗GPT 다음은 ‘Actionable AI’ 

노유선 기자
2020년 설립된 LG그룹 산하 AI 연구원은 오픈AI 다음으로 초거대 AI(LLM)와 멀티모달 모델을 동시에 발표했다. 오픈AI가 촉발한 챗GPT 열풍에 놀란 것도 사실이지만 그렇다고 이에 휩쓸려가지 않겠다는 입장도 분명하다. AI, 의료, 제약, 화학, 바이오 등 5대 전문 분야를 선정하고 실제 산업현장에서 사용 가능한 신뢰도 높은 AI 개발에 전념하고 있다. 배경훈 LG AI 연구원장은 “전문성을 갖춘 정제된 데이터를 학습한 AI로 승부하겠다”며 “이후 각 분야를 통합한 범용 AI, 일상 속에 녹아든 AI agent 등으로 나아갈 것”이라고 포부를 밝혔다.

▎배경훈 원장이 이끄는 LG AI 연구원은 지난 2021년 초거대 AI ‘엑사원’을 선보였다.
지난 3월 14일 미국 AI연구소 오픈AI는 결국 클로즈드AI(Closed-AI)가 됐다. 전 세계에 인공지능(AI) 돌풍을 일으킨 오픈AI는 무료로 제공하던 기존 초거대 AI ‘GPT-3.5’를 ‘GPT-4’로 업그레이드하고 유료 서비스로 전환했다. 유료화된 만큼 성능은 향상됐다. 영어 능력은 70.1%에서 85.5%가량 높아졌고 한국어 능력도 77.0%로 상위권에 속한다.

오픈AI가 GPT-1을 내놓은 것은 2018년 6월. 이후 2021년 12월 한국의 LG AI 연구원은 또 다른 초거대 AI를 발표했다. 초거대 AI 후발 주자로서 오픈AI가 촉발한 챗GPT 열풍에 대한 의견을 묻기 위해, 지난 3월 17일 서울 강서구 마곡동 LG AI 연구원을 찾았다. LG AI 연구원의 초거대 AI ‘엑사원(EXAONE)’ 개발을 진두지휘한 배경훈(47) 연구원장은 “전 세계적으로 초 거대 AI와 멀티모달(multi-modal) 모델을 동시에 발표한 기업은 오픈AI에 이어 LG AI 연구원이 두 번째”라고 강조했다.

LG AI 연구원은 지난 2021년 12월 약 3000억 개 파라미터(매개변수)를 보유한 엑사원 1.0을 선보인 후 지난해 12월 개선 사항을 발표했다. 모델을 경량화하고 성능은 높였다. 현재 LG그룹 계열사에서 고객센터의 가상 상담과 사무직의 문서 처리, 디자이너의 작업 등에 엑사원을 활용하고 있다.

배 원장은 광운대학교에서 전자공학 학사·석사·박사(Computer Vision) 과정을 마치고 컬럼비아서던대대학원 경영학 석사(MBA)와 스탠퍼드대 경영대학원 빅데이터 최고경영자과정(Executive Education) 등을 수료한 국내 AI 분야 권위자다. 그에게 챗GPT 열풍에 대한 객관적 설명과 글로벌 AI 시장에서 한국의 위치, LG AI 연구원의 미래 전략 등에 대해 물었다.

10년 만에 찾아온 ‘아이폰’ 모먼트


최근 배 원장은 AI 관련 학계 모임에서 ‘과연 현재 AI 기술은 우리가 이토록 열광할 만한 수준인가?’라는 화두를 던져 주목받았다. 아직 완전하지 않은 기술과 그에 따른 현상을 객관적인 시선으로 바라봐야 한다는 취지였다. 그는 “국내에서 한국어 기반 초거대 AI를 내놓겠다는 기업이 있는데, 개인적으로 말도 안 되는 얘기라고 생각한다”며 “챗GPT로 대변되는 초거대 AI가 기존 검색을 대체하기는 아직 멀었다고 본다”고 일갈했다.

근거는 크게 두 가지다. 양질의 한국어 데이터가 부족하고 생성형 AI 모델의 특성상 할루시네이션(hallucination·환각) 문제를 100% 피해 갈 수 없기 때문이다. 환각은 거짓된 정보를 논리적으로 나열해 진실처럼 보이도록 만드는 AI의 기술적 문제를 말한다. 그는 “블로그를 비롯한 웹사이트에 올라온 데이터 중에는 출처가 확실하지 않고 근거도 불분명한 경우가 많다”며 “무조건 다음에 나올 단어를 예측·생성해야 하는 생성형 AI 모델(디코더 모델)은 환각 문제가 불가피하다”고 설명했다. 실제로 오픈AI는 최근 ‘GPT-4’를 공개하면서 “답변의 정확도 측면에서 여전히 명백한 실수를 한다”고 고백한 바 있다.

챗GPT 등장의 긍정적 측면은 없을까. 배 원장은 “생성형 AI에 대한 맹신과 막연한 기대감은 피해야 한다”면서도 “챗GPT가 트랜스포머(transformer) 기반의 생성형 AI 모델의 가능성을 보여준 것은 사실”이라고 말했다. 챗GPT는 등장 5일 만에 사용자 100만 명을 확보했다. 미국 대형 투자은행(IB) 뱅크오브아메리카는 최신 투자보고서에서 현 AI 열풍에 대해 ‘아이폰 모멘트가 찾아왔다’고 표현했다. 1990년대 인터넷, 2000년대 온라인 검색 기능, 2010년대 스마트폰이 등장해 전 세계의 경제 지형을 바꿨듯이, 챗GPT로 대변되는 AI 열풍이 새로운 분기점이 됐다는 설명이다.

글로벌 빅테크들은 발 빠르게 움직이고 있다. 메타도 지난 2월 초거대 AI ‘라마(LLaMA)’를 공개했으며 구글은 AI 챗봇 ‘바드(Bard)’ 출시를 예고했다. 지난 3월 7일 미국 고객관계관리(CRM) 소프트웨어업체 세일즈 포스도 기업용 생성형 AI ‘아인슈타인GPT’를 선보였다. 한국의 LG AI 연구원은 이 속도 경쟁에 어떻게 대응할지 물었다. 챗GPT처럼 세상에 오픈된 서비스를 내놔야 하지 않을까. 하지만 글로벌 빅테크처럼 서두르지 않겠다는 것이 배 원장의 입장이다.

“LG AI 연구원은 ‘신뢰성 있는 AI’를 지향합니다. 환각 문제를 해결하지 않고서 불확실한 서비스를 제공한다면 LG는 사회적인 지탄을 피하기 힘들 거예요. LG AI 연구원은 2년 내내 양질의 데이터를 모으는 데 전념했습니다. 저작권 이슈나 개인정보 이슈가 있는 데이터는 제거하고 만일 저작권이 문제가 된다면 이를 직접 구매했어요. 위해성 데이터와 바이어스(편향성) 데이터를 꼼꼼하게 필터링해 정제된 데이터만 모았다고 자부합니다.”

배 원장은 엑사원이 ‘바이링구얼(Bilingual·이중언어) AI’라는 점도 강조했다. 그는 한국어 데이터는 대부분 웹 데이터 기반이고 전문 문헌 데이터는 굉장히 적다”며 “블로그 데이터 중에도 저작권이 걸린 경우가 많아 이를 풀지 않으면 향후 문제가 불거질 수 있다”고 지적했다. 정제도 측면에서 한국어 데이터와 영어 데이터의 격차는 “어마어마하다”는 주장이다. 그는 “그래서 LG AI 연구원은 영어와 한국어 데이터세트를 50대 50으로 놓고 두 언어의 연관관계를 분석하고 있다”며 “이를 모두 학습한 바이링구얼 AI 모델로 글로벌 시장에 진출할 방침”이라고 덧붙였다.

AI, 의료, 제약, 화학, 바이오 등 5대 전문 분야 공략


엑사원은 하나의 플랫폼에서 크게 세 가지 서비스를 제공할 계획이다. 이미지 생성 AI인 ‘엑사원 아뜰리에(Atelier)’와 전문 문헌을 학습한 ‘엑사원 디스커버리(Discovery)’, 언어 모델 기반의 ‘엑사원 유니버스(Universe)’ 등이다. LG AI 연구원은 이 같은 엑사원 플랫폼 개발 전략을 총칭해 ‘프로젝트 루시(LUCY)’라고 부른다. 뇌를 100% 사용하는 인간을 다룬 영화 [루시]에서 차용했다. 배 원장은 “AI의 능력을 LG AI 연구원이 100%까지 끌어올려보자는 뜻”이라고 설명했다.

세 가지 서비스 중 이미지 생성 AI 기술은 이미 가시적 성과를 드러내 LG 계열사에서 실제로 사용하고 있다. LG생활건강의 화장품 케이스 디자인과 LG전자의 가전제품 디자인 생성에 활용 중이다. 지난해에는 박윤희 디자이너와 협업해 아뜰리에 기술을 활용해 만든 옷으로 뉴욕패션워크에 참여하기도 했다. 이 기술이 탑재된 AI 휴먼 ‘틸다(Tilda)’는 세계 3대 광고제인 뉴욕 페스티벌에서 금상과 은상을 수상하는 쾌거를 거뒀다. 이는 올해 ‘엑사원 아뜰리에’라는 브랜드로 공개될 예정이다.

특히 이미지 AI 기술 분야에서 LG AI 연구원의 기술력은 독보적이란 평이다. LG AI 연구원의 양방향 멀티 모달(multi-modal) AI는 텍스트 입력 시 이미지를 생성하고 역으로 이미지를 파악해 설명해주기도 한다. 배 원장은 “양방향이 가능한 멀티모달 AI는 LG AI 연구원이 세계 최초로 확보한 기술이라고 자부한다”며 “올해 상반기 중에 선보일 예정”이라고 밝혔다.

한편, 지난 3월 16일 개최된 LG그룹의 대규모 행사인 ‘LG테크콘퍼런스’에서도 틸다의 활약은 돋보였다. 4년 만에 주력 계열사가 총집결한 이날 행사에서 구광모 LG그룹 회장은 틸다의 소개에 맞춰 등장해 화제를 모았다. ‘LG AI 연구원의 핵심 사업이 엑사원이 아니라 틸다인가’라는 물음에 배 원장은 ‘엑사원’이라고 즉답했다. 특히 엑사원 플랫폼 중 엑사원 디스커버리는 상위 1% 수준 전문가 AI로 개발할 계획이다.

“LG AI 연구원의 차별화 전략은 ‘전문가가 실제 산업현장에서 쓸 수 있는 AI 모델’에 있습니다. AI, 의료, 제약, 화학, 바이오 등 5대 전문 분야를 정한 뒤, 이를 위주로 AI 모델을 개발하고 있어요. 명확한 출처와 사실에 기반한 결과물을 생성하는 데 주력하고 있습니다. 현재 각 전문 분야 강자들과 협업하고 있어요. 올해 하반기 중 5대 분야에 대한 AI 모델을 단계적으로 공개해나갈 방침입니다.”

LG AI 연구원은 각 분야 전문기업과 협력해 퀄리티 높은 데이터를 확보하고 있다. LG그룹 계열사로 한정하지 않고 세계 3대 디자인스쿨인 파슨스, 글로벌 크리에이티브 플랫폼 기업 셔터스톡과도 손잡았다. 배 원장은 이를 ‘버티컬 전략’이라 칭하며 “개별 버티컬 영역에서 상당히 높은 수준의 성능을 개발하는 게 우선”이라며 “이후 각 버티컬 영역들을 합쳐서 범용인공지능(Artificial General Intelligence)을 완성하겠다는 전략”이라고 강조했다.

배 원장은 LG AI 연구원의 중장기적 목표로 실행 가능한 AI(Actionable AI)인 ‘AI agent(가상 비서)’를 꼽았다. 그는 “AI는 스스로 행동을 취해야만 인류 삶에 도움을 줄 수 있다”며 “예를 들면 AI는 사용자의 출장 일정을 분석해 호텔 및 항공편을 알아서 예약하고 미팅 목적지까지 최적 경로를 알려주며 주변 식당까지 예약할 수 있어야 한다”고 단언했다. 이어 “AI가 인류 삶에 자연스럽게 녹아들어 삶이 풍요로워질 때 비로소 AI 시대가 도래했다고 말할 수 있다”고 덧붙였다.

LG AI 연구원의 비전은 ‘더 나은 삶을 위한 AI 개발(Advancing AI for a better Life)’이다. 배 원장은 현재AI 기술이 비록 환각 이슈를 불러오더라도 지속적으로 개발·개선된다면 인류 문명 발전에 훌륭한 도구가 될 것으로 확신하고 있다. 그는 “생성형 AI 기술이 사실에 입각해 근거 있는 답변을 내놓게 된다면 누구나 쉽게 전문적인 글을 쓸 수 있고 아이디어를 언제든지 이미지화할 수 있을 것”이라고 설명했다.

“더 나아가 AI는 주변 현상을 다각도로 분석하고 경험과 지식을 바탕으로 미래를 예측해낼 수 있을 겁니다. LG AI 연구원은 수요 예측이나 가격 예측 등을 넘어 기업의 중요한 의사결정에 도움이 되는 미래 예측 기술을 연구하고 있어요. 전 세계적으로 AI 활용한 성공 사례를 가장 많이 확보한 연구원으로 우뚝 서겠습니다.”

- 노유선 기자 noh.yousun@joongang.co.kr·사진 원동현 객원기자

202304호 (2023.03.23)
목차보기
  • 금주의 베스트 기사
이전 1 / 2 다음