챗GPT: 거대한 ‘통계학적 앵무새’가 가리고 있는 것들

초거대 인공지능은 한 나라를 대표하는 기술 패권의 상징이 됐을 만큼 개발 중요성이 커졌다. 하지만 초거대 인공지능 개발의 중요성에 비하여, 그 ‘초거대함’에 가려진 ‘이면의 문제점’들에 대한 공론화는 아직 부족해 보인다.

“본인은 (인간이 아닌 것을) 모르나요?”
“의심하기 시작했을 거야.”
“어떻게 모를 수가 있죠?”
“인간보다 더 인간답게! 이게 우리의 목표지.”
- 영화 [블레이드 러너] 중에서

인터넷만큼 중대한 발명이라고?

2017년 6월 12일. 오픈 R&D 플랫폼인 arXiv 사이트에 비틀스의 노래 제목 같은 논문 한 편이 업로드됐다. 『Attention is all you need』다. 이 논문은 서로 연관된 데이터들 간의 영향력(예를 들면 ‘개’는 ‘cat’보다 ‘dog’에 더 큰 영향력을 가질 수 있다)을 수치화해 인공지능이 학습할 때 알려주는 ‘어텐션(attention)’이라는 개념을 더욱 확장해 만든 새로운 기술을 소개했다. 바로 ‘트랜스포머(Transformer)’다.

트랜스포머는 자연어 처리 능력을 평가하는 테스트(BLEU)에서 당대 최고 능력을 보여주면서 그 혁신적 성능에 대한 극찬이 이어졌다. 현재까지도 6만5593번 인용되는 기염을 토하고 있다. 심지어 국내 구글 트렌드 기준으로는 영화 [트랜스포머]보다 훨씬 더 높은 관심도를 보여주기까지 했다(2023년 2월 15일 현재). 미국 스탠퍼드대학교 HAI(Human-Centered Intelligence) 연구소에서는 ‘파운데이션 모델(다양한 목적에 사용하기 위해 개발하고 학습된 초거대 모델)’이라고 부르면서, 이 기술이 만들어나갈 인공지능 생태계를 강조하기도 했다.

그리고 2022년 11월 30일, 드디어 ‘그놈’이 우리 곁에 나타났다. 바로 ‘트랜스포머 생태계’의 끝판왕으로 등극한 챗(chat)GPT다. 마이크로소프트 창업주인 빌 게이츠가 “인터넷만큼 중대한 발명”이라고 감격해 마지않은 대화형 인공지능이다.

인터넷은 시공간을 초월한 ‘연결’이라는 기반을 만들면서 인간의 삶을 대전환했다. 챗GPT는 방대한 데이터에 대해 혁명적인 ‘가공과 접근’이라는 기반 위에 설치됐으니, 가히 또 한 번 인류 삶의 대전환에 대한 논의가 나올 법도 하다. 시공간을 초월하고, 접근 가능한 데이터 공간도 초월해가는 듯하니, 이제는 인간 본연의 ‘본질적인 가치의 생산’에 대한 논의들만 쏟아져 나오면 될 것 같지 않은가.

챗GPT: 인공지능이 대화를 이끌어가다

▎초거대 언어 모델을 비판했다는 이유로 구글에서 해고되었다고 주장한 팀니트 게브루 박사.

챗GPT는 1750억 개 매개변수로 구성된 초거대 언어 모델인 GPT(Generative Pre-trained Transfomer) 3.5 비전을 기반으로 하는 대화형 인공지능 서비스다. 여기서 말하는 언어 모델이란 무엇일까? 연속된 단어들로 문장을 구성할 때, 특정 위치(보통 마지막 위치)에 출현해 ‘가장 자연스러운 문장’을 이루게 될 확률을 단어들마다 계산해주는 인공지능이 바로 언어 모델이다.

인공지능이 자연스러운 문장을 만들기 위해 확률을 계산하려면 굉장히 복잡하고 다양한 연산이 연속적으로 이루어져야 한다. 각각의 연산에 사용되는 기본 정보들(함수의 계수나 상수 등)을 바로 매개변수라고 부른다. 언젠가부터(아마도 2020년 GPT-3가 발표되던 때부터) 이 매개변수가 1000억 개를 돌파하기 시작했는데, 이때부터 ‘초거대 모델(large language model)’이라는 호칭이 사용되기 시작했다. 현존하는 가장 큰 모델의 매개변수는 1조 개를 돌파했다(2022년 2월에 발표된 구글의 Switch-Transformer는 매개변수가 1조6000억 개에 달한다).

초거대 모델이 어떻게 이런 성능을 낼 수 있는가에 대한 수학적 증명은 아직 이루어지지 않았다. 하지만 대량의 데이터를 학습할 때 초거대 모델에 유리한 점이 있다는 게 많은 전문가의 의견이다. 또 매개변수를 ‘뇌 용량’이라는 메타포를 동원해 설명하는 전문가도 있다. 매개 변수의 정의부터 다시 들여다봐야 한다는 주장까지 공존하고 있으니, 챗GPT가 갖는 고도의 성능이 천문학적 분량의 학습 데이터와 매개변수, 또는 그 어떤 다른 연유에 의한 것인지에 대해서는 좀 더 연구가 필요해 보인다.

연구자들의 지적 호기심과는 무관하게 챗GPT는 사회에 충격을 안겨줬고, 새로운 세상을 준비해야 한다는 우려와 기대로 떠들썩하게 만들어버렸다. 이렇게 사회에 불러일으킨 충격의 크기야말로 ‘초거대’라는 말이 너무나 잘 어울리는 게 현실이랄까. 챗GPT에게 어떻게 이런 놀라운 성능을 보여주는지를 질문하면 학습에 사용된 방대한 데이터와 트랜스포머 기술에 기반하고 있다고 설명해준다.

우리가 더욱 주목해야 하는, 갇혀 있는 논의들

이제 초거대 인공지능은 한 나라를 대표하는 기술 패권의 상징이 됐을 만큼 개발 중요성이 커졌다. 하지만 초거대 인공지능 개발의 중요성에 비하여, 그 ‘초거대함’에 가려진 ‘이면의 문제점’들에 대한 공론화는 아직 부족해 보인다.

미국의 기술 전문 매체 Wired 2021년 7·8월호에는 구글 AI윤리팀 리더인 에티오피아계 미국 여성 팀니트 게브루(Timnit Gebru) 박사가 표지모델로 등장했다. 그녀는 2020년 2월, 구글 내부에 보낸 이메일이 발단이 되어 해고를 당했다고 주장해 큰 파문을 일으켰다. 문제가 된 이메일은 구글 브레인의 수장인 제프 딘(Jeff Dean)과의 대화에 대한 것이었는데, 그녀가 새로 작성한 초거대 언어 모델에 대한 비판적 입장을 드러낸 연구 논문이 주 요 내용이었다.

게브루 박사가 써낸 논문의 제목이 인상적이다.『통계학적 앵무새의 위험에 대하여: 언어 모델은 지나치게 거대해질 수 있는가』다. 그녀는 이 논문에서 초거대 인공지능 모델 연구가 가지는 네 가지 위험성을 지적했다. 첫째, 막대한 학습·운용 비용과 탄소 배출량에 관한 것이다. 연구에 따르면, 2억 개 정도의 매개변수를 가진 트랜스포머의 학습 과정에 65만6347kwh 규모의 전력이 소모되고, 이 과정에서 62만6155파운드의 CO2e(이산화탄소환산량)가 배출된다. 이는 자동차 한 대가 생산 후 폐기될 때까지 배출되는 탄소량의 6배에 달한다.

둘째, 정제되지 않은 막대한 데이터가 보여줄 윤리적 위험성이다. 특히 인터넷 사용 환경이 열악하고, 언어 사용 인구가 적은 지역의 소규모 데이터는 인공지능의 불균형한 판단을 심각하게 불러올 수 있음을 경고했다.

셋째, 인공지능에 대한 비판의 중심에 있는 ‘인식’의 문제다. 인공지능이 인간처럼 언어를 이해하지 못하며 ‘데이터를 기반으로 흉내 내고 있다’는 것이다. 이는 미국의 언어·심리철학자인 존 설(John Searle)이 워싱턴포스트에 기고한 칼럼을 떠올리게 한다. 존 설은 ‘중국어 방(The Chinese Room)’이라는 사고 실험을 통해 인공지능이 보여주는 결과만으로는 인공지능 자체가 진정한 인식이 있는 존재인지를 판단할 수 없다고 주장했다. 그는 기고문에서 “IBM의 왓슨이 TV 퀴즈쇼 [제퍼디!(Jeopardy!)]에서 우승했다고 해도, 왓슨은 자기가 우승했다는 걸 모를 것이다”라고 했다. 게브루 박사의 주장은 여기서 한 발 더 나아가 더 큰 우려를 자아내게 한다. 챗GPT가 보여주는 황당한 성능과 이로 인한 사회적 관심은 국가와 빅테크들로 하여금 ‘초거대’ 데이터와 언어 모델 중심의 투자에 관심을 집중시키고 있다. 하지만 정작 ‘언어를 이해하고자 하는’ 본질적 연구에 대해서는 상대적 소외를 가속화할 것이라는 전망이다.

넷째, 가짜뉴스나 딥페이크 등에 챗GPT를 악용할 가능성이다. 물론 이러한 논의는 게브루 박사만의 생각도, 그녀 이전에 전혀 논의가 없었던 것도 아니다. 하지만 분명한 것은 챗GPT로 인해 이러한 논의에 다시 진지하게 마주 서야 하는 상황이 도래했다는 현실이다. 인공지능은 유사 이래 인류가 만든 모든 지적 창조물(intellectual construct) 중에서 인류와의 ‘공존(symbiosis)’ 가능성을 시험받고 있는 유일한 피조물이다. 그토록 완전한 성능과 무한한 가능성을 ‘만든 이’마저 잘 모르고 있다는 ‘두려움’ 때문일 것이다. 이런 두려움은 앞으로 폭발적인 발전만 앞두고 있는 인공지능을 대하는 사회적 원칙과 성숙함, ‘모르는 것’에 대한 인류의 무한한 지적 욕망의 원동력으로 치환될 것이다. 결국에는 ‘갇혀 있는 사실’들에 대한 발견과 재발견도 계속 반복될 것이다.

※ 박외진 대표는… KAIST 전산학과에서 박사학위를 받았다. 2011년 인공지능 전문기업 아크릴을 창업했다. 현재까지 금융·보험·헬스케어 분야에서 다수 기업과 디지털전환 여정을 함께하고 있다. 과기부 차세대 인공지능 예타사업 기획위원을 비롯, 국가 인공지능 전략 수립에도 활발히 참여 중이다.

Tech

챗GPT: 거대한 ‘통계학적 앵무새’가 가리고 있는 것들

고객센터