AI 검색 도구가 기자의 글을 표절하여 마치 언론처럼 퍼뜨린다는 비판이 거세다. 이런 도구는 부정확하고 낡은 정보로 가득한 AI 생성 블로그와 링크드인 게시물에 점점 더 많이 의존하고 있다.
▎지난 4월 AI 검색 스타트업 퍼플렉시티의 CEO는 “인용은 우리의 화폐”라고 포브스에 말했다. 현재 퍼플렉시티는 다양한 주제에서 AI 생성 블로그 게시물을 갈수록 많이 인용하고 있다. / 사진:CHRISTIE HEMM KLOK FOR FORBES |
|
AI 검색엔진 퍼플렉시티(Perplexity)는 챗GPT 등 다른 생성형 AI와의 차별점을 강조한다. 출처는 빼고 데이터를 마구 주입하는 대신 원하는 주제에 대한 짧은 요약을 인터넷의 믿을 만한 최신 실시간 정보 출처 링크와 함께 제공한다. 아라빈드 스리니바스 CEO는 “인용은 우리의 화폐”라고 포브스에 말했다.그러나 퍼플렉시티도 기자의 글을 적절한 출처 표기 없이 재발행했다는 이유로 역풍을 맞고 있다. 또 포브스의 취재에 따르면 퍼플렉시티는 정확하지 않고, 오래되고, 때로는 모순되는 정보가 담긴 AI 생성 블로그를 권위 있는 출처로 표시한다.AI 콘텐트 탐지 플랫폼 GPT제로의 조사에 따르면 퍼플렉시티의 검색엔진은 여행, 스포츠, 음식, 기술, 정치 등 다양한 분야의 주제에 대한 AI 생성 게시물을 인용하여 정보를 가져온다. 이 조사에서는 출처가 AI로 생성됐는지 여부를 GPT제로의 AI 탐지 소프트웨어로 판정했다. GPT 제로의 AI 탐지 정확도는 97%에 달하는데, 이 조사에서는 GPT제로에서 판정한 AI 생성 가능성이 95% 이상인 경우에만 해당 출처가 AI로 생성됐다고 추정됐다. 포브스는 GPT제로의 평가를 검증하기 위해 정확도 99%인 AI 탐지 도구 디텍트GPT로 추가 검사를 수행했다.100개가 넘는 검색어를 대상으로 실시한 이 조사에 따르면 퍼플렉시티 사용자가 평균적으로 세 번 검색어를 입력한 뒤 AI 생성 출처가 나타났다.GPT제로의 에드워드 티안 CEO는 “퍼플렉시티는 출처를 능가할 수 없다”며 “출처가 AI의 환각이라면 출력도 그렇게 된다”고 말했다.‘일본 교토의 문화 축제’, ‘AI가 의료산업에 미치는 영향’, ‘태국 방콕에서 꼭 먹어볼 길거리 음식’, ‘장래가 기대되는 테니스 유망주’ 등으로 검색하면 AI 생성 자료를 인용한 답변을 내놓았다. ‘일본 교토의 문화 축제’라는 검색어에 대해 퍼플렉시티는 AI로 생성된 링크드인 게시물이 유일한 출처인 요약을 제시했다. 또 다른 여행 관련 검색어인 ‘베트남의 수상 시장’에 대해서는 AI 생성 블로그를 인용한 데다 오래되어 연관성 없는 정보를 포함하여 제시했다는 것이 이 조사에서 밝혀졌다.퍼플렉시티의 최고사업책임자 드미트리 셰벨렌코는 포브스에 보낸 이메일 성명에서 자사 시스템이 “완전무결하지 않다”며 연관성 있고 품질이 뛰어난 출처를 식별하도록 프로세스를 지속적으로 개선하는 중이라고 말했다. 퍼플렉시티는 여러 분야의 콘텐트에 ‘신뢰 점수’를 할당하여 출처를 권위 있는 것으로 평가한다. 이 알고리즘은 대량의 스팸을 포함하는 웹사이트의 순위를 낮추고 검색에서 제외한다고 셰벨렌코는 말했다. 예를 들어 마이크로소프트와 데이터브릭스의 게시물은 검색 결과에서 다른 게시물에 비해 우선시된다는 것이다.셰벨렌코는 “우리는 이 프로세스의 일부로 콘텐트가 AI에 의해 생성됐는지 탐지하는 자체 알고리즘을 개발했다”며 “이 시스템은 다른 탐지 도구와 마찬가지로 완벽하지 않으며, 특히 AI 생성 콘텐트가 갈수록 정교해지고 있어 지속적으로 개선해야 한다”고 말했다.AI가 생성한 오물들이 인터넷에 범람하면서 갈수록 진짜와 가짜 콘텐트를 구분하기가 어려워지고 있다. 뿐만 아니라 점점 더 많은 합성 게시물이 웹 출처에 의존하는 제품에 흘러 들어가면서 일관성이나 정확성이 떨어지는 내용을 주입하여 “간접적인 환각”을 불러일으키고 있다고 티안은 말했다. 그는 “AI가 인터넷의 50%에 미치지 못하더라도 인터넷은 서로를 복제하고 참조하는 AI 콘텐트로 가득 찰 것”이라고 덧붙였다.많은 시나리오에서 퍼플렉시티는 권위 있다고 여겨지는 출처들을 두고 AI로 생성된 블로그 게시물에 의존하여 건강 정보를 제공했다. 예를 들어 “세균 감염 치료에 페니실린 대신 사용 가능한 대안”을 묻는 질문에 퍼플렉시티는 펜 메디신 베커라는 의료기관의 이비인후과와 알레르기과에서 게시한 AI 생성 블로그 게시물을 인용했다. GPT제로에 따르면 이 블로그가 AI로 생성됐을 가능성은 100%이며, 디텍트GPT에 따르면 이 게시물이 가짜일 확률은 94%다.이런 데이터 출처는 종종 상충 정보를 제시하기 때문에 신뢰하기 어렵다. AI로 생성된 블로그는 페니실린에 알레르기가 있는 경우 세팔로스포린 같은 항생제를 대안으로 사용할 수 있다고 말했지만, 몇 문장 뒤에서는 “페니실린 알레르기가 있는 사람은 세팔로스포린을 피해야 한다”며 스스로 모순되는 말을 했다. 이러한 모순은 퍼플렉시티의 AI 시스템에 의해 생성된 답변에도 반영됐다고 티안은 말했다. 그러나 챗봇은 가장 안전한 대안 항생제를 찾으려면 전문가와 상담할 것을 제안하기는 했다.펜 메디신 베커의 이비인후과·알레르기과 고객센터는 포브스의 문의를 받고 펜 메디신 측을 연결해줬다. 그러나 병원에서 왜 AI를 사용하여 의료 정보를 제공하는 블로그 게시물을 작성하느냐는 질문에 펜 메디신의 대변인 홀리 아우어는 각 의료 분과의 웹사이트는 펜 메디신 측에서 관리하지 않는다며 “정확성과 무결성은 펜 메디신 브랜드와 관련돤 모든 웹 콘텐트의 핵심 표준이며, 이 콘텐트를 조사하고 필요한 조치를 취할 것”이라고 답했다. 누가 이 웹사이트를 관리하는지는 명확하지 않다.셰벨렌코는 조사의 예시가 퍼플렉시티에 의해 인용된 출처에 대한 “종합적인 평가”를 제공하지 않는다고 말했지만 시스템에서 인용하는 출처의 유형에 대한 데이터를 공유하는 것은 거부했다.셰벨렌코는 “사용자의 질문 유형과 위치에 따라 다르다”며 “일본에 있는 사람이 가장 좋은 TV를 물었을 때 참조하는 출처는 미국 사람이 운동화를 어디서 살지 물었을 때 참조하는 출처와 매우 다를 것”이라고 말했다.퍼플렉시티는 권위 있는 정보 출처를 다루는 방식에서도 어려움을 겪는다. 기업가치가 수십억 달러인 이 스타트업은 최근 포브스, CNBC, 블룸버그 등 다수의 언론기관으로부터 기자의 글을 표절했다는 혐의를 받고 조사 대상이 됐다. 이달 초 포브스는 퍼플렉시티가 에릭 슈미트 전 구글 CEO의 비밀 AI 드론 프로젝트에 대한 포브스 단독 기사의 문장, 세부 정보, 맞춤 제작된 그래픽을 출처 표기 없이 가져간 것을 발견했다. 이 회사는 포브스 기사를 글, 팟캐스트, 유튜브 영상 등 다양한 매체에서 재생산하고 직접 알림 메시지를 보내 자사 사용자들에게 공격적으로 노출했다.랜달 레인 포브스 최고콘텐트책임자는 “퍼플렉시티는 AI의 발전이 직면한 변곡점을 나타낸다. 기술적인 부분에서는 뛰어나지만 인간의 기본 소양은 부족한 스리니바스 같은 사람들의 부도덕성은 실질적인 위험을 야기한다”고 썼다. 포브스는 퍼플렉시티 측이 저작권을 침해했다며 회사 측에 정지 명령을 보냈다. 퍼플렉시티의 스리니바스 CEO는 사실은 표절 대상이 아니라며 혐의를 부인했다. 그는 “포브스의 콘텐트를 재작성, 재배포, 재발행하거나 기타 부적절한 방식으로 활용하지 않았다”고 말했다.GPT제로의 조사에 따르면 ‘에릭 슈미트의 전투용 AI 드론’에 대한 퍼플렉시티 검색은 퍼플렉시티의 첫 페이지에 소개되는 ‘추천 검색 항목’ 중 하나인데, 이 또한 AI를 출처로 사용하여 작성된 블로그 게시물을 활용했다. GPT제로는 98%, 디텍트GPT는 99% 확률로 해당 블로그가 AI에 의해 생성됐다고 판정했다.IT 전문지 와이어드의 취재에 따르면 퍼플렉시티는 비밀 IP 주소를 통해 와이어드를 비롯해 미디어 업체 콘데나스트가 소유한 다른 간행물에 접근하여 글을 수집했다. 콘데나스트 측 엔지니어는 퍼플렉시티가 콘텐트를 훔치지 못하도록 웹 데이터 수집을 차단했지만, 그래도 소용없었다. 그때도 퍼플렉시티의 검색엔진은 부정확한 정보와 가짜 인용을 지어냈다. 스리니바스는 와이어드 측의 주장에 대응하지 않았지만, “와이어드의 질문은 퍼플렉시티와 인터넷의 작동 방식에 대한 깊고 근본적인 오해를 반영하고 있다”고 말했다.셰벨렌코는 회사 제품이 의존하는 건강한 정보 생태계를 만드는 데 출판사의 역할이 중요하다는 사실을 회사에서 잘 인지하고 있다고 말했다. 이를 위해 퍼플렉시티는 “사상 최초”라고 주장하는 매출 공유 프로그램을 만들었다. 제한된 금액이지만 출판사에 보상을 해주는 프로그램이다. 자사 플랫폼에 광고를 넣어 브랜드가 자사 검색 또는 제품에 대한 후속 질문이나 관련 질문을 후원할 수 있게 만들 계획이다. 퍼플렉시티가 매출을 올리는 특정 AI 생성 응답의 경우, 해당 응답에서 출처로 인용된 출판사는 그 매출의 일정 비율을 받을 수 있다. 회사는 매출의 몇 퍼센트나 공유할지는 밝히지 않았다. 퍼플렉서티는 현재 시사지 디 애틀랜틱과 잠재적 제휴 관련 협상 중이다.오픈AI에서 연구원으로 일하다가 2022년 퍼플렉시티를 설립한 스리니바스는 피치북에 따르면 벤처 펀딩에서 1억7000만 달러가 넘는 투자금을 유치했다. 투자자들 가운데는 아마존 설립자 제프 베이조스, 구글 수석 과학자 제프 딘, 유튜브 CEO를 지낸 수전 보이치키, 오픈AI 공동 설립자 안드레이 카파시, 메타 수석 과학자 얀 르쿤 등 IT 업계의 저명인사들이 포함되어 있다. 최근 퍼플렉시티의 대화형 검색 챗봇은 큰 인기를 끌었다. 1500만 명이 넘는 사용자 중에는 엔비디아 CEO 젠슨 황, 델 설립자 겸 CEO인 마이클 델도 있다.퍼플렉시티는 검색 증강 생성(RAG)이라는 프로세스를 활용한다. AI 시스템이 외부 데이터 출처로부터 실시간으로 정보를 검색하여 챗봇의 응답을 개선하는 기술이다. 그러나 이러한 출처의 품질 저하는 AI가 생성하는 응답에 직접적으로 영향을 미칠 것이라고 전문가들은 말한다.케임브리지대의 머신러닝 연구자인 잭 슈마일로브는 실시간 출처 자체에 편견이나 부정확성이 포함되어 있다면 이러한 데이터를 바탕으로 하는 모든 애플리케이션은 결과적으로 ‘모델 붕괴’ 현상을 겪을 것이라고 말했다. 모델 붕괴란 AI로 생성된 데이터를 학습한 AI 모델이 ‘정보는 없고 편견만 있기 때문에 잘못된 정보를 쏟아내기 시작하는 현상’을 말한다. 슈마일로브는 “그런 자료를 활용하면 그럴 의도가 전혀 없더라도 잘못된 정보를 확산하기가 훨씬 쉬워진다”고 덧붙였다.티안은 “퍼플렉시티는 하나의 사례에 불과하다”며 “문제 전체가 아니라 증상일 뿐”이라고 말했다.- Rashi Shrivastava 포브스 기자
위 기사의 원문은 http://forbes.com 에서 보실 수 있습니다.포브스 코리아 온라인 서비스는 포브스 본사와의 저작권 계약상 해외 기사의 전문보기가 제공되지 않습니다.이 점 양해해주시기 바랍니다.