Tech

스스로 앱 만드는 AI 비서 실현될까 

 

2억 달러를 투자받은 28세 스콧 우와 그가 이끄는 코그니션의 코딩 전문가 팀은 외부 도움 없이 스스로 프로그래밍을 할 수 있는 AI 도구를 개발 중이다. 성공한다면 업계 전체를 뒤흔들 잠재력이 있다. 가치평가 액수인 20억 달러는 진정한 혁신의 결과일까, 아니면 단순한 과대평가일까?

▎인간 대 AI 스콧 우 코그니션 CEO는 한 채용 행사에서 구직자들에게 자신의 AI보다 수의 제곱을 빨리 계산해보라는 도전을 제시했다. 우는 “AI 데빈보다 높은 점수를 획득할 수 있다면 코그니션 팀에 와서 일자리를 알아보라”고 말했다. / 사진:PHOTOGRAPH BY CODY PICKENS FOR FORBES
2023년 크리스마스 직전, 미국 샌프란시스코에 있는 AI 스타트업 코그니션의 소규모 팀은 자사의 신생 코딩 비서인 데빈의 복잡한 데이터 서버를 구성하기 위해 악전고투 중이었다. 몇 시간 동안 설치 설명서를 들여다보고 여러 명령어를 시도해봤지만 서버는 작동하지 않았다. 지치고 좌절한 팀은 이 작업을 데빈에게 맡겨봤다.

AI가 일을 시작하자 이 AI를 개발한 사람들은 무척 당황했다. 공동 설립자이자 제품 부문 대표인 월든 얀(21)은 “데빈이 무슨 흑마술 같은 알 수 없는 명령어들을 실행했다”고 돌이켰다. 처음에는 데빈도 별수 없어보였다. 그러다가 몇 시간 동안 빨간불이던 서버 터미널 등이 초록불로 바뀌었다. 데이터 서버가 가동된 것이다.

팀은 자신들이 미처 보지 못했던 잘못된 시스템파일을 데빈이 삭제했음을 깨달았다. 얀은 “앞으로 다가올 소프트웨어 엔지니어링의 지각변동을 직감한 순간이었다”고 말했다. 이는 데빈이 처음으로 완료한 중요 작업이었고, 지난한 코딩 작업을 AI에게 맡기겠다는 코그니션의 비전을 보여주는 개념증명이 됐다. 그로부터 거의 1년이 지난 현재 데빈은 기본적인 엔지니어링 업무를 수행한다. 버그를 찾아 수정하고, 코드를 업데이트하고, 플랫폼 간 이주를 수행한다. ‘이 코드 기반을 정리해’라는 단순한 명령어를 입력하면 데빈이 실행 계획을 수립하고 이를 진행한다. 대부분의 경우 계획대로 완료된다.

깃허브(2018년 75억 달러로 마이크로소프트에 인수), 13억 달러 가치를 평가받은 코데이엄 등 같은 업계에서 더 유명하고 규모가 큰 경쟁사와는 다른 접근법이다. 깃허브와 코데이엄도 인공지능 기반 추천을 통해 코딩을 돕는 디지털 비서를 제공한다. 그러나 개발자를 뜻하는 영어 단어(developer)의 앞부분 데브(dev)에서 이름을 따온 데빈은 이론상 인간의 개입 없이 스스로 코드를 작성하는 자율 AI 에이전트로, 보통 개발자에게 할당되는 프로젝트 전체를 완수할 수 있다. 코그니션의 설립자 겸 CEO인 스콧 우(28)는 “우리는 텍스트 완성에서 작업 완수로 넘어갈 기회를 포착했다”고 말했다.

구글의 새 코드 25% 이상을 AI가 작성

AI가 생성한 코드는 이미 업계를 바꿔놓고 있다. 지난 10월 순다르 피차이 구글 CEO는 구글의 새 코드 25% 이상을 AI가 작성한다고 말했다. 지난 7월 사티야 나델라 마이크로소프트 CEO는 2024년 연 환산 매출 20억 달러를 달성한 깃허브에서 코드 완성 도구가 매출의 40%를 차지했다고 밝혔다. 피치북 애널리스트 브렌던 버크는 AI 코딩이 생성형 AI에서 가장 많은 투자를 받은 분야이며, 여기에 주력하는 스타트업은 2024년 상반기에만 10억 달러 이상의 투자를 유치했다고 밝혔다.

실제 매출은 이제 막 성장하기 시작했다. 시장조사업체 IDC는 2029년까지 고작 40억 달러를 웃돌 것으로 전망한다. 다수의 AI 코딩 스타트업이 연 환산 매출 1000만 달러를 넘어섰다. 코그니션은 매출을 공개하지 않았지만 러셀 캐플런 사장은 수십 개 고객사와 계약을 체결했다고 밝혔다. 통상 연간 계약은 수백만 달러에서 수천만 달러 규모다. 그러나 코그니션 외에도 앤스로픽, 아마존, IBM 등 대기업과 풀사이드(가치평가 30억 달러), 애니스피어(가치평가 4억 달러) 등 스타트업들도 이 기회를 노리고 있다. 코드를 작성하는 능력은 이미 일반적인 AI 모델의 “기본 기능”이 되었다고 IDC 애널리스트인 리투 조티가 말했다. 그는 이 분야의 리더가 여전히 오픈AI의 챗GPT라고 강조했다. 그러나 코그니션이 개발하는 AI처럼 스스로 작업할 수 있는 코딩 AI는 “지각변동을 일으킬 것”이라고 덧붙였다.

프로그래머로 일하며 13만 달러의 중위 임금을 받는 미국인 500만 명에게는 그다지 좋은 소식이 아닐 것이다. 중국과 인도의 프로그래머 1300만 명은 그보다 훨씬 적은 급여를 받는다. 우는 대규모 실직이 눈앞에 다가온 것은 아니라며 이 분야가 “공급부족으로 인해 어려움을 겪어왔다”고 주장했다.

평범한 프로그래머는 걱정스럽겠지만 투자자들은 기뻐한다. 피터 틸의 파운더스 펀드와 코슬라 벤처스는 25명으로 구성된 우의 팀에 기대를 걸고 있으며, 지난 4월 시리즈 B 펀딩에서 코그니션에 1억7600만 달러를 투자하며 설립 6개월 만에 가치평가액을 20억 달러로 높였다. 1월 2100만 달러로 마감된 시리즈 A 펀딩 이후 불과 3개월 만의 일이다.

코그니션의 고객사로는 2023년 연 환산 매출 3억 달러 규모인 비용 관리 회사 램프(불필요한 코드를 테스트하고 정리하는 데 사용), 회계연도 2024년 기준 매출 17억 달러인 데이터 플랫폼 몽고DB(데빈으로 낡은 코드 구조 업데이트) 등이 있다. 몽고DB 최고제품책임자 사히르 아잠은 데빈을 활용해 고객의 비용을 수백만 달러나 절감했다고 밝혔다. 2023년 매출이 80억 달러인 핀테크 누뱅크의 프로그래머들은 코드 저장소 업데이트 등의 작업에 데빈을 활용한다.

아직 초창기인 분야지만 파운더스 펀드의 파트너인 존 루티그는 코그니션이 “다른 코딩 에이전트가 따라잡기 아주 힘들 정도로” 앞서 나간다고 생각했기 때문에 코그니션에 투자했다. 마이크로소프트도 비슷한 생각인 듯하다. 지난 5월 코그니션과 제휴하고 데빈을 자사 애저 클라우드 개발자에게 제공하기로 했다. 케빈 스콧 마이크로소프트 CTO는 회사의 연례 개발자 콘퍼런스에서 데빈을 “뛰어난” 도구라고 호평했다. 그러나 실리콘밸리는 아마존과 구글에 잠시 동안 우위를 점했다가 스러진 회사들의 시체로 가득한 곳이다.

코그니션을 호평하는 측에서는 코그니션의 세계 최고 수준 코딩 전문가 3명이야말로 궁극의 코딩 기계를 만들 능력이 있으며, 화려한 수상 내역이 이를 입증한다고 본다. 코그니션 설립자들은 모두 프로그래밍 대회에서 만난 국제 대회 금메달급 코딩 전문가다. 우는 초등학교 때부터 수학 신동이었으며 코딩 대회를 개최하는 프로그래머 커뮤니티 사이트 코드포스에서 최고 등급인 ‘전설의 그랜드마스터’ 칭호를 받았다. 코그니션의 에인절 투자자이자 램프의 CEO인 에릭 글리먼은 우가 “그동안 봤던 사람들 중 지능지수 상위 5위권”이라고 평했다.

자신의 회사 컨빅션을 통해 세 번의 펀딩 라운드에서 코그니션에 투자한 벤처투자자 새라 궈는 “우는 명석하고, 호기심이 왕성하고, 무한한 야망을 지닌 인물”이라고 말했다. 우는 포브스 30세 이하 30인에 선정되기도 했다. 코그니션 이전에 설립한 회사 런치클럽으로 2019년 목록에 올랐다. 런치클럽은 AI를 사용하여 네트워킹 회의를 예약하는 회사다. 코그니션의 한 투자자는 우가 다른 분야에 관심을 갖게 되면서 런치클럽을 떠났으며, 이후 런치클럽은 약 3000만 달러 투자를 유치하며 여전히 순항 중이라고 포브스에 말했다.

코그니션은 지난 3월 출시되어 큰 화제를 일으켰다. X(구 트위터) 조회수 3000만 건을 기록한 시연 영상에서 코그니션은 데빈이 “주요 AI 기업의 실제 엔지니어링 면접에 합격”하고 까다로운 코딩 과제를 해결했다고 주장했다. 일부 엔지니어들은 데빈의 기술적 역량에 감탄했다. 일자리를 잃을까 두려워하는 사람들도 있었다. 출시 직후 우가 중학교 1학년일 때 수학 경시대회를 휩쓸던 영상이 다시 화제가 되자 평론가들은 “우는 인간이 아니라 AI”라든가 “데빈은 메시지 앱에서 질문에 답해주는 스콧”이라는 등의 농담을 하기도 했다.

그러자 미국 텍사스주 오스틴의 저명한 독립 개발자 칼 브라운이 데빈은 사기라고 주장했다. 조회수 50만 건을 기록한 영상 “데빈의 정체를 밝힌다”에서 브라운은 코그니션이 AI 엔지니어를 과장하고 있다고 말했다. 브라운이 검토한 결과 데빈은 작업을 완료하기 위해 인간보다 훨씬 많은 입력을 필요로 했고 그 과정에서 오류를 일으켰다.

이런 경험은 데빈이 AI 거품에 불과한 것 아니냐는 의심으로 이어졌다. 데이터 라벨링 회사 라벨박스의 엔지니어인 크리슈 마네어는 데빈의 웹 앱 제작 능력을 테스트하면서 멋진 사용자 인터페이스를 디자인하라고 요청했는데 결과가 엉망이었다고 밝혔다. 여러 경쟁사 설립자들은 코그니션이 데빈의 능력을 과장하여 마치 엔지니어가 아무 준비 없이 데빈으로 뭐든지 코딩할 수 있는 것처럼 꾸며낸다고 포브스에 지적했다. 이들의 주장에 따르면 데빈의 현재 기능은 훨씬 범위가 좁으며 기존 코드를 정리하는 정도의 사전 정의된 작업에 한정되어 있다. 포브스는 실시간 데모에서 데빈에게 기타를 튜닝하는 앱을 만들라고 명령했다. 데빈은 약 10분 만에 앱을 만들어냈지만, 그 앱은 테스트를 위해 연주한 음의 높이를 제대로 파악하지 못했다. 경쟁사인 코딩 스타트업 코데이엄의 CEO 바룬 모언은 “과장과 실제 작동 방식 간에는 항상 차이가 있다”고 말했다.

우는 데빈이 완벽하지 않다는 사실을 인정했다. 그는 샌프란시스코만이 내려다보이는 파운더스 펀드 본사에서 “실제 소프트웨어 엔지니어링은 대단히 복잡하다”고 말했다. 그리고 데빈을 깎아내리던 사람들 중 데빈의 능력에 감탄한 사람도 있었다. 우는 개발 중인 에이전트를 사용해본 초기 기업 고객의 피드백 덕분에 출시 이후 7개월 동안 데빈의 기능이 크게 향상됐다고 주장했다. 누뱅크의 CTO 비터 올리비에는 “우리는 이 도구가 마법 지팡이라고 생각하지 않는다”며 “조심스럽게 낙관적인 입장”이라고 말했다. 그는 경우에 따라서 데빈을 이용하는 엔지니어가 작업을 8배나 빨리 마쳤다고 덧붙였다.

코그니션은 실험을 계속한다. 올해 초에는 데빈에 자신을 도울 보조 AI를 실행하는 기능을 추가했다. 그러나 코그니션은 이 새 ‘관리자’ 모드를 테스트하면서 부하 데빈이 자신의 부하를 만들고, 또 그 부하의 부하가 만들어지면서 끝없이 이어지는 AI 관료제를 만들어낸다는 것을 알아냈다. 캐플런은 “AI가 계속 업무를 위임했기 때문에 작업을 취소해야 했다”고 말했다.

캐플런은 여러 개의 데빈이 마치 ‘신입 엔지니어 군단’처럼 서로 다른 프로젝트에서 동시에 작업할 때 가장 효과가 좋다고 강조했다. 생계를 위해 코딩을 하는 사람들을 불편하게 만들 법한 표현이다. 우는 코그니션에 대한 부정적 견해 중 일부는 AI가 소프트웨어 엔지니어링 일자리를 빼앗을 수도 있다는 우려에서 나온다고 말했다. 우는 데빈이 기업의 프로젝트를 늘려서 유의미한 일을 하는 직원을 더 많이 채용하게 할 것이라고 주장했다.

우는 “두려워하는 사람이 많다”며 “다들 이 새로운 패러다임에서 무슨 일이 벌어질지 궁금해한다”고 말했다.

※ How To Play It - AI 분야의 발전은 소프트웨어 코딩과 디지털 비서 기술을 융합하고 있다. 이러한 생산성 중시 트렌드를 활용하는 최선의 길은 서비스나우를 택하는 것이다. 미국 캘리포니아주 샌타클래라에 있는 이 회사는 인기 기업 자동화 플랫폼을 개발한다. 이 회사의 나우 플랫폼과 결합된 코드 보조 모델은 생성형 AI를 활용하여 개발자가 단순 텍스트 프롬프트로 코드를 작성하도록 돕는다. 회사는 글로벌 고객 8100명과 포천 500대 기업 중 약 85%가 자사 고객이라고 주장한다. 2024년 2분기 총매출은 26억 달러로, 전년 동기 대비 22% 증가했다. 이 회사의 광고 효과 성장을 고려하면 올해 이미 45% 상승한 주가는 18개월 내에 지금보다 18% 더 오른 1170달러까지 높아질 여력이 있다. 존 D. 마크먼은 마크먼 캐피털 인사이트의 사장이자 패스트 포워드 인베스팅의 편집자다.


▎ 사진:PATRICK WELSH FOR FORBES
※ 느릿느릿 발전한 인공지능 - “SF에서나 나오던 인공지능이 다가오고 있다.” 포브스는 33년 전인 1991년 표지 기사에서 이렇게 선언했다. 그러나 AI는 예술 작품을 만들거나 코딩을 하기에 앞서 기초부터 숙달해야 했다.

인공지능이 시장에 다가오고 있지만, 미래학자들은 지루하다고 여길 만한 모습이다. 생각하는 기계로 수행할 수 있는 작업은 책을 옮겨 적고, 소포와 편지를 분류하고, 의학적 이미지를 비교하고, 조립 라인의 제품에서 결함을 탐지하고, 변호사와 시장조사 전문가를 위해 잡지·신문 조사의 속도를 높이고, 전화 고객에게 연락처를 알려주는 일이다. 어쩌면 머지않아 인공지능은 비서 대신 음성을 받아 적고, 손글씨를 읽고, 우편 주문 카탈로그의 수익을 높이고, 일부 공장 게이트에서 경비를 대체하고, 자동응답기의 메시지를 처리하고, 일반적인 ATM 카드 없이 자동 은행원을 운영하게 될 수도 있다. 대화를 할 수 있는 것처럼 보이는 소프트웨어에 대한 이야기가 많지만, 현재 인공지능에 대한 희망은 부풀려져 있다. 아직까지 성공 사례는 대체로 공정 자동화 같은 틈새 분야에 머물러 있다. 기계가 사실이나 상식을 이해하게 만드는 것은 대단히 어렵다. – 포브스, 1991년 12월 23일

- Rashi Shrivastava, Richard Nieva 포브스 기자

위 기사의 원문은 http://forbes.com 에서 보실 수 있습니다.

포브스 코리아 온라인 서비스는 포브스 본사와의 저작권 계약상 해외 기사의 전문보기가 제공되지 않습니다.

이 점 양해해주시기 바랍니다.


202501호 (2024.12.23)
목차보기
  • 금주의 베스트 기사
이전 1 / 2 다음