Tech

AI칩 기술 키워드별 특허 현황 

엔비디아와 글로벌 IT 연합군의 대결 

이진원 기자
생성형 인공지능(Gen AI)의 활용이 폭발적으로 증가하면서 AI칩의 수요도 급증하고 있다. 이에 따라 업계는 더 빠르고 더 효율적인 AI칩 개발과 생산에 총력을 기울이고 있다. 포브스코리아는 거대한 미래 기술의 지각변동에서 누가 진정한 기술력을 보유하고 있는지 기술 키워드별, 글로벌 플레이어별로 특허 현황을 들여다봤다.

▎지난 3월 18일 미국 새너제이에서 열린 엔비디아 GTC 기조연설에서 젠슨 황 엔비디아 대표가 AI칩 관련 처리 장치에 대해 설명하고 있다. / 사진:AP Photo/Eric Risberg
AI칩은 새로운 금맥이다. 가트너에 따르면 2024년 시장수요 670억 달러(90조원)는 2027년 1190억 달러(161조원)로 늘어 향후 3년간 77.6% 성장이 예측된다. 현시점에서 엔비디아-TSMC 연대가 시장형 GPU(그래픽처리장치)로 AI 반도체 시장을 선점한 덕분에 80% 넘는 점유율로 승승장구하고 있다. 2023년 1월 이후 엔비디아의 주가는 450% 이상 급등했고, 시총은 2조 달러(2714조원)에 넘어서 마이크로소프트, 애플에 이어 미국에서 세 번째로 가치가 높은 기업으로 성장했다.

하지만 AI 광산에서 금을 찾는 건 엔비디아뿐만이 아니다. 차세대 AI 하드웨어 개발 전쟁에 굴지의 글로벌기업들이 참전을 선포하고 그동안 쌓아온 기술력을 기반으로 차세대 AI칩 개발에 속도를 내고 있다. 주요 플레이어들을 구분해보면, 인텔·AMD 등 전통적CPU(중앙처리장치) 제조사, 삼성전자·퀄컴·화웨이 등 반도체 제조사, 구글·메타·애플·AWS·알리바바 등 글로벌 IT 기업, 삼바노바 시스템즈·세레브라스 시스템즈·그로크·리벨리온 등 신생 AI칩 스타트업이다. 이들 모두 AI 워크로드를 위한 특수 프로세서 개발에 총력을 기울이고 있다.

AI칩 시장 역학에 대한 업계 전문가들의 예측은 양분된다. “현재 지배력을 가진 엔비디아가 한동안 독점력을 더 높일 것”과 “GPU를 대체할 새로운 방식의 AI칩 개발에 성공한 플레이어가 시장 판도를 수년 안에 바꿀 것”이란 의견이 대립하고 있다.

애널리스트 하쉬 차우한은 “엔비디아의 고객사들이 의존도를 줄이기 위해 자체 AI칩 개발에 나서고 있지만 성능이 강력한 엔비디아의 GPU를 계속 구매할 수밖에 없을 것”이라며 “엔비디아가 곧 출시할 블랙웰 GPUsms는 이전 제품보다 최대 25배 적은 비용과 에너지 소비로 LLM(대규모언어모델)을 실행할 수 있다”고 말했다. 그리고 “엔비디어가 AI칩 시장에서 지배적 플레이어로 남을 수밖에 없는 또 다른 이유는 공급망의 통제다”라며 “현재 고급 칩 제조 기술을 보유한 파운드리(반도체 위탁생산 전문업체) TSMC에 다른 경쟁사가 AI칩 제조를 의뢰하고 있지만, TSMC가 다른 고객의 수요를 충족하기 위해 생산량을 늘리더라도 TSMC 생산량의 60% 이상을 차지하는 엔비디아가 공급에서 우위를 점할 것”이라고 덧붙였다.

반면, 유발보거 쿠에라 CMO는 “AI 계산 경계가 확장함에 따라 기존 컴퓨팅이 효율적으로 해결하기 어려운 문제에 직면할 때 GPU의 한계는 분명해진다”며 “엔비디아의 AI칩 시장 지배력을 약화하기 위해 인텔, 암홀딩스, 구글, 퀄컴, 삼성전자 등이 연합을 구성했다”고전했다. UXL(Unified Acceleration)재단으로 일컬어지는 이 연합은 차세대 AI칩 설계, 반도체 파운드리 구축 등과 함께 개방형 소프트웨어 생태계를 구축하는 것이 핵심 목표다. 그리고 이러한 노력의 중심에는 인텔의 가속기 ‘원API’가 있다.

이를 설명하려면 엔비디아의 가속기이며, GPU를 애플리케이션으로 작성할 수 있게 하는 ‘CUDA’ 소프트웨어 플랫폼을 이해해야 한다. 쉽게 설명하자면 GPU를 구동하기 위해 모든 학계와 업계는 CUDA를 지난 20년간 사용해왔고 사실상 표준이 됐다. 하지만 문제는 엔비디아 제품에서만 작동한다는 점이다.

이 때문에 인텔을 중심으로 한 업계는 지난 몇 년 동안 CUDA를 대신할 대안 마련에 나섰고 개방형 사양이자 다중 아키텍처인 원API를 개발했다. 만일 엔비디아에 대한 대안이 마련되면 구글 같은 대량 고객은 상당한 비용을 절감할 수 있다. 또 퀄컴과 삼성전자 등 반도체 제조사도 AI가속기 시장에서 CUDA의 강력한 지배력을 깬다면 자체 제품의 견인력을 높일 수 있다.

인텔은 2025년 초 파운드리 선두 업체 TSMC를 기술적으로 추월한다는 목표로, 2030년까지 세계 2위의 파운드리로 도약하겠다는 포부를 갖고 있다. AI가속기 시장에서 경쟁이 치열할수록, AI 기능을 탑재한 칩이 많아질수록, 파운드리의 잠재고객이 더 많아질 것으로 보기 때문이다.

AI칩의 춘추 전국 시대 열리나

GPU 세대를 종식할 다양한 유형의 AI칩이 대기하고 있다. 각 유형의 차세대 AI칩은 하드웨어와 기능이 달라 어떤 기술이 GPU의 천하 통일 시대를 깨고 각자 도생할지에 관심이 집중된다.

특히 향후에는 다양한 AI 애플리케이션에 더욱 효율적인 솔루션을 제공하기 위해 세심하게 제작된 맞춤형 ASIC(주문형 반도체, Application Specific Integrated Circuit)시대가 도래할 것으로 보고 있다. 맥킨지앤컴퍼니의 ‘생성형 AI: 반도체산업의 차세대 S곡선은 무엇일까’ 보고서에 따르면, 현재 추론 및 훈련 워크로드를 관리할 수 있는 서버에는 CPU+GPU 방식이 가용성이 가장 뛰어나지만, 2030년경에는 ASIC칩을 탑재한 AI가속기가 특정 AI 작업에서 최적의 성능을 발휘할 것으로 전망했다.

ASIC는 특정 응용 분야 및 기기의 특수한 기능 하나하나에 맞춰 만들어진 집적회로를 말한다. 반도체는 크게 표준형 반도체(Standard)와 주문형 반도체(ASIC)로 나뉘는데, 표준형 반도체는 규격이 정해져 있어 일정 요건만 갖추면 어떤 전자제품에도 쓸 수 있다. 반면 주문형 반도체는 특정한 제품에 사용되며 반도체 생산업체가 특정 주문에 맞춰 생산한다. 주문형 반도체는 다품종 소량생산 방식의 상품으로, 주문 사항을 충족하기 위해서 뛰어난 반도체 설계 능력이 요구된다. 모건스탠리는 AI 전용 ASIC칩 시장은 2023년부터 2027년까지 매년 85%씩 성장해 300억 달러(40조원)에 이를 것으로 예상했다. 구글은 브로드컴과 협력하여 5세대 TPU(텐서 처리장치)를 개발하며 ASIC칩에 관심을 높이고 있다. 이 칩은 기존 CPU와 GPU보다 약 10배 빠르게 AI 워크로드를 처리할 수 있는 능력을 자랑한다.

더불어 AI칩 차세대 주요 기술 키워드는 HBM(고대역폭 메모리), FPGA(범용 비메모리반도체), QPU(양자처리장치), NPU(신경처리장치), 뉴로모픽 등으로 집약된다. AI칩 주요 기술별로 개념을 정리하고 특허 현황을 통해 어떤 기업이 기술력에서 우위를 점하고 있는지 살펴본다.

HBM


▎※ 2024년 5월 미국 특허 기준 출처: Patentpia
HBM(고대역폭 메모리, High Bandwidth Memory) 시장은 고대역폭, 저전력 소모, 확장성이 뛰어난 메모리에 대한 수요 증가, 인공지능 채택 증가, 전자장치의 소형화 추세 등으로 인해 크게 성장하고 있다. 국내 반도체 제조사 삼성전자, SK하이닉스를 비롯해 마이크론테크놀로지 등 주요 반도체 공급업체가 주도하고 있다.

지난해 HBM 시장점유율은 SK하이닉스 53%, 삼성전자 38%, 마이크론 9% 순이다. 대만의 시장조사업체 트랜스포스는 올해 HBM의 수요 성장률이 200%에 이르며 내년에는 그 두 배가 될 것으로 예상했다.

HBM 제조사들은 성능·전력 효율성 측면에서 이전 기술을 능가하는 솔루션을 내놓으며 지속적으로 고대역폭 메모리 시장에서 성장 기회를 창출하고 있다. 특히 자율주행차와 ADAS(첨단운전자보조시스템) 통합의 발전에 힘입어 자동차산업에서 고대역폭 메모리의 적용이 확대되고 있다. 사용자 기업들은 첨단 HBM 기술을 적용해 전력 소모를 줄이고 대기시간을 최소화하고 있다. 특히 북미 지역에서 HBM 메모리 채택률이 높은 것은 주로 빠른 데이터 처리를 위해 고대역폭 메모리 솔루션이 필요한 고성능 컴퓨팅 애플리케이션의 성장 덕분이다.

HBM 관련 미국 특허 현황을 들여다보면 삼성전자가 공개특허수, 등록특허수, 심사관피인용수, 해외패밀리수* 모두 가장 높다. 삼성전자의 5세대 HBM인 HBM3E는 시장 분위기를 반전할 수 있는 ‘키’로 꼽힌다. 4세대 HBM3 제품까지는 SK하이닉스가 엔비디아 공급을 독점하고 있었다. 하지만 삼성이 HBM3E 12단 제품을 가장 먼저 양산에 성공하면서 엔비디아의 ‘블랙웰(Blackwell, B200)’ 같은 신형 AI 슈퍼칩에 탑재, 공급될 수 있도록 물밑 작업이 한창이다.

※ 공개특허수, 등록특허수: 해당 기술의 포트폴리오 지표
※ 심사관피인용수: 파급력 지표로서 심사관이 후행 특허 심사 시 해당 특허를 인용하는 횟수다. 수가 많을수록 해당 기술 분야/기업의 선행성과 진보성을 나타낸다.
※ 해외특허패밀리수: 투자지표로서 해외에서 출원한 특허수다. 수가 많을수록 특허보호의 지역적 범위가 넓고 해외시장 확보력이 크다.

FPGA


▎※ 2024년 5월 미국 특허 기준 출처: Patentpia
글로벌 반도체 시장조사 기관인 세계반도체시장통계기구(WSTS)는 생성형 AI의 발달에 힘입어 반도체 시장이 전반적으로 회복되는 가운데, 학습용 GPU를 넘어선 추론용 AI 반도체인 FPGA(범용 비메모리반도체, Field Programmable Gate Arrays)로 반도체 시장의 무게중심이 쏠릴 것이라고 예측했다.

FPGA는 여러 애플리케이션에 맞게 구성(및 재구성)할 수 있는 프로그래밍이 가능한 실리콘칩이다. 특정 목적을 위해 설계된 ASIC와 달리 FPGA는 특히 지연시간이 짧은 맞춤형 애플리케이션에서 효율적인 유연성으로 알려져 있다. 딥 러닝 사용 사례에서 FPGA는 다양성, 전력 효율성, 적응성 측면에서 높이 평가된다.

FPGA는 특히 통신, 항공우주, 산업 자동화에 있어 세밀한 제어와 고속 작동을 제공하며 프로토타입 제작 및 하드웨어 가속에 자주 사용된다. FPGA 시장 규모는 2023년 75억 달러(10조원)이며, 2023년부터 2032년까지 연평균 성장률 9.7%를 기록해 2032년에는 약 142억 달러(19조원)에 이를 것으로 예상된다.

이 분야 선두는 미국 새너제이에 본사를 두고 있는 자일링스(Xilinx)로, 현재 AMD에 속해 있으며 FPGA 기술을 개척한 기업이다. 자일링스는 관련 특허수(공개특허 747건, 등록특허 735건), 심사관피인용수(3812건)에서 가장 우위를 점하고 있다. FPGA 분야에서 인텔-알테라 연합의 도전도 만만치않다. 인텔은 지난 2015년 고급 FPGA 포트폴리오를 보유한 알테라(Altera)를 인수했고, 8년 만인 지난 3월 독립형 FPGA 기업으로 다시 분사했다. 알테라의 FPGA 제품 애질렉스(Agilex)는 3, 5, 7, 9시리즈로 나뉘어 저전력, 저비용 임베디드 에지 컴퓨팅부터 고급 혼합 신호 데이터 및 처리 FPGA에 이르기까지 광범위한 애플리케이션으로 다양화했다.

또 소규모 칩 설계업체인 래티스반도체(Lattice Semiconductor)는 독립적으로 시장점유율 경쟁에서 조용히 승리해왔다. 그 배경은 재프로그래밍할 수 있는 논리 셀이 더 적은 저가형·소형 FPGA에 중점을 뒀기 때문이다. 소형 FPGA는 산업 장비 및 센서, 공장 자동화, 현대자동차의 여러 간단한 기능 제어에 사용되고 있다.

QPU


▎※ 2024년 5월 미국 특허 기준 출처: Patentpia
QPU(양자처리장치, Quantum processing unit)는 2000년대 GPU가 컴퓨팅에 미친 혁신과 비슷한 파괴력을 가질 것으로 전망된다. QPU 기술은 특히 GPU 컴퓨팅의 한계로 지적되는 영역에 혁명을 일으킬 것으로 기대를 모으고 있다. 예를 들어 약물 발견에서 QPU는 이전에는 불가능했던 규모로 분자 상호작용을 시뮬레이션하여 새로운 치료제 개발을 가속화할 수 있다. 재료과학 분야에서는 맞춤형 특성을 지닌 새로운 재료를 설계해낼 수 있다. 금융 분야에서 QPU는 복잡한 모델 최적화 및 위험 분석을 향상할 수 있다. AI에서는 더 적은 데이터로 더 효율적으로 학습하는 알고리즘으로 이어질 수 있다.

양자컴퓨팅은 큐비트 개념을 사용하여 컴퓨팅에 대한 혁신적인 접근을 시도한다. 양자 게이트는 양자 회로의 기본 구성 요소로, 클래식 컴퓨팅의 논리 게이트와 유사하지만 클래식 비트 대신 큐비트에서 작동하도록 설계됐다. 양자 게이트는 양자역학의 원리에 따라 큐비트의 상태를 조작하여 양자 알고리즘의 실행을 가능하게 한다. 결론적으로 양자 게이트는 기하급수적으로 더 큰 데이터세트에 대한 병렬처리를 할 수 있다.

그러나 양자컴퓨팅은 큐비트 안정성, 효과적인 양자 오류 수정 등 기술적으로 넘어야 할 과제를 안고 있다. 안정적으로 대규모 양자 시스템을 달성하고 양자 오류를 수정해 안정적인 계산을 보장하는 것이 넘어야 할 장애물이다. 큐비트는 본질적으로 취약하며 다양한 환경 조건의 영향을 받을 수 있기 때문이다. 안정적인 큐비트 상태를 유지하는 것이 현재 연구의 주요 목표이며, 연구자들은 큐비트 상태에서 원치 않는 변화를 감지하고 수정하기 위한 기술을 개발하고 있다. 또 양자 소프트웨어 개발 분야는 초기 단계이므로 새로운 프로그래밍 도구와 언어를 만들어야 한다. QPU의 양자 특성을 활용하려면 기존 알고리즘으로는 충분하지 않고, 새로운 유형의 알고리즘을 개발해야 한다.

특허 현황 기준으로 보면 현재 인텔이 QPU 기술에서 가장 앞서 있다. 인텔은 CPU 시장의 최대 기업이자 오랜 반도체 개발 역사를 갖고 있지만 엔비디아의 GPU에 밀려 최근 실적 부진을 겪었다. AI칩 시장을 만회하기 위해 신형 AI가속기 ‘가우디(Gaudi) 3’를 내놓고 본격적으로 엔비디아 잡기에 나섰다. 인텔은 오늘날 컴퓨터의 기존 프로세서처럼 실리콘에서 실행되는 QPU에 투자함으로써 양자컴퓨팅으로의 전환에 전력을 투입하고 있다. ‘터널 폭포(Tunnel Falls)’라고 불리는 인텔의 새로운 12큐비트 QPU는 현재 실험용으로 연구원들에게 제공된다. 실제 QPU에 대해서는 구체적인 세부 정보가 거의 공개되지 않았으며, 기존 생산라인을 활용해 대량생산 할 수 있는 것으로 알려져 있다.

인텔은 미국 오하이오와 폴란드 등에 대규모 생산공장 건설 계획을 발표하는 등 QPU에 중장기 전략으로 규모가 큰 베팅을 하고 있다. 인텔은 향후 5년 동안 1000억 달러 규모로 ‘세계 최대의 AI칩 제조 현장’을 건설할 계획이다. 미국 정부도 인텔에 향후 5년간 애리조나, 오하이오, 뉴멕시코, 오레곤의 컴퓨터 칩 공장 건설에 최대 85억 달러의 직접 자금과 110억 달러의 대출을 제공하기로 합의했다.


▎지난 3월 20일 애리조나주 챈들러에서 조 바이든(오른쪽) 미 대통령이 인텔 오코틸로 캠퍼스에 방문해 팻 겔싱어 인텔 CEO의 설명을 듣고 있다. / 사진:AP Photo/Jacquelyn Martin
한편 양자컴퓨팅 스타트업 리게티(RIGETTI)는 QPU 분야에서 다크호스로 불린다. 리게티는 지난 2017년부터 클라우드를 통해 양자컴퓨터를 운영해왔으며 ‘리게티 퀀텀 클라우드 서비스’ 플랫폼에서 글로벌기업, 정부, 연구기관에 서비스를 제공하고 있다. 리게티는 확장 가능한 양자컴퓨팅 시스템을 위한 업계 최초의 다중 칩 양자 프로세서를 개발했다. 리게티는 최근 차세대 QPU칩이 99.5% 충실도를 달성했다고 발표했다. 99.5% 충실도는 상업용 양자컴퓨팅을 위한 주요 관문으로 여겨진다. 채드 리게티 리게티 CEO는 “오류 발생률을 1% 이하로 줄임으로써 양자컴퓨터가 널리 상용화될 수 있는 시대에 한 발 더 다가갔다”라고 말했다.

국내기업으로는 퍼스트퀀텀을 주목할 만하다. 퍼스트퀀텀은 양자컴퓨팅 및 양자 정보과학 분야 전문가인 안도열 서울시립대 석좌교수와 투자가 정석환 대표가 공동으로 설립했다. 퍼스트퀀텀의 전략은 회사가 보유한 양자 카르노맵 기술을 기반으로 양자 회로 및 양자알고리즘의 최적화에 집중해 하드웨어의 효율성을 제고하는 것이다. 퍼스트퀀텀은 국내 스타트업으로는 처음으로 글로벌 기업, 스타트업, 대학과 연구기관으로 구성된 IBM네트워크에 속해 있다.

NPU


▎※ 2024년 5월 미국 특허 기준 출처: Patentpia
NPU(신경처리장치, neural processing unit)는 신경망 작업 및 AI 작업을 가속화하기 위해 특별히 설계된 대규모 SoC(system on a Chip, 여러 반도체를 하나의 칩에 구현)의 전용 프로세서 또는 처리장치다. 가속화는 화상통화에서 배경을 흐리게 하거나 컴퓨터에서 로컬로 AI 이미지 생성을 수행하는 등 작업의 속도를 높이는 개념이다. 이는 온디바이스 AI(클라우드 연결 없이 모바일기기에서 정보 처리)를 구현하는 데 효과적이다. 최근 온디바이스 AI가 적용된 스마트폰, 가전제품, TV, 노트북이 잇달아 나오면서 NPU는 가장 ‘귀한’ 반도체로 여겨진다. 시장조사업체 가트너에 따르면 2022년 326억 달러(약 43조원) 규모이던 NPU(AI용 반도체) 시장은 2030년 1170억 달러(약 154조원)로 불어날 전망이다.

애플 등은 지난 수년 동안 칩에 NPU를 사용해왔기 때문에 완전히 새로운 것은 아니다. 그러나 현재 다양한 산업 분야에서 NPU가 ‘차세대 혁신’으로 주목받고 있어 중요도가 높아지고 있다. 기존 CPU 및 GPU와 달리 NPU는 인공 신경망에 필수적인 복잡한 수학적 계산을 처리하는 데 최적화돼 있다. 방대한 양의 데이터를 병렬로 처리하는 데 탁월하므로 이미지 인식, 자연어 처리, 기타 AI 관련 기능과 같은 작업에 이상적이다. 예를 들어 GPU 내에 NPU가 있는 경우 NPU는 객체 감지 또는 이미지 가속화 등 특정 작업을 담당할 수 있다.

다만 NPU는 AI 연산을 목적으로 하기 때문에 GPU보다 범용성이 적다. NPU는 구조상 다른 AI 알고리즘을 습득하기 어렵다. AI 알고리즘의 딥 러닝 네트워크를 구성하는 신경망을 하드웨어로 구현했기 때문이다. 구조가 다른 알고리즘을 구현할 때 오히려 더 많은 시간과 비용이 들 수 있다.

NPU는 특히 AI 컴퓨팅 및 AI 애플리케이션 구현을 담당하는 휴대폰 AI의 핵심 캐리어다. NPU는 이미지 인식, 음성 지원, 증강현실과 같은 작업에서 중요한 역할을 한다. 이를 통해 스마트폰은 시각·청각 정보를 실시간으로 분석하고 해석하여 사용자 경험을 향상하고 얼굴 인식, 음성 명령과 같은 기능을 활성화할 수 있다. 따라서 삼성전자, 화웨이, 퀄컴, 애플, 인텔, 구글 등은 AI 애플리케이션을 강화하기 위해 자체 NPU를 개발했다.

NPU 관련 특허수를 살펴보면 살펴보면 국내기업들이 앞서 있다. 삼성전자가 공개특허수 85건으로 압도적으로 많으며, AI칩 펩리스 스타트업 딥엑스가 34건으로 그 뒤를 이었다. 삼성전자는 지난 2018년 모바일 SoC 안에 독자 NPU를 탑재한 ‘엑시노스 9(9820)’을 출시했다. 그리고 2019년 이래 NPU 사업 육성에 본격적으로 나섰고 2030년까지 NPU 분야 인력을 2000명 규모로 확대할 계획을 발표한 바 있다.

삼성전자는 최근 추론에 특화한 AI 반도체 ‘마하1’을 네이버와 개발하고 있다. 삼성전자는 지난 3월 20일 주주총회에서 마하1을 처음으로 언급했다. 마하1은 NPU SoC 제품으로 연말에 양산해 네이버에 공급할 계획이다. 네이버와 공동 개발하는 과정에서 피드백을 받으며 하드웨어 개선에 반영하고 실수요 반응을 파악해 향후 성능을 더 개선한 제품을 만들 것으로 관측된다. 고객사로선 마하1이 엔비디아 AI 반도체를 대체한다면 전기 요금과 AI 반도체 구매가격 부담을 모두 덜 수 있는 선택지가 될 수 있다.


▎삼성전자는 지난 3월 20일 주주총회에서 엔비디아 AI칩의 대안이 될 마하1을 언급했다. / 사진:삼성전자
딥엑스는 각종 전자기기에 탑재해 연산 능력을 부여하거나 기기 효율을 높일 수 있는 ‘온디바이스’ AI 반도체를 개발하고 있다. 현대기아차 로보틱스랩, 포스코DX, 자화전자 등 고객사와 양산 제품 개발을 위한 협력을 하고 있다. NPU칩과 AI 컴퓨팅 솔루션 관련 원천기술을 보유해 진입장벽도 구축한 것으로 평가된다.

특허 포트폴리오 지표(특허수)에서는 국내기업이 높으나 특허의 파급력을 의미하는 심사관피인용수를 보면 인텔이 136건으로 압도적으로 높다. 인텔은 NPU 원천기술을 보유하고 있다. 인텔 코어 울트라 프로세서에 통합된 AI가속기는 컴퓨팅 가속 및 데이터 전송 기능으로 구성된 고유한 아키텍처가 특징이다.

NPU칩은 이미 시장에 속속 등장하고 있다. 인텔은 미티어 레이크, 루나 레이크, 팬더 레이크 등 세대별 CPU 시리즈에서 AI 성능을 높이기 위해 GPU와 NPU 기능을 균등하게 반영하고 있다. 업계에서는 이를 두고 “인텔이 AI 성능을 주도할 핵심 요소로 NPU를 반영하고 있다”고 평가한다.

뉴로모픽


▎※ 2024년 5월 미국 특허 기준 출처: Patentpia
뉴로모픽(Neuromorphic)은 NPU(신경처리장치) 기술과 비슷하지만 더 진화한 개념으로, 사람 두뇌 수준으로 정보처리와 인식을 가능하게 하는 프로세서 기술을 말한다. 일부에서는 뉴로모픽을 적용한 처리장치를 NPU(Neuromorphic processing unit)라고 부르지만, 신경처리장치와 혼동할 수 있어 뉴로모픽 칩으로 흔히 일컬어진다.

뉴로모픽 칩은 기존 CPU, GPU와 근본적으로 다르다. 뉴로모픽은 인공 뉴런과 시냅스의 네트워크를 통합하여 정보를 병렬로 처리하는 뇌의 능력을 모방한다. 즉, 뉴로모픽 컴퓨팅 아키텍처는 오늘날 우리가 일반적으로 사용하는 전통적인 컴퓨터 아키텍처인 폰 노이만의 0, 1 이진수 처리방식에서 벗어났다. 대신 뉴로모픽 컴퓨팅은 수백만 개의 인공 뉴런과 시냅스가 동시에 다양한 정보를 처리할 수 있어 기존 폰 노이만 컴퓨팅보다 훨씬 더 많은 계산 옵션을 제공한다. 따라서 인간의 뇌에 가장 가깝게 복잡하고 구조화되지 않은 데이터를 더욱 효율적으로 처리할 수 있다.

뉴로모픽 관련 특허 현황을 살펴보면 IBM이 포트폴리오(특허수)에서는 가장 앞서 있고, 파급력(심사관피인용수)에서는 인텔, 해외패밀리특허수에서는 삼성전자가 두각을 보이고 있다.

IBM이 지난해 말 선보인 노스폴(NorthPole) 뉴로모픽 칩은 AI 작업에서 현재 시중에 나와 있는 최고성능 마이크로칩보다 20배 이상 빠르며 에너지 효율성은 약 25배 더 높아 주목할 만한 혁신으로 평가된다. 지난 8년에 걸쳐 개발된 노스폴은 IBM의 기존 세대 뉴로모픽 칩인 트루노스(TrueNorth)에서 성능 개선을 이뤄냈다.

2014년 출시된 트루노스는 당시 기존 마이크로프로세서보다 4배나 낮은 전력소모율을 자랑했다. IBM의 두뇌 영감 컴퓨팅 분야 수석 과학자이자 수석 연구원 다멘드라 모다는 “노스폴의 주요 동기는 트루노스의 잠재적 자본 비용을 극적으로 줄이는 것이었다”고 말했다. UCLA 컴퓨팅·AI과학자 브와니 로이초우두리 교수는 “(노스폴 관련) 논문은 공학의 역작을 대표한다”고 극찬했다.

노스폴의 효율성은 작동을 위해 부피가 큰 액체 냉각시스템이 필요하지 않다는 것이다. IBM은 팬과 방열판이면 충분하다고 말한다. 이는 훨씬 더 작은 공간에 배포될 수 있음을 의미한다.

IBM 외에 인텔의 로이하이(Loihi) 연구 칩도 뉴로모픽 컴퓨팅 분야에서 중요한 이정표로 평가된다. 이는 학습·패턴 인식 작업에서 놀라운 효율성을 보였다. 인텔은 지난 4월 세계 최대의 뉴로모픽 시스템을 구축했다고 발표했다. 코드명 할라포인트(Hala Point)의 대규모 뉴로모픽 시스템은 로이하이2 프로세서를 적용해 1세대 시스템보다 10배 많은 뉴런 용량과 최대 12배더 높은 성능을 달성했다. 인텔은 이 시스템이 11억5000만 개 뉴런으로 구성됐으며 인간 두뇌보다 20배 빠르게 실행할 수 있다고 밝혔다. 뉴런 용량은 올빼미 뇌나 카푸친원숭이 피질과 같은 수준이다.


▎지난 8년간 노스폴을 개발해온 IBM 리서치의 다멘드라 모다 수석 연구원(맨 앞줄 가운데)과 그의 팀. / 사진:IBM
그리고 퀄컴의 뉴로모픽 기술 진출은 모바일·IoT 장치의 기능을 향상하는 데 중점을 두고 있다. 퀄컴의 연구 목표는 AI 기능을 에지에 적용하여 클라우드 기반 컴퓨팅에 대한 의존도를 줄이는 것이다.

한편, 삼성전자는 SAIT(구 종합기술원)에서 뉴로모픽 관련 기술을 연구하고 있으며 국내외 학계, 산업계와 연구개발 협력도 이어가고 있다. 독자 개발한 NPU 기술을 발전시켜 뉴로모픽 프로세서를 구현할 계획이다. 다만 높은 기술력이 요구되는 만큼 현재 수준에서는 짧지 않은 기간이 걸릴 것이란 예상이 나온다. 김형준 차세대지능형반도체 사업단장은 “뉴로모픽 반도체는 NPU와 달리 신소재를 사용해 인간의 뇌와 더 유사하게 작동하도록 하는 것이 특징”이라며 “2030년까지는 개발될 수 있을 것으로 본다”고 말했다.

뉴로모픽 컴퓨팅 시장은 연구개발에 상당한 투자가 유입되면서 급속한 성장을 보이고 있다. 하지만 기술적 과제로는 확장성이 있다. 뉴로모픽 칩을 기존 시스템에 통합하고 대규모 애플리케이션을 처리할 수 있는지 확인하는 것은 칩의 광범위한 채택을 위해 중요하다. 그리고 뉴로모픽 기능을 완벽하게 활용할 수 있는 새로운 프로그래밍 패러다임과 소프트웨어가 필요하다. 또 모든 파괴적인 기술과 마찬가지로 뉴로모픽 칩은 인간의 뇌와 가장 가까운 까닭에 윤리적·사회적 문제를 제기한다. 규제·보안 측면에서 이러한 문제를 해결하는 것은 책임 있는 개발·배포에 필수적이다.

- 이진원 기자 lee.zinone@joongang.co.kr

202406호 (2024.05.23)
목차보기
  • 금주의 베스트 기사
이전 1 / 2 다음