big_tech
11분 읽기

엔비디아 에이전트용 CPU '베라' 첫 인도...OpenAI·앤트로픽·스페이스X 손잡다

엔비디아가 에이전트 AI 전용 커스텀 CPU '베라'를 OpenAI, 앤트로픽, 스페이스X AI, OCI에 첫 인도했다. 88개 올림푸스 코어, 1.2TB/s 메모리 대역폭, 50% 향상된 코어당 성능을 갖춘 베라는 AI 모델의 도구 실행·코드 생성·데이터 검색 등 CPU 집약적 에이전트 작업을 처리하도록 설계됐다. OCI는 2026년부터 수십만 개를 배포할 계획으로, 에이전트 AI 시대의 CPU 역할 재편을 의미한다.

AIB프레스 편집팀
2026.05.21
엔비디아 에이전트용 CPU '베라' 첫 인도...OpenAI·앤트로픽·스페이스X 손잡다

엔비디아(NVIDIA)가 에이전트 AI에 특화한 자체 설계 CPU '베라(Vera)'를 처음으로 고객에게 인도했다. 지난 18일(미국 시간) 엔비디아는 베라 CPU를 앤트로픽, OpenAI, 스페이스X AI, 오라클 클라우드 인프라(OCI)에 전달했다고 발표했다. 젠슨 황 엔비디아 최고경영자가 3월 샌호세 GTC 컨퍼런스에서 "차세대 수십억 달러 규모 사업"으로 소개한 지 불과 2개월 만의 양산 진입이다.

에이전트 AI가 CPU를 재정의하다

베라의 핵심 특징은 AI 모델의 행동 패턴 변화에 맞춘 아키텍처다. 종래 CPU는 코어 밀도 중심으로 설계되었으나, 에이전트 AI는 다르다. 모든 에이전트 샌드박스, 도구 호출, 오케스트레이션 레이어, 장문맥(long-context) 검색 작업이 CPU에 집중되기 때문이다. 에이전트가 도구를 실행하고 코드를 생성하고 데이터를 검색할 때 GPU만으로는 부족하다. 베라는 이 병목을 해결하도록 처음부터 설계됐다.

성능 사양은 인상적이다. 엔비디아가 설계한 올림푸스(Olympus) 커스텀 코어 88개, 메모리 대역폭 1.2TB/s, 코어당 성능 50% 향상을 담았다. 지속적인 부하 상황에서 작업이 더 빠르게 완료되어 AI 팩토리 전체 효율을 높인다. 이는 사용자가 AI 에이전트의 응답을 더 빠르게 받을 수 있다는 뜻이다.

글로벌 AI 리더들의 엇갈린 평가

이번 인수 과정에서 주목할 점은 각 고객사의 입장 차이다. 앤트로픽의 제임스 브래드버리 컴퓨트 책임자는 "모델 성장을 가속하는 컴퓨팅 확장은 중요한 촉매"라며 "에이전트 워클로드 해결에 베라가 유망한 선택지가 되기를 기대한다"고 말했다. 반면 OpenAI의 사친 카티 컴퓨팅 인프라 책임자는 즉시적인 성능 검증을 진행했다. 스페이스X AI는 더욱 실험적이다. 일론 머스크가 직접 코어 개수, 메모리 레이아웃, 냉각 방식을 묻는 등 강화학습(reinforcement learning) 워클로드와 에이전트 기반 시뮬레이션에 베라가 어떻게 작동하는지 심층적으로 평가 중이다.

OCI는 가장 공격적이다. 카란 바타 OCI 제품관리 담당은 "2026년부터 수십만 개의 엔비디아 베라 CPU를 배포할 계획"이라고 밝혔다. 엔터프라이즈 고객 입장에서는 다른 클라우드 제공업체가 따라잡지 못할 규모의 프로덕션급 에이전트 AI 인프라를 처음 손에 쥐게 되는 것이다. OCI는 첫 번째 하이퍼스케일 클라우드 베라 배포처가 됐다.

극단 코설계 전략의 가시화

베라가 산업 생태계에 미칠 영향은 크다. 첫째, AI 모델의 단순 응답에서 능동적 행동으로의 패러다임 전환이 가속화된다. "모델이 질문을 받으면 답은 이미 준비되지 않는다. 파이썬 코드를 생성해 올바른 답에 도달해야 한다"(이안 벅 엔비디아 하이퍼스케일 부사장)는 설명이 핵심이다. 둘째, CPU 수요의 급증이 피할 수 없는 미래임을 시사한다. 종래 GPU 중심 인프라 설계 패러다임이 CPU-GPU 협력 구도로 완전히 재편될 가능성이 높다.

셋째, 엔비디아의 '극단 코설계(extreme codesign)' 전략이 본격적으로 가시화된다. 베라는 루빈(Rubin) GPU, 블루필드-4(BlueField-4) DPU, 스펙트럼-X(Spectrum-X), MGX 랙 아키텍처와 일체로 작동하도록 설계되었다. 베라-루빈 NVL72 시스템에서는 2세대 엔비디아 NVLink-C2C를 통해 베라와 루빈 GPU 쌍이 통합 메모리 아키텍처로 협력한다. 이 구성에서 베라의 빠른 CPU 코어와 인터커넥트가 오케스트레이션, 제어, 데이터 이동을 담당하며, 종래 인프라 대비 2배 에너지 효율을 달성한다.

한국의 AI 인프라 업체들에는 실질적 도전이다. 국내에서도 대규모 언어모델(LLM) 기반 에이전트 서비스가 증가하면서 CPU 병목 현상이 발생할 가능성이 높다. 삼성전자나 SK하이닉스 같은 반도체 설계 역량을 지닌 기업이 에이전트 AI용 커스텀 CPU를 선제적으로 개발할 필요가 생겼다는 뜻이다. 또한 국내 클라우드 사업자들도 OCI처럼 하이퍼스케일 베라 인프라를 조기에 확보하는 것이 경쟁력이 될 것으로 예상된다.

에이전트 AI 시대에 CPU는 더 이상 주변부 부품이 아니다. 베라의 인도는 AI 인프라 생태계가 어떻게 재편되는지 보여주는 신호탄이다.

편집 안내 | 이 기사는 AI 기술을 활용하여 글로벌 뉴스 소스를 분석·종합한 후, AIB프레스 편집팀의 검수를 거쳐 발행되었습니다. 정확한 정보 전달을 위해 노력하고 있으며, 원문 출처를 함께 제공합니다.

NVIDIA
에이전트AI
인프라
CPU
아키텍처

AI·테크 핵심 뉴스, 매주 한 통으로

한 주의 글로벌 AI·IT 뉴스 중 꼭 알아야 할 것만 골라 보내드립니다. 광고 없음, 언제든 해지.

관련 기사