big_tech
10분 읽기

메타, 내년부터 4세대 MTIA 칩 양산... AI 추론 시장의 판도를 바꾼다

메타가 2026~2027년 향후 2년간 MTIA 300·400·450·500의 4개 세대 칩을 개발·배포한다. HBM 대역폭 4.5배, 컴퓨팅 성능 25배 향상되는 이들 칩은 AI 추론에 최적화되며, Broadcom과 협력해 초기 1GW 규모로 배포될 예정이다. 엔비디아 의존성 탈피와 추론 시장 경쟁 심화를 예고한다.

AIB프레스 편집팀
2026.04.15
조회 4
메타, 내년부터 4세대 MTIA 칩 양산... AI 추론 시장의 판도를 바꾼다

메타가 차세대 AI 인프라 전략의 핵심으로 향후 2년간 4개 세대의 MTIA(메타 트레이닝·인퍼런스 액셀러레이터) 칩을 개발·배포하겠다고 밝혔다. MTIA 300, 400, 450, 500의 4개 세대 칩은 지난해부터 최근까지 연속 출시되거나 2026년, 2027년에 배포될 예정이며, 업계 표준인 6~12개월마다 새 칩을 출시하는 페이스로 나아간다는 전략이다.

4세대 칩의 기술 진화

MTIA 300부터 500까지의 진화 과정에서 고대역폭메모리(HBM) 대역폭이 4.5배 증가하고, 컴퓨팅 성능은 25배 향상된다. MTIA 300은 순위 지정 및 추천 학습에 사용되며 이미 생산 중이고, MTIA 400, 450, 500은 모든 워크로드를 처리할 수 있지만 주로 생성형AI 추론 운영을 지원하도록 설계됐다.

메타 MTIA 칩 로드맵

역순 설계의 차별성

메타는 일반적인 칩 개발 방식과 달리, 대규모 생성형AI 사전학습 같은 가장 까다로운 워크로드에 최적화하는 대신 생성형AI 추론을 먼저 최적화한 후 필요시 다른 워크로드를 지원하는 '역순 접근법'을 택했다. 이를 위해 PyTorch, vLLM, Triton, 오픈컴퓨트프로젝트(OCP) 같은 업계 표준 기술을 기반으로 구축해 마찰 없는 도입을 가능하게 했다.

이는 산업 표준을 기반으로 한 상호운용성을 강조하는 전략으로, 기업 고객의 도입 장벽을 크게 낮춘다.

배포 일정과 규모

MTIA 500은 2027년 대규모 배포 예정이다. 메타는 현재 유기 콘텐츠와 광고 추론 워크로드에 수십만 개의 MTIA 칩을 배포 중이며, 이들 칩은 메타의 워크로드에 특화되어 범용 칩보다 훨씬 더 비용 효율적이다. 메타는 Broadcom과의 협력으로 초기 단계로 1기가와트(GW)의 MTIA 칩 배포를 약속했고, 궁극적으로 수십 기가와트 규모의 칩 배포를 계획하고 있다.

MTIA 칩 개발 전략

엔비디아 의존성 탈피의 신호

메타의 MTIA 450, 500은 2027년을 통해 AI 추론 운영을 커버하도록 설계되었으며, Google, AWS, Microsoft도 유사한 일정에 맞춰 자체 맞춤형 칩에 투자 중이다. 이는 워크로드 분화 전략으로, 맞춤형 칩이 대용량의 예측 가능한 추론 워크로드를 담당하고 GPU는 학습에 집중하는 구도를 뜻한다. 엔비디아가 여전히 프론티어 모델 학습에서 압도적이지만, 추론 시장에서는 맞춤형 칩 기반 서비스 제공 업체들의 도전이 가속화될 전망이다.

한국 시장의 시사점

메타의 MTIA 자체 칩 개발은 빅테크 기업들의 AI 칩 자급화 경쟁을 심화시킨다. 국내 반도체, AI 인프라 기업들은 추론 최적화 칩 기술 확보를 전략적 우선순위로 삼아야 한다. 특히 모듈식 칩렛 설계로 기존 데이터센터 인프라와의 호환성을 확보한 메타의 접근법은 국내 데이터센터 운영 기업들의 MTIA 도입을 수월하게 할 것으로 예상된다.

소프트웨어 생태계 통합

메타가 취한 모듈식 칩렛 설계는 새로운 칩 세대마다 기존 랙 시스템 인프라에 그대로 삽입할 수 있어 배포 시간을 가속화한다. 소프트웨어 스택도 PyTorch, vLLM, Triton에서 네이티브 실행되어 GPU와 MTIA에서 모두 운영 가능하고 MTIA 전용 재개발이 불필요하다. 이는 기업 고객의 도입 장벽을 크게 낮춘다.

메타는 MTIA를 더 이상 실험이 아닌 Facebook, Instagram 등 플랫폼의 순위 지정, 추천, 생성형AI 워크로드를 처리하는 핵심 인프라로 포지셔닝했다. 향후 2년간 연속된 칩 세대 출시는 메타가 엔비디아 의존성을 줄이면서도 AI 인프라 자율성을 확보하려는 명확한 의도를 보여준다.

편집 안내 | 이 기사는 AI 기술을 활용하여 글로벌 뉴스 소스를 분석·종합한 후, AIB프레스 편집팀의 검수를 거쳐 발행되었습니다. 정확한 정보 전달을 위해 노력하고 있으며, 원문 출처를 함께 제공합니다.

Meta
AI 추론
AI 칩
MTIA
Broadcom
엔비디아 대안

공유

관련 기사