클라우드플레어, 앙상블 AI 팀 영입으로 AI 추론 효율화 가속화
클라우드플레어가 AI 모델 최적화 스타트업 앙상블 AI의 팀을 인수합병하여 Workers AI 플랫폼의 추론 효율화를 강화한다. NdLinear 등의 모델 압축 기술을 통해 추론 비용을 절감하려는 전략이며, AI 인프라 경쟁이 '더 좋은 모델'에서 '더 싼 추론'으로 전환되고 있음을 보여준다.

클라우드플레어(Cloudflare)가 AI 모델 최적화 전문 스타트업 앙상블 AI(Ensemble AI)의 핵심 팀을 인수합병했다. 이는 클라우드플레어의 서버리스 AI 플랫폼 'Workers AI'의 추론 비용 절감과 성능 개선을 본격화하려는 전략적 움직임이다.
모델 압축 기술로 무장한 팀의 영입
앙상블 AI는 2023년 샌프란시스코에서 창립되어 대규모언어모델(LLM) 및 멀티모달 모델의 크기를 줄이고 비용 효율을 높이는 기술 개발에 집중해왔다. 특히 모델 압축(quantization) 기법과 구조적 효율화 방식으로 주목받았다.
앙상블 AI가 개발한 'NdLinear'는 트랜스포머 모델의 선형층을 개선한 핵심 기술이다. 기존에는 다차원 활성화 데이터를 1차원으로 평탄화하는 과정에서 정보 손실이 발생했으나, NdLinear는 멀티헤드 구조와 채널 같은 의미 있는 축(axis)을 보존하면서 매개변수 개수를 줄인다. 동시에 개발한 'NdLinear-LoRA'는 대규모 모델 미세조정(fine-tuning) 시 학습 매개변수 수를 대폭 감소시킨다.
추론 비용 경쟁이 AI 인프라의 핵심 전쟁터
클라우드플레어의 주요 관심은 추론 비용 절감에 있다. Workers AI는 클라우드플레어의 글로벌 네트워크를 기반으로 서버리스 GPU 추론 환경을 제공한다. AI 모델이 커질수록, 사용자가 점점 더 많은 AI 기능을 요구할수록 추론 비용은 기하급수적으로 증가한다. 각 기업이 AI 에이전트, 개인화, 강화학습 등으로 워클로드를 확장하려면 추론 효율화는 선택이 아닌 필수 과제다.
클라우드플레어는 이미 자체 AI 추론 엔진 'Infire'와 텐서 압축 기술 'Unweight' 등을 보유하고 있다. 앙상블 팀의 합류로 이런 기술 스택을 더욱 고도화할 수 있게 된다. 특히 모델 아키텍처 차원에서 효율화를 도모하는 앙상블의 접근법은 기존의 양자화나 하드웨어 최적화와 상호보완될 수 있다.
경쟁 심화하는 AI 인프라 시장, 차별화의 기로
현재 AI 인프라 시장은 제공자 간 경쟁이 심화되고 있다. AWS(아마존웹서비스)의 SageMaker, Azure의 Copilot Stack, Google Cloud의 Vertex AI 등이 추론 효율성을 앞세워 고객 확보에 나서는 상황이다. 클라우드플레어는 엣지 컴퓨팅 기반의 글로벌 분산 네트워크라는 차별점이 있지만, 추론 비용 경쟁력까지 갖춰야 대규모 엔터프라이즈 고객을 확보할 수 있다.
또한 이 인수는 스타트업 M&A 트렌드를 반영한다. 빅테크 기업들이 점점 더 구체적인 기술 능력을 갖춘 스타트업을 인수하는 추세가 두드러진다. 오픈AI, 앤트로픽, 메타 같은 AI 기업들도 모델 최적화, 비용 절감, 특화 하드웨어 같은 분야의 팀을 끌어안고 있다. 기술 성숙도가 높아질수록 "만드냐 사냐"의 판단이 더 빨라지는 셈이다.
한국 시장과의 관련성도 무시할 수 없다. 국내 클라우드 플랫폼 사업자(NCP, KT Cloud 등)들은 아직 AI 추론 서비스의 비용 경쟁력에서 글로벌 선두와 격차가 있다. 클라우드플레어의 이번 움직임이 추론 기술의 글로벌 표준을 높일수록, 국내 업체들도 이에 따라 기술 투자를 가속화해야 한다. 특히 SK하이닉스, 삼성전자 같은 반도체 기업들이 AI 추론 가속기 개발을 강화해야 할 시점이 왔다.
클라우드플레어는 블로그 글에서 "개발자들이 원하는 것은 더 이상 모델에 대한 접근이 아니라, 비용과 성능, 운영 복잡도를 낮추면서 신뢰할 수 있게 모델을 실행할 수 있는 인프라"라고 밝혔다. 이 말은 AI 인프라 경쟁의 핵심이 이제 "더 좋은 모델"이 아니라 "더 싼 추론"으로 이동했음을 의미한다.
편집 안내 | 이 기사는 AI 기술을 활용하여 글로벌 뉴스 소스를 분석·종합한 후, AIB프레스 편집팀의 검수를 거쳐 발행되었습니다. 정확한 정보 전달을 위해 노력하고 있으며, 원문 출처를 함께 제공합니다.
AI·테크 핵심 뉴스, 매주 한 통으로
한 주의 글로벌 AI·IT 뉴스 중 꼭 알아야 할 것만 골라 보내드립니다. 광고 없음, 언제든 해지.


