MS, 경량 AI 에이전트로 OpenAI에 도전...비용 90% 절감
마이크로소프트가 경량 AI 에이전트 'MagenticLite'와 소형 모델 'MagenticBrain', 'Fara1.5'를 공개했다. 브라우저와 로컬 파일시스템을 통합 제어하면서 비용을 90% 절감한 온프레미스 AI 에이전트 시스템이다. MS는 에이전트 성능이 모델 크기가 아니라 도구 오케스트레이션에 의존한다는 가정 하에, 경량 모델로도 OpenAI의 Operator 수준 경험이 가능함을 입증했다.

마이크로소프트 리서치가 소형 모델 기반의 AI 에이전트 'MagenticLite'를 공개했다. 브라우저와 로컬 파일시스템을 통합 제어하면서 에이전트 성능을 유지하는 차세대 시스템이다. 대형 모델 대비 운영 비용을 90% 절감할 수 있는 것이 특징이다.
23일 공개된 MagenticLite는 Magentic-UI의 후속작으로, 두 개의 소형 목적 모델 'MagenticBrain'과 'Fara1.5'를 탑재했다. 경량 에이전트 분야에서 OpenAI의 Operator 등 대형 모델 기반 경쟁자들을 겨냥한 MS의 전략적 선택이다.
세 가지 핵심 요소의 합
MagenticLite는 실험 목적의 에이전트 애플리케이션으로, 오픈 버전의 Magentic-UI에서 대폭 강화되었다. 브라우저에서의 웹 자동화와 사용자 기계의 로컬 파일시스템 접근을 하나의 워크플로우에서 처리한다. 데이터가 사용자 기계에만 남아 온프레미스 환경에 이상적이다.
MagenticBrain은 에이전트의 두뇌 역할을 한다. 추상적인 사용자 요청을 구체적인 실행 계획으로 변환하고, 각 단계별로 적절한 도구나 서브에이전트를 선택하며, 필요하면 코드를 작성하고 장애 상황을 복구한다. 요청 해석(추론)에서 실행(delegation)까지 전체 오케스트레이션을 담당한다.
Fara1.5는 컴퓨터 사용 모델 계열의 차기 세대다. 4B, 9B, 27B 세 가지 크기로 제공되며, 9B 플래그십 모델이 대부분의 사용 케이스를 커버한다. Qwen 3.5 기반으로 설계되어, 전작 Fara-7B 대비 웹 네비게이션 성능이 거의 2배 향상됐다. 특히 폼 작성, 자격증이 필요한 사이트(로그인 필요), 장시간 실행되는 작업에서 정확도가 크게 올랐다.
에이전트 능력의 핵심은 "지식이 아니라 도구"
MS 리서치가 이번 프로젝트에 건 핵심 가정이 있다. 에이전트의 능력은 사전 학습된 지식(knowledge)에 의존하지 않고, 도구 오케스트레이션과 실제 행동(tool orchestration and action)에 의존한다는 것이다. 이 통찰이 있으면 매개변수 수를 줄이면서도 광범위한 에이전트 작업을 지원할 수 있다. 결과적으로 경량 모델로도 비용을 1/10 수준으로 낮출 수 있다.
세 가지 컴포넌트는 처음부터 하나의 시스템으로 코설계되었다(codesign). 훈련 데이터 생성, 모델 설계, 오케스트레이션 아키텍처가 단계별로 분리되지 않고 동시에 최적화되었다는 뜻이다.
실제 사용 사례(폼 작성, 브라우저 조사, 로컬 파일 관리)에서 요구 사항을 파악한 뒤, 평가 데이터셋을 설계했다. 표준 벤치마크만으로는 실제 유용성을 측정할 수 없기에, 시나리오 기반 평가(scenario-based evaluation)를 병행했다. 이를 통해 모델과 실행 엔진(harness)을 반복적으로 개선했다.
사용자 경험도 재설계
인터페이스도 대폭 개선됐다. 에이전트의 추론 과정과 각 행동 단계를 시각화하고, 필요시 사용자가 직접 개입할 수 있도록 설계했다. 최근 사용자 연구 결과를 반영해 브라우저 뷰와 채팅 뷰를 재구성하여, 에이전트의 의도와 행동을 이해하기 더 쉬워졌다. 특히 중요한 결정 지점에서 명시적 승인을 받는 방식으로, 신뢰성을 높였다.
Fara1.5의 성능 도약
Fara1.5는 Online-Mind2Web 벤치마크(300개 웹 도메인 태스크)에서 같은 크기 모델 중 최고 성능(SOTA)을 달성했다. Fara-7B 대비 웹 내비게이션에서 거의 2배 성능 향상을 이뤘으며, 장시간 작업 중 상태 유지 능력도 개선됐다.
지난해 11월 MS가 공개한 Fara-7B는 웹 브라우저 작업 자동화용 경량 에이전트였다. 새로운 합성 데이터 생성 엔진(synthetic data generation engine)으로 당시 최고 수준의 성능을 보여줬다. Fara1.5는 이 '경량 모델 전략'의 다음 단계다. 이전 버전에서 발견된 한계(폼 처리, 자격증 사이트, 장시간 태스크)를 직접 겨냥해 설계됐다.
산업적 의미 — "에이전트 경쟁은 거대함이 아니라 효율"
AI 에이전트 분야는 현재 OpenAI(Operator), Google(Mariner), Anthropic(Computer Use) 등이 각자 대형 모델 기반 솔루션을 쏟아내고 있다. MS의 경량화 전략은 다른 방향이다.
"모두가 더 큰 모델로 가는 와중, MS는 더 똑똑한 설계로 작은 모델로 가자"는 선언이다. Qwen 같은 오픈소스 기반 모델을 재훈련하고, 도구 오케스트레이션과 사용자 인터페이스를 정교하게 다듬어, 온프레미스 환경에서도 실용 수준의 에이전트를 구동할 수 있음을 입증했다.
한국 기업들도 주목할 부분이 있다. 대규모 클라우드 서비스를 쓸 수 없는 금융·공공·제조 분야에서 자체 인프라 위에 경량 AI 에이전트를 띄울 수 있다는 뜻이기도 하다. 데이터 주권 이슈가 민감한 국내 환경에서, 온디바이스 AI 에이전트는 규제 리스크를 크게 낮춘다.
MS는 이번 발표와 함께 MagenticLite 실험판과 MagenticBrain 파운드리 버전, Fara1.5 모델을 모두 공개 예정이다. 깃허브, 허깅페이스 등에서 오픈소스 및 상용 라이선스로 제공될 것으로 보인다. 에이전트 시장이 이제 "큰 모델의 정확도 경쟁"에서 "경량화·효율화·배포 가능성"의 싸움으로 재편되고 있음을 보여주는 신호다.
편집 안내 | 이 기사는 AI 기술을 활용하여 글로벌 뉴스 소스를 분석·종합한 후, AIB프레스 편집팀의 검수를 거쳐 발행되었습니다. 정확한 정보 전달을 위해 노력하고 있으며, 원문 출처를 함께 제공합니다.
AI·테크 핵심 뉴스, 매주 한 통으로
한 주의 글로벌 AI·IT 뉴스 중 꼭 알아야 할 것만 골라 보내드립니다. 광고 없음, 언제든 해지.


