big_tech
10분 읽기

마이크로소프트, MAI-Image-2.5 공개...텍스트-이미지 생성 모델 3위 진입

마이크로소프트가 텍스트-투-이미지 생성 모델 'MAI-Image-2.5'를 발표했으며, Arena 리더보드에서 3위에 진입했다. 텍스트 렌더링과 상업용 이미지 정확도 개선이 특징이며, OpenAI·Google과 달리 기업용 정확도 경쟁에서 차별화 전략을 취하고 있다.

AIB프레스 편집팀
2026.05.27
마이크로소프트, MAI-Image-2.5 공개...텍스트-이미지 생성 모델 3위 진입

마이크로소프트가 텍스트-투-이미지 생성 모델의 최신작 'MAI-Image-2.5'를 공개했다. 이 모델은 독립적 AI 평가 플랫폼인 'Arena'의 텍스트-이미지 리더보드에서 3위에 랭크됐다. 마이크로소프트 AI 팀이 26일(현지시간) 발표한 바에 따르면, MAI-Image-2.5는 기존 MAI-Image-2 대비 텍스트 렌더링, 스타일화된 일러스트레이션, 상업용 이미지 생성에서 개선을 이뤘다.

마이크로소프트가 강조하는 가장 큰 경쟁력은 텍스트 인식 정확도다. 생성형 AI 기반 이미지 도구들이 텍스트를 정확히 표현하지 못한다는 비판이 지속되자, 마이크로소프트가 이를 집중 공략한 형태다. MAI-Image-2.5는 포스터의 글자, 패키징의 라벨, 제품 샷의 구조 등 상세한 텍스트 표현에서 선명함을 개선했다고 마이크로소프트는 설명했다.

아울러 객체, 장면 구조, 조명, 스케일, 공간 관계에 대한 시각적 추론 능력도 강화됐다. 간단한 지시문으로도 정교한 이미지를 생성할 수 있다는 뜻이다. 레이아웃의 일관성이 개선되고, 장면이 더 의도적으로 구성되며, 브랜드 중심의 시각적 표현도 정교해졌다.

경쟁 구도 속 마이크로소프트의 위치

텍스트-이미지 생성 분야의 경쟁이 지난해부터 활발해진 상황이다. OpenAI의 DALL-E 3, Google의 Gemini 이미지, Stability AI의 Stable Diffusion 3 등이 경쟁하는 가운데, 마이크로소프트가 3위로 진입했다는 것은 전략적 의미가 있다. Arena는 사람의 주관적 평가와 다양한 평가 메트릭을 조합해 순위를 산정하기 때문에, 실용적인 품질 평가라는 점에서 신뢰도가 있다.

마이크로소프트는 MAI-Image 시리즈를 Copilot 생태계의 핵심 요소로 위치 지었다. 기업이 광고, 디자인, 브랜딩 등 '실제 창의적 업무'에 쓸 수 있는 도구를 목표로 개발한 것이 특징이다. DALL-E 3이 예술성을 강조했다면, MAI-Image-2.5는 상업용 정확도를 내세우는 셈이다.

사용 가능 시기 및 배포 계획

마이크로소프트는 MAI-Image-2.5를 오늘부터 Arena 플레이그라운드에서 체험 가능하게 했다. MAI Playground와 Foundry(기업용 프롬프트 관리 플랫폼)에는 향후 2주 내 추가될 예정이다. 마이크로소프트 Copilot 생태계에 이 모델이 통합되면, 마이크로소프트 365 사용자와 개발자들이 활용할 수 있게 된다.

마이크로소프트의 이 같은 배포 전략은 기존 OpenAI·Google과의 경쟁에서 '정확도와 신뢰성'을 축으로 차별화하려는 의지를 보여준다. 생성형 AI 이미지 모델들이 '인상적인 시각'에는 우수하지만 '실무 정확도'에서는 여전히 한계를 보이는 상황에서, 마이크로소프트는 전문 크리에이터와 기업을 직접 타깃하는 경로를 택했다.

지금까지 텍스트-이미지 생성 경쟁은 이미지의 아름다움과 창의성을 축으로 진행돼 왔다. 그러나 기업이 실제로 필요한 것은 정확하고, 일관되고, 재현 가능한 결과물이다. 산업 분석가들은 MAI-Image-2.5가 이 시장 공백을 겨냥한 제품으로 평가하고 있다.

한국 시장에서의 의미

한국의 광고 에이전시, 이커머스 기업, 게임/엔터테인먼트 회사들이 생성형 이미지 도구를 도입 중인 가운데, 텍스트 표현과 정확도는 흔한 불만 항목이었다. 특히 한글 텍스트가 포함된 한국식 제품 사진, 패키징 디자인 등에서 기존 모델들이 제약을 보여 왔다. MAI-Image-2.5의 텍스트 렌더링 개선은 한국 기업의 마케팅 자산 제작 프로세스를 단축할 수 있다는 기대를 낳고 있다.

마이크로소프트가 Copilot 생태계를 강화하면서 기업용 이미지 생성 도구로서의 입지를 다지는 중이다. 생성형 이미지 경쟁의 축이 미학에서 정확도와 신뢰성으로 이동하고 있다는 신호로 해석된다.

편집 안내 | 이 기사는 AI 기술을 활용하여 글로벌 뉴스 소스를 분석·종합한 후, AIB프레스 편집팀의 검수를 거쳐 발행되었습니다. 정확한 정보 전달을 위해 노력하고 있으며, 원문 출처를 함께 제공합니다.

마이크로소프트
생성형 AI
AI 이미지 생성
MAI-Image-2.5
텍스트-이미지 모델
기업용 정확도

AI·테크 핵심 뉴스, 매주 한 통으로

한 주의 글로벌 AI·IT 뉴스 중 꼭 알아야 할 것만 골라 보내드립니다. 광고 없음, 언제든 해지.

관련 기사