알리바바, 'Qwen3.6-Max-Preview' 공개...에이전트 코딩서 ChatGPT 능가
알리바바가 4월 20일 공개한 Qwen3.6-Max-Preview는 소프트웨어 엔지니어링 작업부터 과학 프로그래밍까지 6개 주요 벤치마크에서 1위를 기록했다. Claude 4.5를 능가하는 지시 따르기 능력과 함께 OpenAI·Anthropic 호환 API를 제공해 개발자 채택 장벽을 낮췄다. 무료 오픈소스에서 유료 독점 모델로의 전환은 중국 AI 랩의 비즈니스 모델 변화를 나타내며, 중국 오픈모델 사용량이 2024년 1.2%에서 2025년 30%로 증가한 가운데 Qwen이 이를 주도하고 있다.

알리바바가 차기 기함 AI 모델 Qwen3.6-Max-Preview를 21일 공개하며 프론티어 레이스를 한 단계 올렸다. 이 모델은 회사가 선적한 가장 강력한 버전으로, 6개의 주요 코딩 벤치마크에서 1위를 차지했으며 선행 모델 Qwen3.6-Plus 대비 세계 지식과 지시 따르기 능력에서 의미 있는 개선을 기록했다.
Qwen 공식 블로그에 따르면 Qwen3.6-Max-Preview는 SWE-bench Pro(실무 소프트웨어 엔지니어링 작업), Terminal-Bench 2.0(명령줄 실행), SkillsBench(일반 문제 해결), QwenClawBench(도구 사용), QwenWebBench(웹 상호작용), SciCode(과학 프로그래밍) 등 코딩과 에이전트 능력을 측정하는 여러 주요 벤치마크에서 1위를 기록했다.
Qwen3.6-Plus 대비 에이전트 기술 벤치마크에서 Claude 4.5나 GLM 5.1 같은 다른 모델 위에 위치했다. 지식 벤치마크에서도 SuperGPQA(고급 추론)는 2.3% 증가, QwenChineseBench(중국어 성능)는 5.3% 증가했다. ToolcallFormatIFBench로 측정한 지시 따르기 능력은 Claude를 능가했다.
모델은 Qwen Studio와 Alibaba Cloud Model Studio API를 통해 qwen3.6-max-preview라는 문자열로 지금 이용 가능하다. 이는 오픈 가중치가 없는 독점적 호스팅 모델이며, OpenAI와 Anthropic 사양 모두와 호환되는 API를 갖추고 있어 개발자들이 최소 변경으로 기존 파이프라인에 이를 연결할 수 있다.
이는 또한 알리바바의 비즈니스 모델 전환을 의미한다. 알리바바는 기본적으로 강력한 오픈소스 모델을 제공하는 것으로 알려져 있었지만, 낮은 사양 모델은 여전히 오픈소스다. Qwen3.6-Plus 3일 전 알리바바는 35억 개 파라미터만 활성화하는 35억 파라미터 모델인 Qwen3.6-35B-A3B를 오픈소스화했다.
파라미터는 AI의 학습, 추론, 정보 저장 능력을 결정하는 것으로, 파라미터가 많을수록 더 넓은 범위의 지식이 가능하다는 의미다. 이러한 접근은 출력 품질을 희생하지 않으면서 컴퓨팅 비용을 낮추도록 설계되었다.
Max-Preview는 또한 preserve_thinking이라는 기능을 탑재했으며, 이는 멀티턴 대화에서 추론 흔적을 전달한다. 알리바바는 에이전트 작업에서 맥락 연속성이 중요한 경우 특히 이를 권장했다. 자율 에이전트를 실행하거나 장시간 코드 생성 워크플로우를 진행하는 개발자에게는 의미 있는 추가 기능이다.
알리바바는 지난주 Qwen Code의 무료 티어를 폐쇄한 것으로 보도됐으며, 이는 중국 AI 랩 MiniMax가 상업 사용 없이 오픈소스 라이선스를 서술한 지 며칠 후였다. 두 조치 모두 더 광범위한 전환을 시사한다. 무료 오픈 서비스에서 거대한 채택을 이룬 중국 AI 랩들이 이제 화폐화된 독점 제공으로 전환하고 있다는 것이다. Qwen은 Meta의 Llama를 자가 호스팅 모델로 가장 배포된 모델로 추월했으며, 그 모멘텀은 거의 전적으로 무료 접근에 의존했다.
무료-유료 전환은 또 다른 추세와 병행한다. 중국 오픈모델은 2024년 말 전 세계 오픈모델 사용량의 1.2%에서 2025년 말까지 대략 30%로 증가했으며, Qwen이 이를 주도했다. Qwen3.6-Max-Preview는 이러한 창에서의 독점 첨단으로, 알리바바가 OpenAI의 GPT 및 Anthropic의 Claude와 직접 경쟁할 것으로 기대하는 모델이다.
Qwen3.6-Max-Preview는 명시적으로 작업 진행 중으로 표시되어 있다. 알리바바는 모델이 여전히 활발히 개발 중이며 향후 버전에서 추가 개선을 기대한다고 밝혔다. 독립적 벤치마킹 회사 Artificial Analysis는 이를 Muse Spark 뒤로 두 번째 최고 성능 모델로 평가했으며, 가격대별 비교 가능한 추론 모델의 중앙값을 훨씬 위로 올려놓았다. 모델은 256k 토큰 컨텍스트 윈도우를 지원하며 시작 시 텍스트만 처리하며 이미지 입력은 없다.
중국 AI 경쟁 격화의 신호탄
이번 발표는 중국 프론티어 AI 모델 경쟁이 본격적으로 진입하고 있음을 보여준다. Qwen3.6-Max-Preview 출시는 중국 IT 대기업들 간 생성형 AI 경쟁을 심화시킨다. 제3자 리더보드에서 1위를 차지함으로써 알리바바는 Zhipu AI(GLM)와 MiniMax 같은 경쟁사의 위치에 직접 도전한다.
에이전트 프로그래밍과 기술 벤치마크에 대한 초점은 또한 개발자 생산성을 목표로 하는 AI 모델의 실무적이고 작업 지향적인 성능이 중요한 엔터프라이즈 및 개발자 시장으로의 전략적 공략을 시사한다.
한편, 알리바바는 Qwen Code의 무료 티어를 폐쇄한 것으로 보도됐으며, 이는 더 광범위한 전환의 신호다. 무료 오픈 서비스에 기반한 거대한 채택을 이룬 중국 AI 랩들이 이제 화폐화된 독점 제공으로 전환하고 있다는 것이다. Qwen은 Meta의 Llama를 자가 호스팅 모델로 가장 배포된 모델로 추월했으며, 그 모멘텀은 거의 전적으로 무료 접근에 의존했다.
개발자 생태계 확보 경쟁
Qwen3.6-Max-Preview는 OpenAI와 Anthropic 사양 모두와 호환되는 API를 제공함으로써 개발자 채택 장벽을 낮추는 데 전략적 중점을 두고 있다. 이는 단순히 기술 경쟁을 넘어 글로벌 개발자 생태계를 확보하려는 알리바바의 의지를 드러낸다.
특히 프리뷰 단계에서도 6개 코딩 벤치마크에서 1위를 기록한 것은 알리바바가 이전의 양자 컴퓨팅과 로봇 분야와는 달리 생성형 AI의 핵심 경쟁에서 얼마나 진지한지를 보여준다. 차기 개발자 도구 시장은 Anthropic의 Claude Code와 OpenAI의 GPT 기반 개발 도구 간 경쟁 속에서 Qwen이라는 제3의 강자가 등장했음을 의미한다.
원문 출처
- https://decrypt.co/364948/alibaba-qwen-3-6-max-preview-most-powerful-model
- https://www.alibabacloud.com/blog/alibaba-unveils-qwen3-6-plus-to-accelerate-agentic-ai-deployment-for-enterprises-and-alibaba%E2%80%99s-ai-applications_603000
- https://cntechpost.com/2026/04/20/alibaba-releases-qwen3-6-max-preview-stronger-instruction-following-capabilities/
편집 안내 | 이 기사는 AI 기술을 활용하여 글로벌 뉴스 소스를 분석·종합한 후, AIB프레스 편집팀의 검수를 거쳐 발행되었습니다. 정확한 정보 전달을 위해 노력하고 있으며, 원문 출처를 함께 제공합니다.


