大家好,我是何三,独立开发者

qwen36plus_cover

2026年4月2日,阿里突然甩出一张王炸——Qwen3.6-Plus,已经在阿里云百炼开放 API 调用。

如果说 Qwen3.5 是千问系列在编程能力上的一次跃迁,那 Qwen3.6-Plus 更像是直接捅破了国产编程模型的天花板。

它在 SWE-bench、Terminal-Bench2、NL2Repo 等一系列权威评测中的表现,已经逼近甚至部分超越了 Claude Opus 4.5——而参数量只有对方的一半甚至三分之一。

这篇文章,我把 Qwen3.6-Plus 的核心变化、实测表现和实际使用方式给你捋清楚。

一、Qwen3.6-Plus 到底升级了什么

Qwen3.6-Plus 是千问 3.6 系列的第一款模型。后续还会发布旗舰款 Qwen3.6-Max 和小尺寸开源版本。

先看一眼核心参数:

  • 上下文窗口:默认 100万 Token
  • 多模态:支持视觉理解、视频推理、图片转代码
  • 智能体能力:深度融合推理 + 记忆 + 执行
  • 编程能力:代码生成、修复、工具调用全面升级

qwen36plus_01

看起来比较笼统?我拆几个关键点说。

1. 编程智能体:直逼 Claude

这次升级的重头戏就是编程。

SWE-bench Verified(代码修复基准)上,Qwen3.6-Plus 紧追 Claude Opus 4.5;在 Terminal-Bench2(终端编程任务)中,表现更是领先于国内同尺寸模型。

还有一个值得注意的细节:在 NL2Repo 这类长程编程任务中,Qwen3.6-Plus 凭借更轻的体量,交出了超越 2 到 3 倍参数量模型的成绩。

什么意思?就是用更小的模型,干更大的活。

2. 通用智能体 + 工具调用

不只是写代码,Qwen3.6-Plus 在通用智能体层面也有显著突破。

在多个高难度长程规划任务中拿到了最优成绩,各类工具调用基准上全面领先。简单说,它不只是"能写代码",还能"帮你把代码跑起来"。

它已经针对 OpenClaw、Qwen Code、Claude Code、Kilo Code、Cline、OpenCode 等主流 Agent 框架做了优化适配。不管你用哪个框架,开箱即用。

3. 多模态推理升级

这次更新还强化了跨模态信息整合能力:

  • 复杂文档理解:长文档信息提取更精准
  • 视频推理:能逐帧分析视频内容并做脚本拆解
  • 视觉编程:看图就能复刻出对应网页
  • 物理世界理解:对真实场景图片的感知力明显增强

4. 100 万上下文

默认支持 1M Token 上下文窗口。这是个什么概念?大概相当于一口气读完 750 万个汉字。对于需要处理长代码仓库、长文档、多轮对话的场景,这基本够用了。

qwen36plus_02

二、Vibe Coding 实测:一句话出完整项目

光看数据不直观,我摘几个实测案例。

案例一:3D 雪山场景

输入一句话:

"制作一个3D的雪山场景,雪山中间有一个日式的寺庙,整体风格参考塞尔达旷野之息。"

Qwen3.6-Plus 大约2分钟生成了完整的可交互页面:

  • Three.js 实时渲染的3D雪山
  • 日式寺庙建模,塞尔达清新风
  • 360度自由旋转、缩放视角
  • 动态飘落的雪花粒子效果

案例二:AI 资讯日历网站

"帮我生成一个有科技感的AI日历网站,首页为月历视图,每天标注AI大事件,点击可进入详情页。"

同样一句话,模型输出了完整的单页应用:

  • 带月份翻阅的月历视图
  • 每日资讯标注和点击跳转
  • 详情页包含事件标题、简介、来源链接
  • 科技感 UI 设计

案例三:消消乐小游戏

"生成一个美食卡通主题的消消乐小游戏网站。"

提示词极简,但输出效果完整:核心玩法、连锁机制、视觉 UI、辅助功能全覆盖。

qwen36plus_03

从这些实测来看,Qwen3.6-Plus 在 Vibe Coding 上的提升主要体现在两个方面:审美和交互设计更成熟了,对复杂需求的理解更准确了。

三、不只是"能写代码"

Vibe Coding 只是冰山一角。

Qwen3.6-Plus 还支持更硬核的场景:

命令行开发:通过 Qwen Code 插件,在 VS Code 里直接读取开源项目、理解需求、规划结构,一次性输出完整代码。实测给一个 GitHub 项目介绍,3 分钟就生成了完整的 Landing Page。

代码重构:喂给它一坨老旧代码,它会先分析问题、整理优化清单,确认后再动手改。这个"先问再做"的分寸感,比直接大刀阔斧上手的模型靠谱不少。

多模态任务:扔一段视频给它,能做逐秒脚本拆解,还能根据内容二创成小红书爆款文案。喂一张设计稿,它能复刻出比原图还好看的在线网页。

四、怎么用

目前 Qwen3.6-Plus 有几个入口:

  1. 阿里云百炼 API:适合开发者在自己的应用中调用
  2. Qwen Chat(chat.qwen.ai):在线对话,可直接体验
  3. 千问 APP / 悟空:移动端也可以用

百炼的 API 接入方式和之前的千问模型基本一致,模型名换成 qwen3.6-plus 就行。

还有一个信号值得关注:Qwen3.6-Plus 的参数量不到 K2.5 和 GLM-5 的一半,但性能实现对标甚至超越。这背后是阿里 ATH(Alibaba Token Hub)的思路落地——用更高效的模型,跑更少的 Token,干更多的事

五、值不值得关注

我的判断:值得,而且非常值得。

几个理由:

  • 编程天花板:国产模型第一次在真实编程评测中如此接近 Claude,说明差距在迅速缩小
  • 性价比极高:小参数量大性能,API 调用成本会更有优势
  • 生态完善:主流 Agent 框架全部适配,开发者迁移成本极低
  • 后续可期:Qwen3.6-Max 和开源版本还在路上

如果你是开发者,Qwen3.6-Plus 值得作为你的首选编程模型之一试试。如果你不是开发者,它把 Vibe Coding 的门槛降到了"一句话"的级别,想做什么直接说就行。


本文使用 MGO 编辑并发布

关注"何三笔记",回复"mgo" 免费下载使用