开源推荐

其他

国产编程模型杀入决赛圈！Qwen3.6-Plus 性能直逼 Claude，API已开放

发表于 2026年04月04日阅读 11 评论 0

大家好，我是何三，独立开发者

qwen36plus_cover

2026年4月2日，阿里突然甩出一张王炸——Qwen3.6-Plus，已经在阿里云百炼开放 API 调用。

如果说 Qwen3.5 是千问系列在编程能力上的一次跃迁，那 Qwen3.6-Plus 更像是直接捅破了国产编程模型的天花板。

它在 SWE-bench、Terminal-Bench2、NL2Repo 等一系列权威评测中的表现，已经逼近甚至部分超越了 Claude Opus 4.5——而参数量只有对方的一半甚至三分之一。

这篇文章，我把 Qwen3.6-Plus 的核心变化、实测表现和实际使用方式给你捋清楚。

一、Qwen3.6-Plus 到底升级了什么

Qwen3.6-Plus 是千问 3.6 系列的第一款模型。后续还会发布旗舰款 Qwen3.6-Max 和小尺寸开源版本。

先看一眼核心参数：

上下文窗口：默认 100万 Token
多模态：支持视觉理解、视频推理、图片转代码
智能体能力：深度融合推理 + 记忆 + 执行
编程能力：代码生成、修复、工具调用全面升级

qwen36plus_01

看起来比较笼统？我拆几个关键点说。

1. 编程智能体：直逼 Claude

这次升级的重头戏就是编程。

在 SWE-bench Verified（代码修复基准）上，Qwen3.6-Plus 紧追 Claude Opus 4.5；在 Terminal-Bench2（终端编程任务）中，表现更是领先于国内同尺寸模型。

还有一个值得注意的细节：在 NL2Repo 这类长程编程任务中，Qwen3.6-Plus 凭借更轻的体量，交出了超越 2 到 3 倍参数量模型的成绩。

什么意思？就是用更小的模型，干更大的活。

2. 通用智能体 + 工具调用

不只是写代码，Qwen3.6-Plus 在通用智能体层面也有显著突破。

在多个高难度长程规划任务中拿到了最优成绩，各类工具调用基准上全面领先。简单说，它不只是"能写代码"，还能"帮你把代码跑起来"。

它已经针对 OpenClaw、Qwen Code、Claude Code、Kilo Code、Cline、OpenCode 等主流 Agent 框架做了优化适配。不管你用哪个框架，开箱即用。

3. 多模态推理升级

这次更新还强化了跨模态信息整合能力：

复杂文档理解：长文档信息提取更精准
视频推理：能逐帧分析视频内容并做脚本拆解
视觉编程：看图就能复刻出对应网页
物理世界理解：对真实场景图片的感知力明显增强

4. 100 万上下文

默认支持 1M Token 上下文窗口。这是个什么概念？大概相当于一口气读完 750 万个汉字。对于需要处理长代码仓库、长文档、多轮对话的场景，这基本够用了。

qwen36plus_02

二、Vibe Coding 实测：一句话出完整项目

光看数据不直观，我摘几个实测案例。

案例一：3D 雪山场景

输入一句话：

"制作一个3D的雪山场景，雪山中间有一个日式的寺庙，整体风格参考塞尔达旷野之息。"

Qwen3.6-Plus 大约2分钟生成了完整的可交互页面：

Three.js 实时渲染的3D雪山
日式寺庙建模，塞尔达清新风
360度自由旋转、缩放视角
动态飘落的雪花粒子效果

案例二：AI 资讯日历网站

"帮我生成一个有科技感的AI日历网站，首页为月历视图，每天标注AI大事件，点击可进入详情页。"

同样一句话，模型输出了完整的单页应用：

带月份翻阅的月历视图
每日资讯标注和点击跳转
详情页包含事件标题、简介、来源链接
科技感 UI 设计

案例三：消消乐小游戏

"生成一个美食卡通主题的消消乐小游戏网站。"

提示词极简，但输出效果完整：核心玩法、连锁机制、视觉 UI、辅助功能全覆盖。

qwen36plus_03

从这些实测来看，Qwen3.6-Plus 在 Vibe Coding 上的提升主要体现在两个方面：审美和交互设计更成熟了，对复杂需求的理解更准确了。

三、不只是"能写代码"

Vibe Coding 只是冰山一角。

Qwen3.6-Plus 还支持更硬核的场景：

命令行开发：通过 Qwen Code 插件，在 VS Code 里直接读取开源项目、理解需求、规划结构，一次性输出完整代码。实测给一个 GitHub 项目介绍，3 分钟就生成了完整的 Landing Page。

代码重构：喂给它一坨老旧代码，它会先分析问题、整理优化清单，确认后再动手改。这个"先问再做"的分寸感，比直接大刀阔斧上手的模型靠谱不少。

多模态任务：扔一段视频给它，能做逐秒脚本拆解，还能根据内容二创成小红书爆款文案。喂一张设计稿，它能复刻出比原图还好看的在线网页。

四、怎么用

目前 Qwen3.6-Plus 有几个入口：

阿里云百炼 API：适合开发者在自己的应用中调用
Qwen Chat（chat.qwen.ai）：在线对话，可直接体验
千问 APP / 悟空：移动端也可以用

百炼的 API 接入方式和之前的千问模型基本一致，模型名换成 qwen3.6-plus 就行。

还有一个信号值得关注：Qwen3.6-Plus 的参数量不到 K2.5 和 GLM-5 的一半，但性能实现对标甚至超越。这背后是阿里 ATH（Alibaba Token Hub）的思路落地——用更高效的模型，跑更少的 Token，干更多的事。

五、值不值得关注

我的判断：值得，而且非常值得。

几个理由：

编程天花板：国产模型第一次在真实编程评测中如此接近 Claude，说明差距在迅速缩小
性价比极高：小参数量大性能，API 调用成本会更有优势
生态完善：主流 Agent 框架全部适配，开发者迁移成本极低
后续可期：Qwen3.6-Max 和开源版本还在路上

如果你是开发者，Qwen3.6-Plus 值得作为你的首选编程模型之一试试。如果你不是开发者，它把 Vibe Coding 的门槛降到了"一句话"的级别，想做什么直接说就行。

本文使用 MGO 编辑并发布

关注"何三笔记"，回复"mgo" 免费下载使用

版权声明：如无特殊说明，文章均为何三笔记原创，转载请注明出处

本文链接：https://www.h3blog.com/article/752/

一、Qwen3.6-Plus 到底升级了什么
二、Vibe Coding 实测：一句话出完整项目
三、不只是"能写代码"
四、怎么用
五、值不值得关注