大家好,我是何三,独立开发者
shadcn 出新项目了。
就是那个 shadcn/ui 的作者,347k Star 的前端顶流。这次他没做组件库,搞了个叫 improve 的东西——让最强 AI 模型当架构师,审计你的代码库、写执行计划,然后交给便宜的模型去干活。
3 天,2630 Star。
说实话,我看到这个思路的时候直接愣了。
现在大家用 AI 写代码,基本就一个操作:把所有代码丢给 Claude 或者 GPT,在对话框里提需求。模型从零开始理解你的项目,生成代码,你 review,改 bug,循环。
问题在哪?
贵。
Claude Opus 或者 GPT-4 跑一次大项目审计,那个 Token 消耗——怎么形容呢,就是那种……就是那种点外卖不看价格的感觉。而且这些最强模型的真正优势(理解上下文、做判断、写架构)在执行"改这个文件第48行的变量名"这种苦力活时,完全浪费了。
improve 的思路简单到难以置信:把"动脑"和"动手"拆开。
最强模型只负责动脑——理解项目结构、做代码审计、找出值得改的地方、写一份详尽的执行计划。然后便宜的模型(便宜 10-20 倍的那种)照着计划撸代码。
这就像什么呢——你让一个资深架构师画好施工图,标清楚每一根钢筋的位置和材质,然后让实习生照着图纸砌砖。
以前你可是让架构师自己去砌砖的,一小时 500 块那种。

跑个题——这让我想起 2019 年带团队的时候。组里来了个新人,能力没问题,但整整一周都在搞清楚项目结构,最后发现方向全错了。如果当时有人花 2 小时把项目架构梳理清楚画好地图——现在 improve 做的就是这件事,只不过 AI 版的。
安装只要一行命令:
npx skills add shadcn/improve
然后在你的 AI 编辑器(支持 Agent Skills 协议的都能用)里跑:
/improve full audit
它会干几件事。
先侦察。 扫描整个项目,搞清楚用什么技术栈、构建命令是什么、测试怎么跑、代码规范有哪些。然后把这些数据记下来,作为后续所有计划的验证标准——任何改动的正确性都靠这些命令来检验。
再审计。 并行派出多个子 agent,分 9 个维度同时检查:正确性、安全性、性能、测试覆盖率、技术债、依赖管理、开发者体验、文档质量、方向建议。每个发现都标注文件:行号,附带影响评估和置信度。
然后复核。 子 agent 有时候会报假警——就像当年组里有人跟风报 bug,结果是自己配错了环境。主模型会把每个发现再读一遍,误报直接丢弃,并且记录为什么丢弃,下次不会再报。
最后出计划。 每个选中的发现生成一份执行计划,放到 plans/ 目录里。
举个例子,它在 shadcn/ui 项目上跑了一次审计:
| # | 发现 | 类别 | 工作量 | 置信度 |
|---|---|---|---|---|
| 1 | search.ts 和 view.ts 的 shadow-config 重复了,两份已经出现差异(TODO 注释还在 search.ts:31) | 技术债 | 中 | 高 |
| 2 | migrate-icons.ts:168 的图标迁移算法是 O(n²) | 性能 | 小 | 高 |
你挑一个:
/improve plan 1
它就往 plans/ 里写一个文件。这文件厉害在哪呢——自包含的。里面把当前代码摘进来、repo 的规范写清楚、每一步做完用什么命令验证都标得明明白白。还带 STOP 条件:如果实际情况和计划不符,停下来报告,而不是让小模型自己瞎编。
然后执行:
/improve execute 001
它会派一个便宜的模型,在隔离的 git worktree 里按计划改代码——注意不是在你的工作目录直接改,是另开一个分支。改完后自动跑验证,跑完回来报告结果。合并?你自己决定,它绝不碰你的主分支。
为什么这么设计?别问我,问作者去——反正 shadcn 在 README 里写了条硬规则:"Never modifies source code itself." 这活儿我干不了,得你自己来。
说实话,这块我也没完全搞懂怎么在 agent skill 层面做到"隔离执行"的——有懂的大佬欢迎指正。
类似的分层思路我还见过几个:
- Claude Code 本身有 planning 模式,但 plans 不输出为文件,执行和审计是混在一起的
- Aider 的 architect 模式也尝试了"写计划+执行"分离,但没有 improve 这么系统化——improve 会把计划写成物理文件,人类也能读、也能手动执行
觉得这类 AI 分层思路有意思?我上次写过一篇《AI Agent 正在疯狂写 bug,问题出在哪》,关注公众号回复"agent"就能看。
GitHub 地址
https://github.com/shadcn/improve
shadcn 这次没造组件库,但造了一个让 AI 编码从粗放走向精细化的框架。
如果你每天都在用 AI 写代码、每个月账单越看越心疼——试试 improve,让最强模型当你的技术总监,便宜的模型当你的码农。
反正我准备把这个加到我的 workflow 里了。Token 省下来了,那速度呢?会有影响吗?几乎没有——架构师画图的时候,实习生等着,反正实习生也不贵。
本文使用 MGO 编辑并发布
关注"何三笔记",回复"mgo" 免费下载使用