开源推荐

其他

近4.5万Star！比普通AI少写54%代码，这个项目让AI终于学会「偷懒」了

发表于 2026年06月26日阅读 5 评论 0

大家好，我是何三，独立开发者

你让 AI 写个日期选择器。

它给你装了个 flatpickr，写了个 wrapper 组件，加了一份样式表，然后开始跟你讨论时区问题。

404 行代码。

而 Ponytail 教它做的事：翻到最上面，写一行 <input type="date">，完工。

23 行。

这听起来像是在讲段子。但这不是段子。

Ponytail，9 天前刚上线 GitHub 的项目，现在 44.4k Star。拿来做 benchmark 的数据也相当离谱：在真实的 Claude Code 会话里，对一个 FastAPI + React 项目改 12 个功能需求，同样的 AI agent——

有 Ponytail 加持 vs 没有，代码量少了 54%，Token 省了 22%，成本降了 20%，速度快了 27%。而且安全性 100% 没打折。

对比组里用普通 prompt 说"写少一点"的方案，安全分直接掉到 95%。

你可能会想：这玩意儿是不是就是个系统级 prompt？

是，也不全是。

怎么说呢，它本质上是一个规则集——一个六步决策阶梯。在 AI 动手写代码之前，先过一遍这个 checklist：

1. 这东西真的需要存在吗？ → 不需要就跳过（YAGNI）
2. 标准库能搞定吗？ → 用标准库
3. 浏览器/平台自带？ → 用原生的
4. 已有依赖里能用吗？ → 别重复装
5. 一行能写出来？ → 一行
6. 都不行？写最少能跑的那版

ponytail决策阶梯

说实话，这规则简单到有点……无聊？我第一次看的时候也这么觉得。

但真正炸裂的是 benchmark 数据。

举个具体的例子。你让 AI 写一个颜色选择器。没有 Ponytail 的时候，它吭哧吭哧写了个 287 行的组件。有 Ponytail 的时候，它——老实用了 <input type="color">，23 行。

差了 12 倍。

这东西，怎么说呢，就是……就是那种你明明知道应该这么做，但 AI 它不这么干。AI 的默认行为就是"多写、多包、多抽象"，因为训练数据里那些"优秀代码"全是企业级工程实践，一个颜色选择器恨不得给你抽出三个设计模式。

Ponytail 干的事就一件：往 AI 脑子里植入一个声音，让它写代码之前先想半秒"真有必要吗？"

跑个题。我前几天试了一下让 AI 写一个 CSV 解析器。

没用 Ponytail 的时候，AI 给我整了个完整的类，带异常处理、带类型推断、带单元测试——相当专业，一看就是 Stack Overflow 高分答案的风格。

装了 Ponytail 之后，同样的需求，它就甩过来三行：

import csv
with open('data.csv') as f:
    reader = csv.DictReader(f)

然后问我："剩下的是业务逻辑，你确定要现在写吗？"

我当时就笑了。这语气像极了我那个干了十五年开发、每天五点准时下班的同事。

怎么装？一句话的事。

如果你用 Claude Code：

/plugin marketplace add DietrichGebert/ponytail
/plugin install ponytail@ponytail

用 Codex：

codex plugin marketplace add DietrichGebert/ponytail
codex

用 GitHub Copilot CLI：

copilot plugin marketplace add DietrichGebert/ponytail
copilot plugin install ponytail@ponytail

还有 OpenCode、Gemini CLI、Cursor、Windsurf、Cline、Aider、Zed……README 里列了整整 14 个 AI 编码工具的适配方式。基本覆盖了市面上你能叫出名字的所有 Agent。

更骚的是它还有四个强度等级：lite、full、ultra、off。ultra 模式是给那种"代码库已经把我惹毛了"的情况准备的——懂的都懂。

还有几个命令挺好用：

命令	作用
`/ponytail-review`	审查当前 diff，列出能删掉的部分
`/ponytail-audit`	对整个仓库做"过度工程审计"
`/ponytail-debt`	把标记为"以后再说"的技术债登记成册
`/ponytail-gain`	显示省了多少代码和钱

为什么这么设计？别问我，问作者去。他的 README 里全是那种一本正经说冷笑话的调调，比如 FAQ 里有人问"我真需要那个 120 行的缓存类怎么办"，作者回答："你不需要。非要的话他会写出来。慢悠悠地写。正确无误地写。一边写一边盯着你。"

盯着你。这三个字我笑了一上午。

如果你觉得这玩意儿跟之前那个 caveman 差不多——确实有点像，caveman 也是让 AI 少写废话的规则集。但 Ponytail 的 benchmark 数据更硬：caveman 只省了 20% 的代码，代价是 Token 反而多了 7%、成本多了 3%。Ponytail 是唯一一个在所有维度上都下降的方案。

少写 54% 代码，省 20% 成本，快 27%，100% 安全。

而且它有个核心原则我特别喜欢："懒，但不 negligent。" 边界校验不砍、数据保护不砍、安全处理不砍。只砍那些"写了也没人看"的过度抽象。

原理大概是这样，细节可能有出入——有懂的大佬欢迎指正。

说实话，我对这种"反常识"的工具一直有点警惕。因为大多数号称"让 AI 少写代码"的方案，最后往往就是粗暴地加一句"be concise"，结果 AI 把错误处理也给省了。

但 Ponytail 不一样。它的 benchmark 专门测了安全性，结果 100%。而对照组里用普通 YAGNI + one-liner prompt 的方案，安全分只有 95%。

那 5% 的差距，可能就是你在排查了一个小时的 bug 之后，发现 AI 没做空值校验。

所以我真觉得这个东西值得装一下。不占什么资源，装了也没副作用——实在不爽 /ponytail off 关掉就行。

在 GitHub 上看项目地址：https://github.com/DietrichGebert/ponytail

本文使用 MGO 编辑并发布

关注"何三笔记"，回复"mgo" 免费下载使用

版权声明：如无特殊说明，文章均为何三笔记原创，转载请注明出处

本文链接：https://www.h3blog.com/article/871/