大家好,我是何三,独立开发者
你让 AI 写个日期选择器。
它给你装了个 flatpickr,写了个 wrapper 组件,加了一份样式表,然后开始跟你讨论时区问题。
404 行代码。
而 Ponytail 教它做的事:翻到最上面,写一行 <input type="date">,完工。
23 行。
这听起来像是在讲段子。但这不是段子。
Ponytail,9 天前刚上线 GitHub 的项目,现在 44.4k Star。拿来做 benchmark 的数据也相当离谱:在真实的 Claude Code 会话里,对一个 FastAPI + React 项目改 12 个功能需求,同样的 AI agent——
有 Ponytail 加持 vs 没有,代码量少了 54%,Token 省了 22%,成本降了 20%,速度快了 27%。而且安全性 100% 没打折。
对比组里用普通 prompt 说"写少一点"的方案,安全分直接掉到 95%。
你可能会想:这玩意儿是不是就是个系统级 prompt?
是,也不全是。
怎么说呢,它本质上是一个规则集——一个六步决策阶梯。在 AI 动手写代码之前,先过一遍这个 checklist:
1. 这东西真的需要存在吗? → 不需要就跳过(YAGNI)
2. 标准库能搞定吗? → 用标准库
3. 浏览器/平台自带? → 用原生的
4. 已有依赖里能用吗? → 别重复装
5. 一行能写出来? → 一行
6. 都不行?写最少能跑的那版

说实话,这规则简单到有点……无聊?我第一次看的时候也这么觉得。
但真正炸裂的是 benchmark 数据。
举个具体的例子。你让 AI 写一个颜色选择器。没有 Ponytail 的时候,它吭哧吭哧写了个 287 行的组件。有 Ponytail 的时候,它——老实用了 <input type="color">,23 行。
差了 12 倍。
这东西,怎么说呢,就是……就是那种你明明知道应该这么做,但 AI 它不这么干。AI 的默认行为就是"多写、多包、多抽象",因为训练数据里那些"优秀代码"全是企业级工程实践,一个颜色选择器恨不得给你抽出三个设计模式。
Ponytail 干的事就一件:往 AI 脑子里植入一个声音,让它写代码之前先想半秒"真有必要吗?"
跑个题。我前几天试了一下让 AI 写一个 CSV 解析器。
没用 Ponytail 的时候,AI 给我整了个完整的类,带异常处理、带类型推断、带单元测试——相当专业,一看就是 Stack Overflow 高分答案的风格。
装了 Ponytail 之后,同样的需求,它就甩过来三行:
import csv
with open('data.csv') as f:
reader = csv.DictReader(f)
然后问我:"剩下的是业务逻辑,你确定要现在写吗?"
我当时就笑了。这语气像极了我那个干了十五年开发、每天五点准时下班的同事。
怎么装?一句话的事。
如果你用 Claude Code:
/plugin marketplace add DietrichGebert/ponytail
/plugin install ponytail@ponytail
用 Codex:
codex plugin marketplace add DietrichGebert/ponytail
codex
用 GitHub Copilot CLI:
copilot plugin marketplace add DietrichGebert/ponytail
copilot plugin install ponytail@ponytail
还有 OpenCode、Gemini CLI、Cursor、Windsurf、Cline、Aider、Zed……README 里列了整整 14 个 AI 编码工具的适配方式。基本覆盖了市面上你能叫出名字的所有 Agent。
更骚的是它还有四个强度等级:lite、full、ultra、off。ultra 模式是给那种"代码库已经把我惹毛了"的情况准备的——懂的都懂。
还有几个命令挺好用:
| 命令 | 作用 |
|---|---|
/ponytail-review |
审查当前 diff,列出能删掉的部分 |
/ponytail-audit |
对整个仓库做"过度工程审计" |
/ponytail-debt |
把标记为"以后再说"的技术债登记成册 |
/ponytail-gain |
显示省了多少代码和钱 |
为什么这么设计?别问我,问作者去。他的 README 里全是那种一本正经说冷笑话的调调,比如 FAQ 里有人问"我真需要那个 120 行的缓存类怎么办",作者回答:"你不需要。非要的话他会写出来。慢悠悠地写。正确无误地写。一边写一边盯着你。"
盯着你。这三个字我笑了一上午。
如果你觉得这玩意儿跟之前那个 caveman 差不多——确实有点像,caveman 也是让 AI 少写废话的规则集。但 Ponytail 的 benchmark 数据更硬:caveman 只省了 20% 的代码,代价是 Token 反而多了 7%、成本多了 3%。Ponytail 是唯一一个在所有维度上都下降的方案。
少写 54% 代码,省 20% 成本,快 27%,100% 安全。
而且它有个核心原则我特别喜欢:"懒,但不 negligent。" 边界校验不砍、数据保护不砍、安全处理不砍。只砍那些"写了也没人看"的过度抽象。
原理大概是这样,细节可能有出入——有懂的大佬欢迎指正。
说实话,我对这种"反常识"的工具一直有点警惕。因为大多数号称"让 AI 少写代码"的方案,最后往往就是粗暴地加一句"be concise",结果 AI 把错误处理也给省了。
但 Ponytail 不一样。它的 benchmark 专门测了安全性,结果 100%。而对照组里用普通 YAGNI + one-liner prompt 的方案,安全分只有 95%。
那 5% 的差距,可能就是你在排查了一个小时的 bug 之后,发现 AI 没做空值校验。
所以我真觉得这个东西值得装一下。不占什么资源,装了也没副作用——实在不爽 /ponytail off 关掉就行。
在 GitHub 上看项目地址:https://github.com/DietrichGebert/ponytail
本文使用 MGO 编辑并发布
关注"何三笔记",回复"mgo" 免费下载使用