大家好,我是何三,独立开发者

你让 AI 写个日期选择器。

它给你装了个 flatpickr,写了个 wrapper 组件,加了一份样式表,然后开始跟你讨论时区问题。

404 行代码。

而 Ponytail 教它做的事:翻到最上面,写一行 <input type="date">,完工。

23 行。

这听起来像是在讲段子。但这不是段子。

Ponytail,9 天前刚上线 GitHub 的项目,现在 44.4k Star。拿来做 benchmark 的数据也相当离谱:在真实的 Claude Code 会话里,对一个 FastAPI + React 项目改 12 个功能需求,同样的 AI agent——

有 Ponytail 加持 vs 没有,代码量少了 54%,Token 省了 22%,成本降了 20%,速度快了 27%。而且安全性 100% 没打折。

对比组里用普通 prompt 说"写少一点"的方案,安全分直接掉到 95%。

你可能会想:这玩意儿是不是就是个系统级 prompt?

是,也不全是。

怎么说呢,它本质上是一个规则集——一个六步决策阶梯。在 AI 动手写代码之前,先过一遍这个 checklist:

1. 这东西真的需要存在吗  不需要就跳过YAGNI
2. 标准库能搞定吗  用标准库
3. 浏览器/平台自带  用原生的
4. 已有依赖里能用吗  别重复装
5. 一行能写出来  一行
6. 都不行写最少能跑的那版

ponytail决策阶梯

说实话,这规则简单到有点……无聊?我第一次看的时候也这么觉得。

但真正炸裂的是 benchmark 数据。

举个具体的例子。你让 AI 写一个颜色选择器。没有 Ponytail 的时候,它吭哧吭哧写了个 287 行的组件。有 Ponytail 的时候,它——老实用了 <input type="color">,23 行。

差了 12 倍。

这东西,怎么说呢,就是……就是那种你明明知道应该这么做,但 AI 它不这么干。AI 的默认行为就是"多写、多包、多抽象",因为训练数据里那些"优秀代码"全是企业级工程实践,一个颜色选择器恨不得给你抽出三个设计模式。

Ponytail 干的事就一件:往 AI 脑子里植入一个声音,让它写代码之前先想半秒"真有必要吗?"

跑个题。我前几天试了一下让 AI 写一个 CSV 解析器。

没用 Ponytail 的时候,AI 给我整了个完整的类,带异常处理、带类型推断、带单元测试——相当专业,一看就是 Stack Overflow 高分答案的风格。

装了 Ponytail 之后,同样的需求,它就甩过来三行:

import csv
with open('data.csv') as f:
    reader = csv.DictReader(f)

然后问我:"剩下的是业务逻辑,你确定要现在写吗?"

我当时就笑了。这语气像极了我那个干了十五年开发、每天五点准时下班的同事。

怎么装?一句话的事。

如果你用 Claude Code:

/plugin marketplace add DietrichGebert/ponytail
/plugin install ponytail@ponytail

用 Codex:

codex plugin marketplace add DietrichGebert/ponytail
codex

用 GitHub Copilot CLI:

copilot plugin marketplace add DietrichGebert/ponytail
copilot plugin install ponytail@ponytail

还有 OpenCode、Gemini CLI、Cursor、Windsurf、Cline、Aider、Zed……README 里列了整整 14 个 AI 编码工具的适配方式。基本覆盖了市面上你能叫出名字的所有 Agent。

更骚的是它还有四个强度等级:litefullultraoff。ultra 模式是给那种"代码库已经把我惹毛了"的情况准备的——懂的都懂。

还有几个命令挺好用:

命令 作用
/ponytail-review 审查当前 diff,列出能删掉的部分
/ponytail-audit 对整个仓库做"过度工程审计"
/ponytail-debt 把标记为"以后再说"的技术债登记成册
/ponytail-gain 显示省了多少代码和钱

为什么这么设计?别问我,问作者去。他的 README 里全是那种一本正经说冷笑话的调调,比如 FAQ 里有人问"我真需要那个 120 行的缓存类怎么办",作者回答:"你不需要。非要的话他会写出来。慢悠悠地写。正确无误地写。一边写一边盯着你。"

盯着你。这三个字我笑了一上午。

如果你觉得这玩意儿跟之前那个 caveman 差不多——确实有点像,caveman 也是让 AI 少写废话的规则集。但 Ponytail 的 benchmark 数据更硬:caveman 只省了 20% 的代码,代价是 Token 反而多了 7%、成本多了 3%。Ponytail 是唯一一个在所有维度上都下降的方案。

少写 54% 代码,省 20% 成本,快 27%,100% 安全。

而且它有个核心原则我特别喜欢:"懒,但不 negligent。" 边界校验不砍、数据保护不砍、安全处理不砍。只砍那些"写了也没人看"的过度抽象。

原理大概是这样,细节可能有出入——有懂的大佬欢迎指正。

说实话,我对这种"反常识"的工具一直有点警惕。因为大多数号称"让 AI 少写代码"的方案,最后往往就是粗暴地加一句"be concise",结果 AI 把错误处理也给省了。

但 Ponytail 不一样。它的 benchmark 专门测了安全性,结果 100%。而对照组里用普通 YAGNI + one-liner prompt 的方案,安全分只有 95%。

那 5% 的差距,可能就是你在排查了一个小时的 bug 之后,发现 AI 没做空值校验。

所以我真觉得这个东西值得装一下。不占什么资源,装了也没副作用——实在不爽 /ponytail off 关掉就行。

在 GitHub 上看项目地址:https://github.com/DietrichGebert/ponytail

本文使用 MGO 编辑并发布

关注"何三笔记",回复"mgo" 免费下载使用