大家好,我是何三,独立开发者

你有没有被 AI 气笑过?

我最近做个日期选择器,跟 Claude 说"加个日期选择",好家伙,它给我装了 flatpickr、写了一个 wrapper 组件、加了个 stylesheet,然后开始问我"时区怎么处理"。

我就想选个生日,不是要发射火箭。

5 天前,GitHub 上冒出来一个项目,叫 ponytail,现在已经 21.9k Star(约 2.2 万)。

它干的事情简单到离谱——让 AI Agent 像公司里最懒的那个资深工程师一样写代码:什么都不说,写一行,就跑通了。

80-94% 更少的代码,3-6 倍更快,47-77% 更便宜。 这是他们跑了 10 轮基准测试得出的中位数,支持 Haiku、Sonnet、Opus 三个模型。

说实话,第一次看到这个数据我没啥感觉。直到我亲手装了一遍。

装完以后,同样的需求,AI 给我的代码从 50 行变成了 1 行。

那行代码是这样:

<!-- ponytail: 浏览器自带这功能 -->
<input type="date">

对,就这。

那一刻我对着屏幕笑了大概半分钟。

我以前写的那些 datepicker 组件,十几层 div、各种 polyfill、时区适配……浏览器它自己就有啊。

这就是 ponytail 的厉害之处——它不是什么黑科技,它只是让 AI 在写代码之前,先停下来想六个问题。

这六个问题,治好了我的代码内耗

ponytail 的核心是一套 6 步决策梯,AI 每次写代码前按顺序走一遍,停在第一个满足的台阶上:

1. 这东西真的需要存在吗   不需要就跳过YAGNI原则
2. 标准库能搞定            直接用
3. 浏览器/平台自带功能      直接用
4. 已经安装的依赖能用       复用
5. 一行代码能搞定           一行搞定
6. 以上都不行才写最少能做工作的代码

说白了,以前 AI 写代码的思路是"能加的功能全加上",而 ponytail 教的思路是"能删的东西全删掉"。

这让我想起一个事儿。

我之前实习的时候带我的 senior,老头儿,扎个马尾辫,戴个圆框眼镜,在公司待的时间比版本控制软件还长。我写了五十行代码拿过去给他看,他看了一眼,一句话没说,删了四十九行,留下一行。

然后走了。

我当时心里那个复杂啊——又觉得丢人,又觉得牛逼。

ponytail 就是把这种思维塞进了 AI Agent 的脑子里。

哦对了,这项目的名字 "ponytail" 就是这么来的。项目作者自己说的:"你知道为什么叫这个。"

怎么装?比你想象的简单

好,说到安装,这可能是你花在 ponytail 上最大的精力了。

它支持 13 种 AI Agent:Claude Code、Codex、Copilot CLI、Cursor、Windsurf、Cline、Aider、Gemini CLI、Kiro……基本上你知道的它全支持。

拿 Claude Code 来说:

/plugin marketplace add DietrichGebert/ponytail
/plugin install ponytail@ponytail

两句命令,装完即用。

原理大概是这样——它用两个极其轻量的 Node.js 生命周期钩子,在 Agent 每次生成代码前注入那套决策逻辑。至于具体怎么注入的……说实话,这块我也没完全搞懂,Node.js 的钩子系统比我想象的深。有懂的大佬欢迎指正。

Codex 也差不多:

codex plugin marketplace add DietrichGebert/ponytail
codex

然后打开插件面板,找到 Ponytail 安装就行。

装完之后默认就是跑起来的,每次 AI 会话都会自动激活。

如果你用 Cursor 或者 Windsurf,更简单——把仓库里对应目录的规则文件拷到你的项目根目录就行。

有个好玩的:它还有个 /ponytail ultra 模式。

项目文档原话是——"当代码库对你造成严重伤害时使用"。笑死,装完了还能复仇。

数字不会骗人

我前面说了 80-94% 更少代码,47-77% 更便宜,3-6 倍更快。

这些数字不是拍脑袋编的。

项目里有个完整的 benchmark 目录,你可以在本地用 npx promptfoo eval -c benchmarks/promptfooconfig.yaml 自己跑一遍。

他们测了五个日常任务(邮箱校验、防抖函数、CSV 求和、倒计时器、限流器),三个模型(Haiku、Sonnet、Opus),三个对照组(无技能、caveman 技能、ponytail)。每个组合跑 10 轮取中位数。

每一轮,ponytail 代码量都是最少的。每一轮,ponytail 都是最快的。每一轮,ponytail 都是最便宜的。

每一条 ponytail 省掉的代码,都在文件里用 ponytail: 注释标明了"如果将来需要完整实现该怎么做"。它懒,但不赖。

说到让 AI Agent 更高效地写代码,最近其实一堆项目在干类似的事。

caveman(同样出自这个生态)—— 它走的是另一个极端,"像个原始人一样思考",让 Agent 用最简单粗暴的方式完成任务。ponytail 更偏"资深工程师的偷懒哲学",caveman 则像"刚学会敲键盘的实习生,只知道最基础的方法"。

Headroom(29.4k Star)—— 专注于 token 压缩,代码搜索从 17,765 tokens 压缩到 1,408 tokens,压缩率 92%。如果你想同时省代码又省 token,可以把 ponytail 和 headroom 组合着用。

repo-slopscore —— 这个更有意思,它能检测你代码仓库里哪些 commit 是 AI 写的。装完 ponytail 之后跑一下 repo-slopscore,看看你的 AI 有没有变"懒"——没变的话说明装错了。

项目地址: https://github.com/DietrichGebert/ponytail

说实话,写这篇文章的时候我一直在想一件事。

我们总在追求 AI 写更多、更快、更全——GPUs、更大的上下文窗口、更长的输出。

但可能真正有价值的,是让 AI 学会"不写什么"。

编程这么多年,我最深的体会就是:好代码不是写出来的,是删出来的。 一个功能加了 50 行,回头一看,可能 49 行都是多余的。

Ponytail 做的不是什么颠覆性的创新,它就是教会了 AI 一个所有资深工程师都知道、但没有写在任何教科书上的道理——

真正的高手,不是能写出多复杂的代码。而是知道哪些代码根本不用写。

本文使用 MGO 编辑并发布

关注"何三笔记",回复"mgo" 免费下载使用