大家好,我是何三,独立开发者
你有没有被 AI 气笑过?
我最近做个日期选择器,跟 Claude 说"加个日期选择",好家伙,它给我装了 flatpickr、写了一个 wrapper 组件、加了个 stylesheet,然后开始问我"时区怎么处理"。
我就想选个生日,不是要发射火箭。
5 天前,GitHub 上冒出来一个项目,叫 ponytail,现在已经 21.9k Star(约 2.2 万)。
它干的事情简单到离谱——让 AI Agent 像公司里最懒的那个资深工程师一样写代码:什么都不说,写一行,就跑通了。
80-94% 更少的代码,3-6 倍更快,47-77% 更便宜。 这是他们跑了 10 轮基准测试得出的中位数,支持 Haiku、Sonnet、Opus 三个模型。
说实话,第一次看到这个数据我没啥感觉。直到我亲手装了一遍。
装完以后,同样的需求,AI 给我的代码从 50 行变成了 1 行。
那行代码是这样:
<!-- ponytail: 浏览器自带这功能 -->
<input type="date">
对,就这。
那一刻我对着屏幕笑了大概半分钟。
我以前写的那些 datepicker 组件,十几层 div、各种 polyfill、时区适配……浏览器它自己就有啊。
这就是 ponytail 的厉害之处——它不是什么黑科技,它只是让 AI 在写代码之前,先停下来想六个问题。
这六个问题,治好了我的代码内耗
ponytail 的核心是一套 6 步决策梯,AI 每次写代码前按顺序走一遍,停在第一个满足的台阶上:
1. 这东西真的需要存在吗? → 不需要就跳过(YAGNI原则)
2. 标准库能搞定? → 直接用
3. 浏览器/平台自带功能? → 直接用
4. 已经安装的依赖能用? → 复用
5. 一行代码能搞定? → 一行搞定
6. 以上都不行,才写最少能做工作的代码
说白了,以前 AI 写代码的思路是"能加的功能全加上",而 ponytail 教的思路是"能删的东西全删掉"。
这让我想起一个事儿。
我之前实习的时候带我的 senior,老头儿,扎个马尾辫,戴个圆框眼镜,在公司待的时间比版本控制软件还长。我写了五十行代码拿过去给他看,他看了一眼,一句话没说,删了四十九行,留下一行。
然后走了。
我当时心里那个复杂啊——又觉得丢人,又觉得牛逼。
ponytail 就是把这种思维塞进了 AI Agent 的脑子里。
哦对了,这项目的名字 "ponytail" 就是这么来的。项目作者自己说的:"你知道为什么叫这个。"
怎么装?比你想象的简单
好,说到安装,这可能是你花在 ponytail 上最大的精力了。
它支持 13 种 AI Agent:Claude Code、Codex、Copilot CLI、Cursor、Windsurf、Cline、Aider、Gemini CLI、Kiro……基本上你知道的它全支持。
拿 Claude Code 来说:
/plugin marketplace add DietrichGebert/ponytail
/plugin install ponytail@ponytail
两句命令,装完即用。
原理大概是这样——它用两个极其轻量的 Node.js 生命周期钩子,在 Agent 每次生成代码前注入那套决策逻辑。至于具体怎么注入的……说实话,这块我也没完全搞懂,Node.js 的钩子系统比我想象的深。有懂的大佬欢迎指正。
Codex 也差不多:
codex plugin marketplace add DietrichGebert/ponytail
codex
然后打开插件面板,找到 Ponytail 安装就行。
装完之后默认就是跑起来的,每次 AI 会话都会自动激活。
如果你用 Cursor 或者 Windsurf,更简单——把仓库里对应目录的规则文件拷到你的项目根目录就行。
有个好玩的:它还有个 /ponytail ultra 模式。
项目文档原话是——"当代码库对你造成严重伤害时使用"。笑死,装完了还能复仇。
数字不会骗人
我前面说了 80-94% 更少代码,47-77% 更便宜,3-6 倍更快。
这些数字不是拍脑袋编的。
项目里有个完整的 benchmark 目录,你可以在本地用 npx promptfoo eval -c benchmarks/promptfooconfig.yaml 自己跑一遍。
他们测了五个日常任务(邮箱校验、防抖函数、CSV 求和、倒计时器、限流器),三个模型(Haiku、Sonnet、Opus),三个对照组(无技能、caveman 技能、ponytail)。每个组合跑 10 轮取中位数。
每一轮,ponytail 代码量都是最少的。每一轮,ponytail 都是最快的。每一轮,ponytail 都是最便宜的。
每一条 ponytail 省掉的代码,都在文件里用 ponytail: 注释标明了"如果将来需要完整实现该怎么做"。它懒,但不赖。
说到让 AI Agent 更高效地写代码,最近其实一堆项目在干类似的事。
caveman(同样出自这个生态)—— 它走的是另一个极端,"像个原始人一样思考",让 Agent 用最简单粗暴的方式完成任务。ponytail 更偏"资深工程师的偷懒哲学",caveman 则像"刚学会敲键盘的实习生,只知道最基础的方法"。
Headroom(29.4k Star)—— 专注于 token 压缩,代码搜索从 17,765 tokens 压缩到 1,408 tokens,压缩率 92%。如果你想同时省代码又省 token,可以把 ponytail 和 headroom 组合着用。
repo-slopscore —— 这个更有意思,它能检测你代码仓库里哪些 commit 是 AI 写的。装完 ponytail 之后跑一下 repo-slopscore,看看你的 AI 有没有变"懒"——没变的话说明装错了。
项目地址: https://github.com/DietrichGebert/ponytail
说实话,写这篇文章的时候我一直在想一件事。
我们总在追求 AI 写更多、更快、更全——GPUs、更大的上下文窗口、更长的输出。
但可能真正有价值的,是让 AI 学会"不写什么"。
编程这么多年,我最深的体会就是:好代码不是写出来的,是删出来的。 一个功能加了 50 行,回头一看,可能 49 行都是多余的。
Ponytail 做的不是什么颠覆性的创新,它就是教会了 AI 一个所有资深工程师都知道、但没有写在任何教科书上的道理——
真正的高手,不是能写出多复杂的代码。而是知道哪些代码根本不用写。
本文使用 MGO 编辑并发布
关注"何三笔记",回复"mgo" 免费下载使用