
大家好,我是何三,独立开发者。
短视频时代的风口还在,但做视频这件事,劝退了不少人。
写文案、找素材、配音、加字幕、调BGM……一套流程下来,一两天没了。如果只是为了做个知识类口播视频,这种"手工活"投入产出比真的不高。
最近在 GitHub 上刷到一个开源项目——MoneyPrinterTurbo,基本把上面这套流程全自动化了。你只需要给它一个主题或者几个关键词,它就能从零开始,帮你输出一个完整的短视频。
而且不是那种粗制滥造的产物,是带高清素材、配音、字幕、背景音乐、完整合成的成品。

它能干什么
MoneyPrinterTurbo 的定位很直接:全自动短视频生成器。
核心流程就五步——

第一步:输入主题
你只需要提供一个视频主题,比如"为什么应该坚持运动"、"AI会取代程序员吗"之类的,甚至可以只用几个关键词。项目会根据你选的模型(后面说支持哪些)自动生成完整的视频文案。
当然,如果你已经有文案了,也可以直接粘贴进去,跳过AI生成这步。
第二步:AI 生成文案
内置了完整的提示词模板,会根据你输入的主题,自动生成适合短视频节奏的文案内容。支持中文和英文。
第三步:匹配视频素材
这一步比较关键。项目接入了 Pexels 的图库接口,搜索到的素材都是高清、无版权的。当然,你也可以用自己本地准备的视频素材。
支持两种尺寸——竖屏 9:16(1080×1920)和横屏 16:9(1920×1080),抖音、B站、YouTube 都能覆盖。
第四步:语音合成 + 字幕
配音这块提供了多种方案,还支持实时试听。字幕生成有两种模式——edge 模式速度快但对电脑没要求,whisper 模式质量更稳定但需要下载一个约 3GB 的模型。
字幕的字体、位置、颜色、大小都能调,还支持描边效果。
第五步:自动合成
最后把所有元素——视频素材、配音、字幕、背景音乐——合成一个完整的高清短视频。
而且它还支持批量生成,一次出好几个版本,挑最满意的用。


支持哪些 AI 模型

模型选择这块挺友好的,尤其对国内用户。
项目支持了十多种大模型接入,包括 OpenAI、DeepSeek、Moonshot(Kimi)、通义千问、文心一言、Google Gemini、Ollama(本地模型)、Azure、MiniMax、Pollinations(免费)、one-api、ModelScope 等。
如果你在国内,项目作者建议优先用 DeepSeek 或 Moonshot。这两个不用梯子就能直接访问,注册就送额度,个人用基本够。
不过有一点要提前说清楚:不管你用哪个模型,都需要先去对应的平台申请 API Key。项目本身不自带大模型能力,它只是一个"编排器",把各个环节串起来。
部署和使用

部署方式给了四种选择:
最省心的——Windows 一键启动包
直接下载解压,双击 start.bat 就能跑。百度网盘和 Google Drive 都有下载链接。作者建议下载后先执行 update.bat 更新到最新代码。
最干净的——Docker 部署
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
docker-compose up
启动后浏览器访问 http://0.0.0.0:8501 就能打开 Web 界面了。适合有一定技术基础、想要环境隔离的用户。
最灵活的——手动部署
MacOS 和 Linux 用户推荐这种方式。项目推荐用 uv 管理 Python 环境:
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
uv python install 3.11
uv sync --frozen
然后还需要装两个东西:ImageMagick(处理字幕渲染)和 ffmpeg(视频合成)。这两个都有报错风险,但项目 README 里把常见问题都列出来了,照着排查就行。
最懒的——Google Colab
连环境都不用配,打开项目提供的 Colab 链接直接在线跑。
启动成功后,项目提供了两种使用方式:
- Web 界面:Streamlit 写的,操作很直观,适合大多数人
- API 接口:FastAPI 提供,可以在自己的程序里集成调用
配置上需要注意的坑
有几个点提前说一下,免得踩坑:
Pexels API Key 是必须的。去 pexels.com 免费注册就能拿到,用来搜索视频素材。没有这个 Key,视频素材那一步就过不去。
路径别用中文。不管是项目解压路径、ImageMagick 安装路径,都别出现中文或特殊字符,不然会报一些很难排查的错。
网络问题。虽然 DeepSeek 和 Moonshot 国内直连,但 Pexels 的素材下载、某些依赖的安装还是需要正常的网络环境。如果你用 VPN,记得开全局模式。
字幕模型。如果你选了 whisper 模式生成字幕,需要下载约 3GB 的模型文件。国内 HuggingFace 访问不了,项目提供了百度网盘和夸克网盘的镜像下载。
适合什么人用
说实话,这个项目不会替代专业的视频创作者。自动生成的视频,在创意、节奏把控上,跟人手工精心制作的还是有差距。
但它在一些场景下特别实用:
- 知识类/口播类短视频:批量生产内容,测试不同选题的效果
- 自媒体矩阵运营:一个人管多个账号,用这个工具提高产出效率
- 快速出demo:验证某个视频选题有没有价值,不值得花太多时间制作
- 不会剪辑的小白:完全不懂视频剪辑,又想尝试做短视频
项目 GitHub 地址:https://github.com/harry0703/MoneyPrinterTurbo
其实类似的 AI 视频生成工具不少,但很多要么是付费的 SaaS 服务,要么功能阉割严重。MoneyPrinterTurbo 最大的优势就是开源免费 + 功能完整,从文案到合成全链路打通,而且支持批量生成。
对于想用 AI 提高内容产出效率的独立开发者来说,这个项目值得放进工具箱。
本文使用 MGO 编辑并发布
关注"何三笔记",回复"mgo" 免费下载使用