开源推荐

其他

输入1个主题，5步全自动出片！这个GitHub开源项目有点猛

发表于 2026年04月04日阅读 6 评论 0

cover

大家好，我是何三，独立开发者。

短视频时代的风口还在，但做视频这件事，劝退了不少人。

写文案、找素材、配音、加字幕、调BGM……一套流程下来，一两天没了。如果只是为了做个知识类口播视频，这种"手工活"投入产出比真的不高。

最近在 GitHub 上刷到一个开源项目——MoneyPrinterTurbo，基本把上面这套流程全自动化了。你只需要给它一个主题或者几个关键词，它就能从零开始，帮你输出一个完整的短视频。

而且不是那种粗制滥造的产物，是带高清素材、配音、字幕、背景音乐、完整合成的成品。

MoneyPrinterTurbo

它能干什么

MoneyPrinterTurbo 的定位很直接：全自动短视频生成器。

核心流程就五步——

flow

第一步：输入主题

你只需要提供一个视频主题，比如"为什么应该坚持运动"、"AI会取代程序员吗"之类的，甚至可以只用几个关键词。项目会根据你选的模型（后面说支持哪些）自动生成完整的视频文案。

当然，如果你已经有文案了，也可以直接粘贴进去，跳过AI生成这步。

第二步：AI 生成文案

内置了完整的提示词模板，会根据你输入的主题，自动生成适合短视频节奏的文案内容。支持中文和英文。

第三步：匹配视频素材

这一步比较关键。项目接入了 Pexels 的图库接口，搜索到的素材都是高清、无版权的。当然，你也可以用自己本地准备的视频素材。

支持两种尺寸——竖屏 9:16（1080×1920）和横屏 16:9（1920×1080），抖音、B站、YouTube 都能覆盖。

第四步：语音合成 + 字幕

配音这块提供了多种方案，还支持实时试听。字幕生成有两种模式——edge 模式速度快但对电脑没要求，whisper 模式质量更稳定但需要下载一个约 3GB 的模型。

字幕的字体、位置、颜色、大小都能调，还支持描边效果。

第五步：自动合成

最后把所有元素——视频素材、配音、字幕、背景音乐——合成一个完整的高清短视频。

而且它还支持批量生成，一次出好几个版本，挑最满意的用。

竖屏 9:16

横屏 16:9g

支持哪些 AI 模型

models

模型选择这块挺友好的，尤其对国内用户。

项目支持了十多种大模型接入，包括 OpenAI、DeepSeek、Moonshot（Kimi）、通义千问、文心一言、Google Gemini、Ollama（本地模型）、Azure、MiniMax、Pollinations（免费）、one-api、ModelScope 等。

如果你在国内，项目作者建议优先用 DeepSeek 或 Moonshot。这两个不用梯子就能直接访问，注册就送额度，个人用基本够。

不过有一点要提前说清楚：不管你用哪个模型，都需要先去对应的平台申请 API Key。项目本身不自带大模型能力，它只是一个"编排器"，把各个环节串起来。

部署和使用

deploy

部署方式给了四种选择：

最省心的——Windows 一键启动包

直接下载解压，双击 start.bat 就能跑。百度网盘和 Google Drive 都有下载链接。作者建议下载后先执行 update.bat 更新到最新代码。

最干净的——Docker 部署

git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
docker-compose up

启动后浏览器访问 http://0.0.0.0:8501 就能打开 Web 界面了。适合有一定技术基础、想要环境隔离的用户。

最灵活的——手动部署

MacOS 和 Linux 用户推荐这种方式。项目推荐用 uv 管理 Python 环境：

git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
uv python install 3.11
uv sync --frozen

然后还需要装两个东西：ImageMagick（处理字幕渲染）和 ffmpeg（视频合成）。这两个都有报错风险，但项目 README 里把常见问题都列出来了，照着排查就行。

最懒的——Google Colab

连环境都不用配，打开项目提供的 Colab 链接直接在线跑。

启动成功后，项目提供了两种使用方式：

Web 界面：Streamlit 写的，操作很直观，适合大多数人
API 接口：FastAPI 提供，可以在自己的程序里集成调用

配置上需要注意的坑

有几个点提前说一下，免得踩坑：

Pexels API Key 是必须的。去 pexels.com 免费注册就能拿到，用来搜索视频素材。没有这个 Key，视频素材那一步就过不去。

路径别用中文。不管是项目解压路径、ImageMagick 安装路径，都别出现中文或特殊字符，不然会报一些很难排查的错。

网络问题。虽然 DeepSeek 和 Moonshot 国内直连，但 Pexels 的素材下载、某些依赖的安装还是需要正常的网络环境。如果你用 VPN，记得开全局模式。

字幕模型。如果你选了 whisper 模式生成字幕，需要下载约 3GB 的模型文件。国内 HuggingFace 访问不了，项目提供了百度网盘和夸克网盘的镜像下载。

适合什么人用

说实话，这个项目不会替代专业的视频创作者。自动生成的视频，在创意、节奏把控上，跟人手工精心制作的还是有差距。

但它在一些场景下特别实用：

知识类/口播类短视频：批量生产内容，测试不同选题的效果
自媒体矩阵运营：一个人管多个账号，用这个工具提高产出效率
快速出demo：验证某个视频选题有没有价值，不值得花太多时间制作
不会剪辑的小白：完全不懂视频剪辑，又想尝试做短视频

项目 GitHub 地址：https://github.com/harry0703/MoneyPrinterTurbo

其实类似的 AI 视频生成工具不少，但很多要么是付费的 SaaS 服务，要么功能阉割严重。MoneyPrinterTurbo 最大的优势就是开源免费 + 功能完整，从文案到合成全链路打通，而且支持批量生成。

对于想用 AI 提高内容产出效率的独立开发者来说，这个项目值得放进工具箱。

本文使用 MGO 编辑并发布

关注"何三笔记"，回复"mgo" 免费下载使用

版权声明：如无特殊说明，文章均为何三笔记原创，转载请注明出处

本文链接：https://www.h3blog.com/article/751/

它能干什么
支持哪些 AI 模型
部署和使用
配置上需要注意的坑
适合什么人用