Agent Builder & Maker

Build with AI,
Ship for Real

用 Agent 解决真实场景的问题
从想法到产品,从实践到开源

SCROLL

我在做的事

🎬

TTS Video Generator

Open Source Python ElevenLabs FFmpeg

自动生成带 AI 配音和同步字幕的短视频工具。输入文案,输出成品视频——从 TTS 到字幕到合成,全流程 Agent 化。

13 stars 📄 MIT License

吉光片羽

Node.js 飞书 Bot Übersicht

个人 Agent 操作系统。云端 API + 飞书 Bot + 桌面 Widget + 每日推送,用 AI 管理待办、记录灵感、生成周报,日常工作的 AI 协作中枢。

🔄 Daily active
🌏

AI 出海应用

产品 出海 AI

AI 驱动的出海产品,从产品设计到增长,全程用 Agent 辅助决策和执行。正在打磨中。

🚀 In production
🎤

Agent 实践分享

即刻 小红书 分享

在即刻和小红书持续分享 Agent 日常实践心得、开发经验和产品思考。用 Agent 做关于 Agent 的内容。

📝 持续更新中

关于我

我是 Zhimin,ex VC,连续创业者,曾创办百万日活产品。

现在 all-in AI Agent。不只是在「用」AI,而是在和 AI 一起构建。从个人效率系统到产品运营,从视频生成到内容创作,每一个场景都在尝试让 Agent 真正参与进来。

我的方法论很简单:从自身需求出发,做出来、用起来、讲出去、开源出去。不追求技术炫技,追求真实场景里跑通的价值。

What I Do

  • Agent 开发与开源
  • AI 产品设计与运营
  • 内容创作自动化
  • 个人效率系统构建
  • 实践经验分享
🎬

TTS Video Generator

一个 Python 工具,自动生成带 AI 配音和同步字幕的短视频。适用于制作知识科普、社交媒体视频和旁白式幻灯片。

13 Stars
🍴 0 Forks
📄 MIT License
🐍 Python
📖 README.md

TTS Video Generator

一个 Python 工具,自动生成带 AI 配音和同步字幕的短视频。适用于制作知识科普、社交媒体视频(TikTok / 抖音 / Reels / Shorts)和旁白式幻灯片。

工作流程

Word 文档 (.docx) → 文本提取 → ElevenLabs TTS(带时间戳) ↓ ↓ 每期标题 音频 + 字符级时间戳 ↓ ↓ 背景图片 + ASS 字幕 + BGM → FFmpeg → 最终 MP4 视频

功能特点

  • AI 语音合成:使用 ElevenLabs API,支持多种语言的自然语音
  • 精准字幕:字符级时间戳确保字幕完美同步
  • 智能换行:自动在标点处断行,符合排版规则
  • 背景音乐:随机选择 BGM,可配置混音音量
  • 批量处理:支持单期生成或批量生成
  • 缓存机制:音频和时间戳数据会缓存,避免重复调用 API
  • 全面可配:所有设置通过 .env 配置

环境要求

  • Python 3.9+
  • FFmpeg(需支持 libass 字幕渲染)
  • ElevenLabs API Key

快速开始

# 1. 克隆仓库
git clone https://github.com/minnayu14/tts-video-generator.git
cd tts-video-generator

# 2. 安装依赖
pip install -r requirements.txt

# 3. 配置
cp .env.example .env
# 编辑 .env,填入你的 ElevenLabs API Key 和 Voice ID

# 4. 准备内容
# - 创建 Word 文档(scripts.docx),按格式写入脚本
# - 将背景图片放入 backgrounds/ 目录
# - (可选)将 BGM 音频放入 bgm/ 目录

# 5. 生成视频
python video_generate.py --single 1    # 生成单期
python video_generate.py --batch 10    # 批量生成
python video_generate.py               # 生成全部

Word 文档格式

.docx 中每期的格式:

1 这里是标题
【Text】正文内容。第二句。第三句。

2 另一期标题
【Text】更多正文内容。更多句子。
  • 标题行:以期号开头,后接标题文字
  • 正文行:包含文本标签(默认 【Text】),后面是正文
  • 可通过 .env 中的 TEXT_TAG 自定义标签

常用命令

命令说明
python video_generate.py生成所有未完成的期数
python video_generate.py --single 1只生成第 1 期
python video_generate.py --batch 10批量生成最多 10 期