零成本AI视频批量生成工具 V1.3版本
零成本AI视频批量生成工具 (软件还在持续更新优化中,遇到问题,请进群反馈......)电脑要求: 显卡需要英伟达12G显存,显卡驱动更新到最新版本
容易出错的地方: 解压路径不能包含中文
适合做AI 批量内容生产
软件介绍
本软件是一个本地化的 AI 视频生产工具,把“故事文本”自动转成可发布的短视频。核心流程是:
1. 输入故事文本
2. 大模型自动拆分分镜、抽取人物设定
3. ComfyUI 生成人物图与分镜图(可选再生成分镜视频)
4. TTS 生成每段配音
5. FFmpeg 自动合成成片(支持字幕、转场、BGM、封面)
6. 支持批量任务一键自动跑全流程
———
软件使用教程
软件已经集成comfyui, 点击 "启动.bat" 会自动启动 ComfyUI(默认地址 http://localhost:8188)
软件已经集成(文生图、图生视频、分镜编辑等)工作流 JSON ,用户可仔细修改这些工作流
一、首次配置(设置页)
1. 打开“设置”。
2. 在“大模型设置”填写:API Key、Base URL、Model。
3. 在“ComfyUI设置”选择工作流文件并填节点 ID(已经设置好,无需修改)
4. 在“视频合成”设置字幕、分辨率、转场、BGM。
5. 在“音色设置”导入参考音频并选择默认音色。
6. 点击“保存设置”。
三、单项目标准流程
1. 故事输入:填标题和正文,点“生成分镜脚本”。
2. 人物图片:点“批量生成全部”。
3. 分镜图片:点“批量生成全部”。
4. 分镜视频:需要视频素材时再生成(可选)。
5. 分镜音频:点“批量生成全部”。
6. 视频合成:检查场景状态为可用后点“开始合成”。
7. 完成后在输出目录查看 final_composed_*.mp4。
四、两种合成模式怎么选
1. 视频模式:使用“分镜视频 + 音频”合成,动态效果更强,但慢。
2. 图片模式:使用“分镜图片 + 音频”合成,速度快,适合批量。
五、批量任务使用
1. 打开“一键全自动批量处理”。
2. 添加多个故事(手动或从 txt 导入)。
3. 勾选执行步骤(人物图/分镜图/分镜视频/音频/合成)。
4. 选择模式:
- 按步骤批量:效率高,推荐。
- 按任务顺序:更快看到单条完整结果。
5. 选中任务后点“处理选中”。
六、常见问题
1. 软件解压路径不要包含中文, 更新显卡到最新驱动
2. 软件运行窗口提示 OMM, 一般是显存不足, 电脑配置太多, 软件最低需要12G显存
3. 合成按钮灰色:说明素材不齐(缺图片/视频/音频)。
3. 字幕不理想:去“视频合成设置”调整字号、每行字数、底部边距。
AI视频批量生成工具工具下载链接
链接:https://pan.quark.cn/s/fdb19a7c8663
models模型文件夹放到video_maker_V1.3\ComfyUI 文件夹下
祝大大新年快乐,万事如意发大财!
大大可真是一个劳模,佩服佩服!
问大大一个问题:显卡需要英伟达12G显存,如果是3080显卡20G的那种魔改的,可以不?如果可以,我现在直接买一个!!! 刚才看了一下大大哔站里的视频演示,都挺好的。
想提个小小的意见,就是在图片合成视频的时候,能不能逐渐放大,或者是慢慢向左移动或者是向右移,做一下动态的效果。如果能做到,就更完美了。
还有一个小小的建议,就是在生成情感类型的时候看到的,音频选择的人声挺好的,但句子和句子之间的间隔时间比较长,能不能在代码里写一个音频与音频之间的间隔缩进,让间隔时间变得短一些。这也算是去气口的方式吧。
我做剪辑也有七年了,所以,我个人只提供剪辑上的建议,别误会啊,不是挑刺。是真心希望大大的辛苦能不白费!!!
最后祝大大新年快乐,马年吉祥,岁岁平安,过个半年就能财富过亿,哈哈! 谢谢,支持更新!
页:
[1]