SmartSub(妙幕)v2.7.0 是一款跨平台智能工具,支持批量为 MP4、AVI 等多种音视频格式生成字幕,还能对字幕进行多语言翻译,本地化处理保护隐私且处理速度更快,轻松满足日常学习、办公的字幕制作需求。
![图片[1]-SmartSub v2.7.0:智能音视频字幕生成工具 - 搜源站-搜源站](https://www.souyuanzhan.com/wp-content/uploads/cca3034d8920251205225202-1024x646.webp)

核心特性
作为升级自 VideoSubtitleGenerator 的工具,SmartSub 在保留原有优势的基础上,新增多项实用功能,体验更出色:
- 多格式兼容:支持 MP4、AVI、MKV、MOV 等视频格式,以及 MP3、WAV 音频格式,覆盖主流媒体文件类型。
- 字幕全能处理:可实现 “生成 + 翻译”“仅生成”“仅翻译” 三种任务模式,无论是从零制作字幕,还是翻译已有字幕文件都能胜任。
- 本地化隐私保护:无需上传音视频文件,本地完成处理,既保护隐私安全,又大幅提升处理速度。
- 多翻译服务集成:支持百度翻译、火山引擎翻译、DeepLX、Ollama 本地模型、DeepSeek、OpenAI 风格 API 等多种服务,满足不同翻译需求(注:DeepLX 批量翻译可能限流)。
- 硬件加速支持:适配 NVIDIA CUDA(Windows/Linux)和 Apple Core ML(macOS M 系列芯片),提升处理效率。
- 灵活自定义:可自定义字幕文件名、翻译结果格式(纯翻译 / 原字幕 + 翻译),支持自定义并发任务数量,兼容不同播放器。
使用指南
普通用户使用步骤
- 下载安装:根据自身系统、芯片及显卡情况,选择对应安装包(通用版或优化版),安装后启动程序。
- 模型配置:通过应用内 “模型管理” 下载所需模型,若下载困难可手动从国内镜像源或 Hugging Face 官方源获取,再导入应用。
- 任务设置:配置翻译服务(需对应 API 密钥),选择任务类型、源语言、目标语言及模型,上传音视频或字幕文件。
- 启动处理:确认参数设置后开始任务,等待完成即可获取生成或翻译后的字幕文件。
开发用户使用步骤
- 克隆项目:执行
git clone https://github.com/buxuku/SmartSub.git将项目克隆到本地。 - 安装依赖:进入项目目录,执行
yarn install或npm install安装依赖包;Windows 或 Mac Intel 平台需手动下载对应 node 文件并覆盖指定目录。 - 启动项目:依赖安装完成后,执行
yarn dev或npm run dev启动项目。 - 模型导入:参考普通用户模型导入方式,完成所需模型的配置。
关键配置说明
模型选择建议
- 低端设备 / 显卡:推荐
tiny或base系列模型,兼顾速度与基础精度,占用显存小。 - 普通电脑:建议选择
small或base系列,平衡精度与资源消耗。 - 高性能显卡 / 工作站:优先
large系列模型,字幕生成准确性更高。 - 英文音视频:推荐带
en的模型,专为英语优化,减少多语言干扰。 - 关注模型体积:可选择
q5或q8量化系列模型,牺牲少量精度换取更小体积。
翻译服务配置
使用百度翻译、火山引擎翻译等服务需提前申请 API 密钥,申请方法可参考相关第三方软件提供的指引;AI 翻译结果受模型和提示词影响,推荐尝试 DeerAPI 聚合平台,支持近 500 种模型,适配性更强。
硬件加速要求
- CUDA 支持:需电脑支持 CUDA 且安装对应版本 toolkit(11.8.0/12.2.0/12.4.1),优化版安装包兼容性更优。
- Core ML 支持:macOS M 系列芯片用户需下载 mac-arm64 版本,将自动启用 Core ML 加速语音识别。
© 版权声明
THE END
















暂无评论内容