SmartSub v2.7.0:智能音视频字幕生成工具

SmartSub(妙幕)v2.7.0 是一款跨平台智能工具,支持批量为 MP4、AVI 等多种音视频格式生成字幕,还能对字幕进行多语言翻译,本地化处理保护隐私且处理速度更快,轻松满足日常学习、办公的字幕制作需求。

图片[1]-SmartSub v2.7.0:智能音视频字幕生成工具 - 搜源站-搜源站


核心特性

作为升级自 VideoSubtitleGenerator 的工具,SmartSub 在保留原有优势的基础上,新增多项实用功能,体验更出色:

  • 多格式兼容:支持 MP4、AVI、MKV、MOV 等视频格式,以及 MP3、WAV 音频格式,覆盖主流媒体文件类型。
  • 字幕全能处理:可实现 “生成 + 翻译”“仅生成”“仅翻译” 三种任务模式,无论是从零制作字幕,还是翻译已有字幕文件都能胜任。
  • 本地化隐私保护:无需上传音视频文件,本地完成处理,既保护隐私安全,又大幅提升处理速度。
  • 多翻译服务集成:支持百度翻译、火山引擎翻译、DeepLX、Ollama 本地模型、DeepSeek、OpenAI 风格 API 等多种服务,满足不同翻译需求(注:DeepLX 批量翻译可能限流)。
  • 硬件加速支持:适配 NVIDIA CUDA(Windows/Linux)和 Apple Core ML(macOS M 系列芯片),提升处理效率。
  • 灵活自定义:可自定义字幕文件名、翻译结果格式(纯翻译 / 原字幕 + 翻译),支持自定义并发任务数量,兼容不同播放器。

使用指南

普通用户使用步骤

  1. 下载安装:根据自身系统、芯片及显卡情况,选择对应安装包(通用版或优化版),安装后启动程序。
  2. 模型配置:通过应用内 “模型管理” 下载所需模型,若下载困难可手动从国内镜像源或 Hugging Face 官方源获取,再导入应用。
  3. 任务设置:配置翻译服务(需对应 API 密钥),选择任务类型、源语言、目标语言及模型,上传音视频或字幕文件。
  4. 启动处理:确认参数设置后开始任务,等待完成即可获取生成或翻译后的字幕文件。

开发用户使用步骤

  1. 克隆项目:执行git clone https://github.com/buxuku/SmartSub.git将项目克隆到本地。
  2. 安装依赖:进入项目目录,执行yarn installnpm install安装依赖包;Windows 或 Mac Intel 平台需手动下载对应 node 文件并覆盖指定目录。
  3. 启动项目:依赖安装完成后,执行yarn devnpm run dev启动项目。
  4. 模型导入:参考普通用户模型导入方式,完成所需模型的配置。

关键配置说明

模型选择建议

  • 低端设备 / 显卡:推荐tinybase系列模型,兼顾速度与基础精度,占用显存小。
  • 普通电脑:建议选择smallbase系列,平衡精度与资源消耗。
  • 高性能显卡 / 工作站:优先large系列模型,字幕生成准确性更高。
  • 英文音视频:推荐带en的模型,专为英语优化,减少多语言干扰。
  • 关注模型体积:可选择q5q8量化系列模型,牺牲少量精度换取更小体积。

翻译服务配置

使用百度翻译、火山引擎翻译等服务需提前申请 API 密钥,申请方法可参考相关第三方软件提供的指引;AI 翻译结果受模型和提示词影响,推荐尝试 DeerAPI 聚合平台,支持近 500 种模型,适配性更强。

硬件加速要求

  • CUDA 支持:需电脑支持 CUDA 且安装对应版本 toolkit(11.8.0/12.2.0/12.4.1),优化版安装包兼容性更优。
  • Core ML 支持:macOS M 系列芯片用户需下载 mac-arm64 版本,将自动启用 Core ML 加速语音识别。

THE END
喜欢就支持一下吧
点赞923 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容