一键字幕生成+字幕翻译+创建配音+合成 = 带字幕和配音的新视频
安装方法
如果是 Windows10/11 系统,直接在本页下载压缩包,解压到无空格无中文的路径下,双击 sp.exe 即可使用(必须先解压再使用,不可直接压缩包中双击sp.exe)。
v2.94 完整包下载3.6G(含tiny/medium模型)
v2.95 补丁包360MB(如果已安装过2.x版本,可下载补丁包后解压在sp.exe所在目录,覆盖已有sp.exe和文件夹)
简单易用
我们的目标是为用户提供一个操作简便/解压即用的视频翻译工具,尤其适合技术小白或对技术了解有限的用户。为此,软件在功能实现上尽量简化,比如,虽然 Whisperx 在语音识别和角色区分方面更强,但由于其安装复杂且容易出错,我们选择了更容易使用的方案,确保用户能够轻松上手。
功能多样
除了支持多语言间的视频翻译,软件还集成了语音转录、文字配音和字幕翻译等功能。对于只需要语音转录或配音的用户,也可以单独使用这些功能,无需完整翻译视频,避免了额外下载其他软件的麻烦。
跨平台支持
软件支持多平台,Windows 用户可以直接下载解压使用,而 MacOS 和 Linux 用户可以通过一键安装源码方便快捷地启动。
丰富的第三方接口支持
视频翻译分为语音识别、字幕翻译、文字配音三个阶段,软件在每个阶段都支持多种第三方接口。
例如,语音识别阶段可以选择使用 faster-whisper 或 openai-whisper,也可以选择在线 API 接口或自建的语音识别服务;
字幕翻译阶段支持 Google 翻译、ChatGPT、或本地大模型等方式。
配音阶段也同样灵活,用户可以选择默认的 edgetts 配音,或集成其他 API,例如 OpenAI、ElevenLabs、Azure 等。
每个阶段可支持使用自己的api接口,如果你有自己开发的api服务的话。
高度自定义
软件提供几十项自定义选项,用户可以根据需求调整翻译渠道、配音方式、语音识别引擎、音调、语速、字幕样式(字体、颜色、大小)、视频输出质量等。支持对翻译和配音任务的并发量控制,实现高度个性化的翻译体验。
支持完全离线使用
如果你需要离线处理,软件支持完全本地运行,语音识别可以使用 faster-whisper 或 openai-whisper,配音可以通过 Clone-voice 或 GPT-SoVITS 等工具,无需联网即可完成所有操作。
免费与商业 API 灵活结合
软件默认提供完全免费的方案,所有核心功能均不需要任何费用。语音识别、翻译和配音均有免费选项,如 faster-whisper 和 Edge-TTS。而对于有更高需求的用户,软件同样支持三方商业 API,例如 ChatGPT、Azure 以及其他高级语音合成服务,提供更高质量的翻译和配音。
API 集成支持
软件提供便捷的 API 调用功能,方便开发者将其集成到其他工具或流程中使用。