Whisper Mate 支持借助 Whisper 人工智能模型,将音频或视频文件批量转录为文本。通过内置的字幕编辑器,你可以逐段预览转录结果。
所有转录操作均在本地处理,你的隐私安全有保障。
功能特点:
- 对音频或视频文件进行翻译
- 支持捕获并翻译 Zoom、Skype、Teams 等其他应用中的音频(此功能需要 macOS 13.0 及以上版本,并授予屏幕录制权限)
- 利用免费的 DeepL API 翻译字幕
- 内置字幕编辑器,可用于修正翻译内容
- 支持导出为 SRT、VTT、CSV、JSON、SEGMENT 格式
- 支持为每个字幕设置说话人
- 大部分操作支持批量选择调用,例如批量执行任务、批量翻译字幕行、批量设置说话人
- 支持拖放文件以开始转录
- 支持输入文本搜索转录内容
- 编辑器可同步播放范围,预览音频或视频文件
- 可将选中字幕对应的媒体片段导出为新的媒体文件
- 支持导出带硬字幕的视频,可录制原始视频并自定义字幕样式
- 可在视频预览中直接查看字幕(字幕样式可在设置面板中自定义)
- 支持从麦克风录制音频并进行实时转录(需 macOS 13 及以上版本)
- 具备字幕合并功能,可将指定片段范围和字幕合并为一行
- 应用程序录制的音频会自动保存为文件,并可转换为新的转录项目
- 可复制字幕行并修改其内容或时间范围,以精细调整整个字幕
- 支持调整媒体文件的播放速度
- 支持使用 ⌘+V 将复制的文件粘贴到处理队列中
- 在 whisper 处理过程中显示 CPU 使用率百分比
- 支持通过上下文菜单归档项目(保持工作项目列表整洁)
- 在字幕翻译管理中支持谷歌翻译
- 可全屏预览媒体文件及字幕位置
- 支持在访达中使用“打开方式”功能打开媒体文件
- 支持多语言转换
- 支持自定义常用的转换或翻译语言
- 新增一种语音分离方法,提升说话人分离效果
- 在新的检查器面板中集成了大型语言模型(LLM)功能,并简化了配置选项
- 现在,LLM 支持翻译整个 SRT 字幕文件,或返回修订后的 SRT 版本,可直接在字幕编辑器中替换
- 视频导出现在支持将片段导出为 GIF 动画
- 优化了字幕编辑器的布局
- 在右侧检查器的底部选项卡中新增了字幕文本快速编辑功能
- 基于 GPT 的翻译和 LLM 功能现在兼容 Gemini、DeepSeek 和 OpenRouter API
- 新增批量提取字幕开始时间点的视频缩略图功能,缩略图会显示在字幕编辑器中
- 新增场景变化的关键帧检测功能,在波形编辑器上会显示标记