Buzz语音识别转文字工具,一款神级软件,能自动识别歌曲或者视频里的语音内容,并将其提取转换为可编辑的文本格式,方便进行字幕添加,文字导入等操作。Buzz软件支持90多种语言,自带翻译功能,识别率高,并且自身为单文件程序,使用方便,支持官方中文。本站带来最新Buzz 0.8版本资源下载,有需要的朋友们快来体验吧!
Buzz最新版功能
导入音频和视频文件并导出文本到 TXT、SRT 和 VTT
从你计算机的麦克风转录和翻译成文本(资源密集型且可能不是实时的)
支持Whisper、 Whisper.cpp、Faster Whisper、 与Whisper 兼容的 Hugging Face 模型和OpenAI Whisper API
适用于 Mac、Windows 和 Linux
软件特点
- 导入音频和视频文件,并将转录导出为 CSV、SRT、TXT 和 VTT 格式。
- 支持通过计算机麦克风进行实时语音转录和翻译(请注意,使用 Whisper 进行音频转录可能会消耗较多的系统资源,转录的实时性取决于系统资源和所选的语言和模型大小)。
- 支持超过90种语言的音频转录,包括从 X 语言到英文文本和从 X 语言到 X 语言的转录。
- 支持 Whisper、Whisper.cpp、Faster Whisper、Whisper 兼容的 Hugging FaCE 模型以及 OpenAI Whisper API。
- 提供命令行界面。
- 可在 Mac、Windows 和 Linux 系统上使用。
软件说明
1. 下载和安装:从 Buzz 的官方网站或开源代码仓库下载适用于您操作系统的版本,并按照安装说明进行安装。
2. 配置语音输入:连接麦克风,确保系统正确识别麦克风设备。
3. 启动 Buzz:打开 Buzz 应用程序或在终端中运行 Buzz 命令。
4. 选择输入方式:根据需求选择实时语音输入或导入音频、视频文件。
5. 开始转换:根据界面提示或命令行参数设置,开始进行语音转文字操作。
6. 导出结果:转换完成后,将结果导出为文本文件、字幕文件或其他合适的格式。
操作方法
文件导入
要导入文件:
单击文件菜单上的导入媒体文件(或工具栏上的“+”图标,或 Command/Ctrl + O)。
选择音频或视频文件。
选择任务、语言和模型设置。
单击运行。
当转录状态显示“已完成”时,双击该行(或选择该行并单击“⤢”图标)以打开转录。
字段选项默认说明
导出为“TXT”、“SRT”、“VTT” “TXT”导出文件格式
Word-Level Timings Off / On Off 如果选中,转录将为音频中的每个单词生成单独的字幕行。 仅当“导出为”设置为“SRT”或“VTT”时启用。
(有关任务、语言和质量设置的更多信息,请参阅现场录制部分。)
Buzz 上的媒体文件导入
现场录音
要开始现场录制:
选择录音任务、语言、质量和麦克风。
单击记录。
注意:使用默认的 Whisper 模型转录音频会占用大量资源。 考虑使用 Whisper.cpp Tiny 模型来获得实时性能。
字段选项默认说明
任务“转录”、“翻译”、“转录”、“转录”将输入的音频转换为所选语言的文本,而“翻译”则将其转换为英文文本。
语言 有关受支持语言的完整列表,请参阅 Whisper 的文档 “检测语言” “检测语言”将尝试根据前几秒检测音频中的口头语言。 但是,建议选择一种语言(如果已知),因为在许多情况下它会提高转录质量。
质量“非常低”、“低”、“中”、“高” “非常低” 转录质量决定了用于转录的 Whisper 模型。 “Very Low”使用“tiny”模型; “Low”使用“base”模型; “中”使用“小”模型; 而“高”使用“中”模型。 更大的模型产生更高质量的转录,但需要更多的系统资源。 有关模型的更多信息,请参阅 Whisper 的文档。
麦克风 [可用系统麦克风] [默认系统麦克风] 用于录制输入音频的麦克风。