导航菜单

Speech to Text (Voice Recognition) LOGO 图标

Speech to Text (Voice Recognition)

0.1.7
2025-11-27
54
3.4

插件介绍

适用于浏览器的易于使用的语音合成和识别工具!

语音转文本(语音识别)是一个扩展,可帮助您使用两种不同的语音识别引擎将语音转换为文本。

第一个引擎是用于音频转录的 HTML5 原生 Web 语音 API。默认情况下,它在大多数现代浏览器中处于活动状态(更多信息:https://webaudio.github.io/web-speech-api/)。第二个 API 是 Whisper AI 引擎,它使用新的人工智能方法来转录音频(更多信息:https://huggingface.co/onnx-community/whisper-base)。请注意,当您选择 Whisper AI 时,应用程序需要下载 AI 引擎的训练数据(~280MB)。因此,在应用程序加载时请耐心等待。

两种引擎都可以识别多种语言和相关方言。要使用此扩展程序,只需打开插件的用户界面,然后按大麦克风图标即可开始将语音转换为文本。请注意,首次启动该插件时,它会请求麦克风许可。请接受许可以开始使用该附加组件。所有捕获的文本都放置在界面的顶部文本区域中。要复制文本,请使用 (Ctrl + C) 键盘组合。该附加组件关闭时没有后台活动。

注意:Whisper AI 引擎一旦加载,就可以完全离线工作。此外,您可以拖放音频文件来开始转录。请注意,此功能不适用于 Web Speech API。如果您想使用音频文件进行转录,请将其分成小的音频块(大约几分钟),因为 AI 引擎在您的浏览器本地运行,并且内存和处理能力有限;因此,它无法处理大型音频文件。

如果您发现要报告的错误,请填写附加组件主页 (https://mybrowseraddon.com/speech-to-text.html) 上的错误报告表。


插件详情

评分
3.4星(共5星),共119位用户参与评分
使用人数
300,000+ 位用户
版本
0.1.7
文件大小
5.29MB
提供方
支持语言
英语
ID
kcgloaobfaiejoiahlhnfaolfcifjjho
发布时间
2022-01-09 12:46:29
1 / 5