Speech to Text (Voice Recognition)
插件介绍
适用于浏览器的易于使用的语音合成和识别工具!
语音转文本(语音识别)是一个扩展,可帮助您使用两种不同的语音识别引擎将语音转换为文本。
第一个引擎是用于音频转录的 HTML5 原生 Web 语音 API。默认情况下,它在大多数现代浏览器中处于活动状态(更多信息:https://webaudio.github.io/web-speech-api/)。第二个 API 是 Whisper AI 引擎,它使用新的人工智能方法来转录音频(更多信息:https://huggingface.co/onnx-community/whisper-base)。请注意,当您选择 Whisper AI 时,应用程序需要下载 AI 引擎的训练数据(~280MB)。因此,在应用程序加载时请耐心等待。
两种引擎都可以识别多种语言和相关方言。要使用此扩展程序,只需打开插件的用户界面,然后按大麦克风图标即可开始将语音转换为文本。请注意,首次启动该插件时,它会请求麦克风许可。请接受许可以开始使用该附加组件。所有捕获的文本都放置在界面的顶部文本区域中。要复制文本,请使用 (Ctrl + C) 键盘组合。该附加组件关闭时没有后台活动。
注意:Whisper AI 引擎一旦加载,就可以完全离线工作。此外,您可以拖放音频文件来开始转录。请注意,此功能不适用于 Web Speech API。如果您想使用音频文件进行转录,请将其分成小的音频块(大约几分钟),因为 AI 引擎在您的浏览器本地运行,并且内存和处理能力有限;因此,它无法处理大型音频文件。
如果您发现要报告的错误,请填写附加组件主页 (https://mybrowseraddon.com/speech-to-text.html) 上的错误报告表。