mai_ | Whisper to ChatGPT and Claude.ai
插件介绍
通过 OpenAI 的 Whisper 在 Chrome 中启用语音功能的 ChatGPT 和 Claude.ai,以实现语音转文本或使用内置转录。
这个免费开源扩展支持在 Chrome 浏览器和其他基于 Chromium 的浏览器(例如 Edge)中与 ChatGPT 和 Claude.ai 进行语音交互。它允许使用 OpenAI 开发的 AI 模型“Whisper”进行语音到文本的转录。您还可以使用浏览器内置的转录方法(webkitSpeechRecognition)。该扩展程序在访问 chat.openai.com 或 claude.ai 时出现并运行
# 程序特点
- 您可以通过对着麦克风说话来与聊天室交谈,其响应将被大声读出
- 您可以启用一个选项,大声朗读整个聊天对话,或仅大声朗读最后一条回复
- 您可以突出显示聊天线程中的文本片段并启用大声朗读该片段的功能
- 在分机配置中,您可以设置语音参数,包括聊天时使用的语言、语音、音调和朗读速度、语音转写方式
# STT 语音转录(语音转文本)
该扩展提供两种语音转录方法:
1) webkitSpeechRecognition - 使用 Chrome 浏览器 API 的默认方法。转录在本地(离线)进行。注意:此方法不添加标点符号,仅在 Chrome 浏览器中支持。
2) Whisper - OpenAI 开发的用于语音到文本转录的 AI 模型。它提供带有正确标点符号的高质量转录。需要 OpenAI API 密钥,这涉及成本(OpenAI 定价)。转录在 OpenAI 服务器上执行,这需要发送录音。
# TTS 语音合成(文本转语音)
该扩展程序利用speechSynthesis - Chrome 浏览器和其他基于 Chromium 的浏览器(例如 Edge、Opera、Brave)提供的 API。这允许在离线模式下进行语音合成 (TTS),无需数据传输。
在设置中,您可以选择用于语音合成的语言和语音,以及调整其他参数,包括音调和阅读速度。