🗨️ 配置
Open Web UI 支持本地、浏览器和远程语音转文本功能。
云/远程语音转文本提供商
目前支持以下云语音转文本提供商。API 密钥可以配置为环境变量(OpenAI)或在管理员设置页面中配置(两种密钥)。
服务 | 需要 API 密钥 |
---|---|
OpenAI | ✅ |
DeepGram | ✅ |
WebAPI 通过内置的浏览器 STT 提供商提供语音转文本功能。
配置您的语音转文本提供商
配置语音转文本提供商
- 前往管理员设置
- 选择“音频”
- 提供 API 密钥并从下拉菜单中选择一个模型
用户级别设置
除了在管理员面板中设置的实例设置外,还有一些用户级别设置可以提供额外功能。
- STT 设置: 包含与语音转文本功能相关的设置。
- 语音转文本引擎: 确定用于语音识别的引擎(默认或 Web API)。
使用语音转文本
语音转文本提供了一种高效的通过语音“编写”提示的方式,并且在桌面和移动设备上都能稳定运行。
要使用语音转文本,只需点击麦克风图标
实时音频波形将指示语音捕获成功
语音转文本模式操作
录音开始后,您可以
- 点击勾选图标保存录音(如果启用“完成后自动发送”功能,它将发送以完成;否则您可以手动发送)
- 如果您希望中止录音(例如,您希望重新开始录音),可以点击“x”图标退出录音界面