🗨️ Kokoro Web - Open WebUI 的轻松文本转语音
警告
本教程由社区贡献,不受 Open WebUI 团队支持。它仅用于演示如何根据您的特定用例自定义 Open WebUI。想贡献?请查看贡献教程。
什么是 Kokoro Web
?
Kokoro Web 为强大的 Kokoro-82M 文本转语音模型提供了一个轻量级、与 OpenAI 兼容的 API,可与 Open WebUI 无缝集成,以自然的声音增强您的 AI 对话。
🚀 两步集成
1. 部署 Kokoro Web API(一条命令)
services:
kokoro-web:
image: ghcr.io/eduardolat/kokoro-web:latest
ports:
- "3000:3000"
environment:
# Change this to any secret key to use as your OpenAI compatible API key
- KW_SECRET_API_KEY=your-api-key
volumes:
- ./kokoro-cache:/kokoro/cache
restart: unless-stopped
运行命令:docker compose up -d
2. 连接 OpenWebUI(30 秒)
- 在 OpenWebUI 中,前往
Admin Panel
(管理面板)→Settings
(设置)→Audio
(音频) - 配置
- 文本转语音引擎:
OpenAI
- API 基本 URL:
http://localhost:3000/api/v1
(如果使用 Docker:http://host.docker.internal:3000/api/v1
) - API 密钥:
your-api-key
(来自步骤 1) - TTS 模型:
model_q8f16
(大小/质量的最佳平衡) - TTS 语音:
af_heart
(默认温暖、自然的英语语音)。您可以从 Kokoro Web Demo 中更改为任何其他语音或公式。
- 文本转语音引擎:
就是这样!您的 OpenWebUI 现在具备了 AI 语音功能。
🌍 支持的语言
Kokoro Web 支持 8 种语言,每种语言都有经过优化的特定语音。
- 英语(美国)- en-us
- 英语(英国)- en-gb
- 日语 - ja
- 中文 - cmn
- 西班牙语 - es-419
- 印地语 - hi
- 意大利语 - it
- 葡萄牙语(巴西)- pt-br
每种语言都有专用的语音,以实现最佳发音和自然流畅。请参阅 GitHub 仓库了解完整的特定语言语音列表,或使用 Kokoro Web Demo 立即预览和创建您自己的自定义语音。
💾 适用于任何硬件的优化模型
选择适合您硬件需求的模型
模型 ID | 优化 | 大小 | 理想用途 |
---|---|---|---|
model_q8f16 | 混合精度 | 86 MB | 推荐 - 最佳平衡 |
model_quantized | 8 位 | 92.4 MB | 良好的 CPU 性能 |
model_uint8f16 | 混合精度 | 114 MB | 在中端 CPU 上质量更好 |
model_q4f16 | 4 位和 fp16 权重 | 154 MB | 质量更高,仍高效 |
model_fp16 | fp16 | 163 MB | 优质 |
model_uint8 | 8 位和混合 | 177 MB | 平衡选项 |
model_q4 | 4 位矩阵乘法 | 305 MB | 高质量选项 |
model | fp32 | 326 MB | 最高质量(较慢) |
✨ 安装前试用
访问 Kokoro Web Demo 立即预览所有语音。此演示:
- 100% 在您的浏览器中运行 - 无需服务器
- 永久免费 - 无使用限制或注册要求
- 零安装 - 只需访问网站即可开始创建
- 包含所有功能 - 立即测试任何语音或语言
需要更多帮助?
有关更多选项、语音定制指南和高级设置,请访问 GitHub 仓库。
在您的 OpenWebUI 对话中享受自然的 AI 语音!