跳到主要内容

🗨️ Kokoro Web - 为 Open WebUI 轻松实现文本转语音

警告

本教程由社区贡献,不获得 Open WebUI 团队的支持。它仅作为演示,说明如何根据您的特定用例定制 Open WebUI。想要贡献?请查看贡献教程。

什么是 Kokoro Web?

Kokoro Web 为功能强大的 Kokoro-82M 文本转语音模型提供了一个轻量级、与 OpenAI 兼容的 API,可与 Open WebUI 无缝集成,通过自然流畅的语音增强您的 AI 对话。

🚀 两步集成

1. 部署 Kokoro Web API(一步命令)

services:
kokoro-web:
image: ghcr.io/eduardolat/kokoro-web:latest
ports:
- "3000:3000"
environment:
# Change this to any secret key to use as your OpenAI compatible API key
- KW_SECRET_API_KEY=your-api-key
volumes:
- ./kokoro-cache:/kokoro/cache
restart: unless-stopped

运行命令: docker compose up -d

2. 连接 OpenWebUI(30 秒)

  1. 在 OpenWebUI 中,前往 Admin PanelSettingsAudio
  2. 配置
    • 文本转语音引擎: OpenAI
    • API 基础 URL: https://:3000/api/v1
      (如果使用 Docker: http://host.docker.internal:3000/api/v1
    • API 密钥: your-api-key (来自步骤 1)
    • TTS 模型: model_q8f16 (大小/质量的最佳平衡)
    • TTS 声音: af_heart (默认的温暖、自然的英文语音)。您可以从 Kokoro Web Demo 更改为任何其他声音或公式。

就是这样!您的 OpenWebUI 现在已具备 AI 语音能力。

🌍 支持的语言

Kokoro Web 支持 8 种语言,每种语言都有经过优化的特定语音。

  • 英语(美国) - en-us
  • 英语(英国) - en-gb
  • 日语 - ja
  • 中文 - cmn
  • 西班牙语 - es-419
  • 印地语 - hi
  • 意大利语 - it
  • 葡萄牙语(巴西) - pt-br

每种语言都有专用语音,以实现最佳发音和自然流畅。请参阅 GitHub 仓库 以获取特定语言语音的完整列表,或使用 Kokoro Web Demo 即时预览并创建您自己的自定义语音。

💾 适用于任何硬件的优化模型

选择适合您硬件需求的模型

模型 ID优化大小适用场景
model_q8f16混合精度86 MB推荐 - 最佳平衡
model_quantized8 位92.4 MB良好的 CPU 性能
model_uint8f16混合精度114 MB在中端 CPU 上提供更好质量
model_q4f164 位 & fp16 权重154 MB更高质量,仍高效
model_fp16fp16163 MB高级质量
model_uint88 位 & 混合177 MB均衡选项
model_q44 位矩阵乘法305 MB高质量选项
modelfp32326 MB最高质量(较慢)

✨ 安装前试用

访问 Kokoro Web Demo 即时预览所有语音。此演示

  • 100% 在您的浏览器中运行 - 无需服务器
  • 永久免费 - 无使用限制或注册要求
  • 零安装 - 只需访问网站即可开始创建
  • 包含所有功能 - 立即测试任何语音或语言

需要更多帮助?

如需更多选项、语音自定义指南和高级设置,请访问 GitHub 仓库

在您的 OpenWebUI 对话中享受自然的 AI 语音!