🗨️ Kokoro Web - 为 Open WebUI 轻松实现文本转语音

警告

本教程由社区贡献，不获得 Open WebUI 团队的支持。它仅作为演示，说明如何根据您的特定用例定制 Open WebUI。想要贡献？请查看贡献教程。

什么是 `Kokoro Web`?

Kokoro Web 为功能强大的 Kokoro-82M 文本转语音模型提供了一个轻量级、与 OpenAI 兼容的 API，可与 Open WebUI 无缝集成，通过自然流畅的语音增强您的 AI 对话。

🚀 两步集成

1. 部署 Kokoro Web API（一步命令）

services:
  kokoro-web:
    image: ghcr.io/eduardolat/kokoro-web:latest
    ports:
      - "3000:3000"
    environment:
      # Change this to any secret key to use as your OpenAI compatible API key
      - KW_SECRET_API_KEY=your-api-key
    volumes:
      - ./kokoro-cache:/kokoro/cache
    restart: unless-stopped

运行命令： docker compose up -d

2. 连接 OpenWebUI（30 秒）

在 OpenWebUI 中，前往 Admin Panel → Settings → Audio
配置
- 文本转语音引擎： OpenAI
- API 基础 URL： https://:3000/api/v1
  （如果使用 Docker： http://host.docker.internal:3000/api/v1）
- API 密钥： your-api-key （来自步骤 1）
- TTS 模型： model_q8f16 （大小/质量的最佳平衡）
- TTS 声音： af_heart （默认的温暖、自然的英文语音）。您可以从 Kokoro Web Demo 更改为任何其他声音或公式。

就是这样！您的 OpenWebUI 现在已具备 AI 语音能力。

🌍 支持的语言

Kokoro Web 支持 8 种语言，每种语言都有经过优化的特定语音。

英语（美国） - en-us
英语（英国） - en-gb
日语 - ja
中文 - cmn
西班牙语 - es-419
印地语 - hi
意大利语 - it
葡萄牙语（巴西） - pt-br

每种语言都有专用语音，以实现最佳发音和自然流畅。请参阅 GitHub 仓库以获取特定语言语音的完整列表，或使用 Kokoro Web Demo 即时预览并创建您自己的自定义语音。

💾 适用于任何硬件的优化模型

选择适合您硬件需求的模型

模型 ID	优化	大小	适用场景
model_q8f16	混合精度	86 MB	推荐 - 最佳平衡
model_quantized	8 位	92.4 MB	良好的 CPU 性能
model_uint8f16	混合精度	114 MB	在中端 CPU 上提供更好质量
model_q4f16	4 位 & fp16 权重	154 MB	更高质量，仍高效
model_fp16	fp16	163 MB	高级质量
model_uint8	8 位 & 混合	177 MB	均衡选项
model_q4	4 位矩阵乘法	305 MB	高质量选项
model	fp32	326 MB	最高质量（较慢）

✨ 安装前试用

访问 Kokoro Web Demo 即时预览所有语音。此演示

100% 在您的浏览器中运行 - 无需服务器
永久免费 - 无使用限制或注册要求
零安装 - 只需访问网站即可开始创建
包含所有功能 - 立即测试任何语音或语言

需要更多帮助？

如需更多选项、语音自定义指南和高级设置，请访问 GitHub 仓库。

在您的 OpenWebUI 对话中享受自然的 AI 语音！

什么是 Kokoro Web?​

🚀 两步集成​

1. 部署 Kokoro Web API（一步命令）​

2. 连接 OpenWebUI（30 秒）​

🌍 支持的语言​

💾 适用于任何硬件的优化模型​

✨ 安装前试用​

需要更多帮助？​