减少内存使用
如果您在内存受限的环境中部署此镜像,可以采取一些措施来精简镜像。
在搭载 v0.3.10 版本的 Raspberry Pi 4 (arm64) 上,这能够将空闲内存消耗从 >1GB 减少到约 200MB(通过 docker container stats
观察到)。
TLDR
设置以下环境变量(或对于现有部署,设置相应的 UI):RAG_EMBEDDING_ENGINE: ollama
, AUDIO_STT_ENGINE: openai
。
更详细的解释
大部分内存消耗是由于加载了机器学习模型。即使您使用的是外部语言模型(OpenAI 或独立的 ollama),也可能加载了许多模型用于其他目的。
截至 v0.3.10,这包括
- 语音转文本(默认为 whisper)
- RAG 嵌入引擎(默认为本地 SentenceTransformers 模型)
- 图像生成引擎(默认为禁用)
前两项默认启用并设置为本地模型。您可以在管理面板中更改这些模型(RAG:文档类别,将其设置为 Ollama 或 OpenAI;语音转文本:音频部分,使用 OpenAI 或 WebAPI)。如果您正在部署新的 Docker 镜像,也可以使用以下环境变量进行设置:RAG_EMBEDDING_ENGINE: ollama
, AUDIO_STT_ENGINE: openai
。请注意,如果 config.json
文件已存在,这些环境变量将不起作用。