跳到主要内容

👁️ Mistral OCR

警告

本教程是社区贡献,不受 Open WebUI 团队支持。它仅作为如何针对您的特定用例自定义 Open WebUI 的演示。想做贡献吗?请查阅贡献教程。

👁️ Mistral OCR

本文档提供了将 Mistral OCR 与 Open WebUI 集成的分步指南。Mistral OCR 是一个光学字符识别库,旨在从各种基于图像的文件格式(包括扫描的 PDF、图像和手写文档)中提取文本,并将其转换为 JSON 或纯文本等结构化数据。凭借对多语言文本识别、布局分析和手写解释的高级支持,Mistral OCR 通过强大且可定制的界面简化了文档数字化和处理过程,以便用于搜索、摘要和数据提取等 AI 应用。

前提条件

  • Open WebUI 实例
  • Mistral AI 账户

集成步骤

步骤 1:注册或登录 Mistral AI 控制台

  • 访问 https://console.mistral.ai
  • 按照流程中的指示进行操作
  • 授权成功后,您将进入控制台主页

步骤 2:生成 API 密钥

  • 访问 API Keyshttps://console.mistral.ai/api-keys
  • 创建新密钥并务必复制

步骤 3:配置 Open WebUI 使用 Mistral OCR

  • 登录您的 Open WebUI 实例。
  • 导航至 Admin Panel(管理面板)设置菜单。
  • 点击 Settings(设置)。
  • 点击 Documents(文档)标签页。
  • Default(默认)内容提取引擎下拉菜单更改为 Mistral OCR
  • 将 API 密钥粘贴到字段中
  • 保存管理面板设置。

验证 Mistral OCR

要验证 Mistral OCR 在脚本中是否正常工作,请参考 https://docs.mistral.org.cn/capabilities/document/

结论

将 Mistral OCR 与 Open WebUI 集成是一种简单有效的方式,可以增强文档处理和内容提取能力。通过遵循本指南中的步骤,您可以将 Mistral OCR 设置为默认提取引擎,并利用其高级文本识别功能。配置完成后,Mistral OCR 支持强大、多语言的文档解析,并支持各种格式,从而增强了 Open WebUI 中由 AI 驱动的文档分析能力。