匡优数言 私有化部署:技术架构概述

本文档面向评估匡优数言 私有化部署的IT架构师、基础设施工程师和安全审核员。涵盖系统组件、部署模式、硬件要求和集成注意事项。


系统架构

匡优数言 私有化部署由四个完全在您的环境内运行的层组成。

匡优数言私有化部署 — 系统架构 层1 — 客户端 网页浏览器 桌面PWA REST API客户端 层2 — 应用服务器 API网关 认证 · 速率限制 电子表格引擎 解析 · 转换 输出生成器 图表 · 报告 审计日志记录器 访问 · 操作 层3 — AI/模型层 模型路由器 按策略选择 开源模型 DeepSeek · Qwen · Kimi 闭源(可选) GPT · Claude · Gemini 嵌入引擎 本地向量索引 层4 — 数据层 文件存储 关系型数据库 向量数据库 审计日志

支持的部署环境

环境 支持 说明
裸金属Linux服务器 推荐用于最大性能
Docker(单主机) 最快启动
Docker Compose 标准多服务配置
Kubernetes 用于高可用性和扩展
私有云(AWS VPC) 部署到您自己的账户
私有云(Azure VNet) 部署到您自己的订阅
私有云(GCP VPC) 部署到您自己的项目
空气隔离(无互联网) 需要预捆绑的部署包
Windows Server ⚠️ 通过Docker Desktop或WSL2

硬件选型指南

正确的硬件取决于您的团队规模、并发需求以及是否本地运行开源模型。

最小(最多20用户、轻度使用)

组件 规格
CPU 8核x86_64
RAM 32 GB
GPU NVIDIA GPU,16 GB VRAM(用于本地模型)
存储 500 GB SSD
操作系统 Ubuntu 22.04 LTS或RHEL 8+

标准(最多100用户、常规使用)

组件 规格
CPU 16核x86_64
RAM 64 GB
GPU NVIDIA A10或RTX 4090(24 GB VRAM)
存储 1 TB NVMe SSD
操作系统 Ubuntu 22.04 LTS

企业(100+用户、高并发)

组件 规格
CPU 32核x86_64(2节点)
RAM 每节点128 GB
GPU NVIDIA A100或H100(80 GB VRAM)
存储 2 TB NVMe SSD + 共享NAS
网络 10 Gbps内部
操作系统 带Kubernetes的Ubuntu 22.04 LTS

如果您通过API使用闭源模型(GPT、Claude、Gemini),GPU要求会大大降低,因为推理在您的API密钥上外部运行。


网络要求

入站

  • 端口443(HTTPS):从内部用户到匡优数言应用服务器
  • 端口80(HTTP,重定向到HTTPS)— 可选

内部(组件之间)

  • 应用服务器到模型服务器:可配置端口(默认8080)
  • 应用服务器到数据库:默认DB端口(Postgres 5432等)
  • 应用服务器到向量数据库:可配置

出站(互联网)

  • 开源模型部署不需要
  • 仅在使用闭源模型API(GPT、Claude、Gemini)时需要 — 仅出站到各自的API端点
  • 设置期间需要初始模型权重下载(可以在单独的机器上完成然后传输)

支持的模型

开源(本地运行,不需要互联网)

模型 所需VRAM 最适合
DeepSeek-V2 16–24 GB 一般分析、中文
Qwen2.5 16 GB 多语言、结构化数据
Kimi (Moonshot) 16 GB 长上下文、文档分析

闭源(通过您自己的API密钥)

模型 提供商 说明
GPT-4o OpenAI 您的API密钥、您的账户
Claude 3.5 Anthropic 您的API密钥、您的账户
Gemini 1.5 Pro Google 您的API密钥、您的账户

您可以在工作流中混合模型 — 例如,对敏感财务数据使用开源,对非敏感报告任务使用闭源。


身份验证和访问控制

匡优数言 私有化部署支持:

  • 本地用户账户 — 在匡优数言内管理
  • SSO集成 — SAML 2.0和OIDC(请索取配置指南)
  • LDAP / Active Directory — 企业级可用
  • 基于角色的访问控制 — 管理员、编辑者、查看者角色
  • 工作区隔离 — 按团队或部门分隔的工作区

审计日志记录

所有用户操作都在本地记录:

  • 文件上传和删除
  • AI查询和响应
  • 报告生成事件
  • 登录和登出事件
  • 管理员配置更改

日志存储在您的环境中,不会传输到匡优数言。日志格式为JSON,与Splunk和Elastic等标准SIEM工具兼容。


更新和维护

匡优数言将更新作为版本化Docker镜像或部署包发布。

  • 更新由您的IT团队按您的时间表应用
  • 没有您的操作就不会自动更新
  • 每个版本都提供发布说明
  • 通过恢复到以前的Docker镜像版本支持回滚

获取完整技术参考

匡优数言部署包包括:

  • 参考部署架构(PDF)
  • 硬件选型工作表
  • 模型兼容性矩阵
  • 部署清单
  • 网络图表模板

申请部署包 →

要进行现场技术演练,预约演示,我们将一起查看您的特定环境。