匡优数言 私有化部署:技术架构概述
本文档面向评估匡优数言 私有化部署的IT架构师、基础设施工程师和安全审核员。涵盖系统组件、部署模式、硬件要求和集成注意事项。
系统架构
匡优数言 私有化部署由四个完全在您的环境内运行的层组成。
支持的部署环境
| 环境 | 支持 | 说明 |
|---|---|---|
| 裸金属Linux服务器 | ✅ | 推荐用于最大性能 |
| Docker(单主机) | ✅ | 最快启动 |
| Docker Compose | ✅ | 标准多服务配置 |
| Kubernetes | ✅ | 用于高可用性和扩展 |
| 私有云(AWS VPC) | ✅ | 部署到您自己的账户 |
| 私有云(Azure VNet) | ✅ | 部署到您自己的订阅 |
| 私有云(GCP VPC) | ✅ | 部署到您自己的项目 |
| 空气隔离(无互联网) | ✅ | 需要预捆绑的部署包 |
| Windows Server | ⚠️ | 通过Docker Desktop或WSL2 |
硬件选型指南
正确的硬件取决于您的团队规模、并发需求以及是否本地运行开源模型。
最小(最多20用户、轻度使用)
| 组件 | 规格 |
|---|---|
| CPU | 8核x86_64 |
| RAM | 32 GB |
| GPU | NVIDIA GPU,16 GB VRAM(用于本地模型) |
| 存储 | 500 GB SSD |
| 操作系统 | Ubuntu 22.04 LTS或RHEL 8+ |
标准(最多100用户、常规使用)
| 组件 | 规格 |
|---|---|
| CPU | 16核x86_64 |
| RAM | 64 GB |
| GPU | NVIDIA A10或RTX 4090(24 GB VRAM) |
| 存储 | 1 TB NVMe SSD |
| 操作系统 | Ubuntu 22.04 LTS |
企业(100+用户、高并发)
| 组件 | 规格 |
|---|---|
| CPU | 32核x86_64(2节点) |
| RAM | 每节点128 GB |
| GPU | NVIDIA A100或H100(80 GB VRAM) |
| 存储 | 2 TB NVMe SSD + 共享NAS |
| 网络 | 10 Gbps内部 |
| 操作系统 | 带Kubernetes的Ubuntu 22.04 LTS |
如果您通过API使用闭源模型(GPT、Claude、Gemini),GPU要求会大大降低,因为推理在您的API密钥上外部运行。
网络要求
入站
- 端口443(HTTPS):从内部用户到匡优数言应用服务器
- 端口80(HTTP,重定向到HTTPS)— 可选
内部(组件之间)
- 应用服务器到模型服务器:可配置端口(默认8080)
- 应用服务器到数据库:默认DB端口(Postgres 5432等)
- 应用服务器到向量数据库:可配置
出站(互联网)
- 开源模型部署不需要
- 仅在使用闭源模型API(GPT、Claude、Gemini)时需要 — 仅出站到各自的API端点
- 设置期间需要初始模型权重下载(可以在单独的机器上完成然后传输)
支持的模型
开源(本地运行,不需要互联网)
| 模型 | 所需VRAM | 最适合 |
|---|---|---|
| DeepSeek-V2 | 16–24 GB | 一般分析、中文 |
| Qwen2.5 | 16 GB | 多语言、结构化数据 |
| Kimi (Moonshot) | 16 GB | 长上下文、文档分析 |
闭源(通过您自己的API密钥)
| 模型 | 提供商 | 说明 |
|---|---|---|
| GPT-4o | OpenAI | 您的API密钥、您的账户 |
| Claude 3.5 | Anthropic | 您的API密钥、您的账户 |
| Gemini 1.5 Pro | 您的API密钥、您的账户 |
您可以在工作流中混合模型 — 例如,对敏感财务数据使用开源,对非敏感报告任务使用闭源。
身份验证和访问控制
匡优数言 私有化部署支持:
- 本地用户账户 — 在匡优数言内管理
- SSO集成 — SAML 2.0和OIDC(请索取配置指南)
- LDAP / Active Directory — 企业级可用
- 基于角色的访问控制 — 管理员、编辑者、查看者角色
- 工作区隔离 — 按团队或部门分隔的工作区
审计日志记录
所有用户操作都在本地记录:
- 文件上传和删除
- AI查询和响应
- 报告生成事件
- 登录和登出事件
- 管理员配置更改
日志存储在您的环境中,不会传输到匡优数言。日志格式为JSON,与Splunk和Elastic等标准SIEM工具兼容。
更新和维护
匡优数言将更新作为版本化Docker镜像或部署包发布。
- 更新由您的IT团队按您的时间表应用
- 没有您的操作就不会自动更新
- 每个版本都提供发布说明
- 通过恢复到以前的Docker镜像版本支持回滚
获取完整技术参考
匡优数言部署包包括:
- 参考部署架构(PDF)
- 硬件选型工作表
- 模型兼容性矩阵
- 部署清单
- 网络图表模板
要进行现场技术演练,预约演示,我们将一起查看您的特定环境。