匡优数言私有化部署：性能基准

本文档提供跨不同硬件配置和使用场景的匡优数言私有化部署参考性能数据。使用它来设定预期、规划基础设施和验证您的部署。

摘要

除非另有说明，以下所有基准都在以下标准配置上运行。

显示匡优数言在并发用户增加时的表现。

配置	并发用户	平均响应	P95响应	推荐用于
最小（8核、32GB、16GB VRAM）	10–20	4.5s	9s	小型团队、试点
标准（16核、64GB、24GB VRAM）	50	3.5s	7s	部门、50–100用户
企业（32核、128GB、80GB VRAM）	100–200	2.8s	6s	大型组织、高并发
企业集群（多节点）	500+	2.5s	5s	全企业范围推广

不同模型有不同的速度/质量权衡。以下是它们在标准电子表格分析任务上的比较。

闭源模型响应时间取决于提供商的API延迟以及您到其端点的网络连接。

匡优数言私有化部署专为持续运营而设计。

使用上面的硬件sizing表作为起点。需要基于您的团队规模、文件类型和使用模式更精确的建议，请申请包含sizing工作表的部署包。

要使用您自己的文件类型进行现场性能演示，请预约演示。