为您的私有部署选择正确的AI模型

匡优数言私有化部署中最重要的决定之一是使用哪个AI模型。正确的选择取决于您组织的隐私要求、基础设施、性能需求和内部政策。

本指南引导您了解选项并帮助您做出决定。

两条路径

使用此框架快速缩小选择范围。

匡优数言支持在同一部署中路由不同工作流到不同模型。

模型	参数	所需VRAM	语言	许可证	最适合
Qwen3.5-397B-A17B	397B (MoE, 17B活跃)	64 GB	201+ 语言	Apache 2.0	最大质量、复杂分析
Qwen3.5-122B-A10B	122B (MoE, 10B活跃)	24–48 GB	201+ 语言	Apache 2.0	高质量、复杂任务
Qwen3.5-35B-A3B	35B (MoE, 3B活跃)	16 GB	201+ 语言	Apache 2.0	多语言、一般分析
DeepSeek V3	671B (MoE, 37B活跃)	32–48 GB	EN、ZH、多语言	MIT	数学推理、代码生成
Gemma 4-31B	31B	24 GB	140 语言	Apache 2.0	Agentic工作流、结构化输出
Qwen3.5-9B	9B	16 GB	201+ 语言	Apache 2.0	经济高效的本地部署

所有开源模型在本地运行。初始设置后不需要互联网连接。许可证允许商业使用。

模型	提供商	上下文窗口	最适合
GPT-5.4	OpenAI	1M tokens	复杂推理、英语优先
Claude Opus 4.6	Anthropic	1M tokens	长文档、细致分析
Gemini 3.1 Pro	Google	1M tokens	非常大的文件、混合内容

您使用您自己的API密钥。匡优数言不充当中间人 — 您的数据直接从您的环境发送到提供商。

当您使用闭源模型时，您的电子表格数据被发送到该提供商的API进行处理。这意味着：

为获得最大的数据主权，请使用开源模型。

匡优数言支持在同一部署中为不同用例配置不同的模型。

示例配置：

工作流：财务报告 → DeepSeek V3（本地、敏感数据）
工作流：营销摘要 → GPT-5.4（API、非敏感）
工作流：默认 → Qwen3.5-35B（本地、通用）

这允许您的组织根据数据敏感性为每个工作流应用正确的模型，而不是在所有用例中强制单一选择。

部署后可以切换模型吗？ 可以。模型选择是配置更改，不是重新部署。您的IT团队可以在不停机的情况下更新模型路由配置。

我们需要自己下载模型权重吗？ 不需要。匡优数言部署包包含模型获取指南。对于空气隔离环境，我们提供在部署前预加载模型权重的说明。

如果我想使用不在此列表中的模型怎么办？ 联系我们。匡优数言的模型层设计为可扩展的。如果您有特定的模型要求，我们可以讨论兼容性。

我可以使用微调或自定义模型吗？ 这在企业级可用。请联系我们讨论您的要求。

预约演示，我们将帮助您将正确的模型策略映射到您的环境、数据敏感性和性能要求。

您还可以查看技术架构文档以了解更多关于模型层如何与系统其他部分集成的详细信息。