匡优数言 私有化部署常见问题

本文档回答我们最常从评估匡优数言 私有化部署的IT团队、安全审核员和采购利益相关者那里听到的问题。


部署和基础设施

匡优数言可以本地部署吗? 是的。匡优数言在您自己的服务器上运行,位于您的数据中心或内部网络中。您控制硬件、操作系统和网络配置。

匡优数言可以在私有云中运行吗? 是的。匡优数言可以部署在您自己的AWS VPC、Azure VNet或GCP VPC中。您在自己的账户中部署 — 匡优数言无法访问您的云环境。

匡优数言支持空气隔离部署(无互联网)吗? 是的。使用开源模型,匡优数言可以在没有出站互联网连接的情况下运行。模型权重在设置期间预加载。所有处理都在本地进行。

支持哪些操作系统? Ubuntu 22.04 LTS是主要支持的操作系统。RHEL 8+也受支持。Windows Server通过Docker Desktop或WSL2支持。

匡优数言支持Docker吗? 是的。Docker和Docker Compose是标准部署方法。还支持Kubernetes用于高可用性和多节点配置。

部署需要多长时间? 标准单服务器部署通常需要1-3天,包括环境设置、模型加载和初步测试。匡优数言团队在整个过程中提供远程支持。

最低硬件要求是什么? 小型团队(最多20个用户):8核CPU、32GB RAM、16GB VRAM的NVIDIA GPU、500GB SSD。参见完整硬件 sizing指南了解更大配置。

我们需要GPU吗? 如果本地运行开源模型则需要GPU。如果通过API使用闭源模型(GPT、Claude、Gemini),GPU要求会大大降低。


数据处理和安全

匡优数言是否将我们的数据发送到外部服务器? 否。使用开源模型,所有数据都保留在您的环境内。匡优数言不会将您的文件、输出或日志传输到任何外部服务器。

如果我们使用GPT或Claude等闭源模型会怎样? 如果您选择闭源模型,您的数据将使用您自己的API密钥和您自己的账户发送到该提供商的API。匡优数言不充当中间人。您受该提供商的数据处理政策约束。

匡优数言是否从我们的部署收集使用情况遥测? 否。匡优数言 私有化部署不会将使用数据、分析或遥测发送回匡优数言。

上传后文件存储在哪里? 文件存储在您自己的环境中 — 在您服务器的本地存储或您配置的存储系统中。匡优数言不会外部保留副本。

数据如何加密? 用户和匡优数言服务器之间的传输中数据使用TLS(您配置自己的证书)。静态数据由您的基础设施管理 — 匡优数言将文件存储在您指定的存储中,静态加密由您的磁盘或卷加密设置处理。

匡优数言支持基于角色的访问控制吗? 是的。匡优数言支持管理员、编辑者和查看者角色。还支持工作区隔离,允许不同团队拥有具有单独访问控制的单独环境。

匡优数言支持SSO吗? 是的。支持SAML 2.0和OIDC。企业级提供LDAP和Active Directory集成。

匡优数言生成审计日志吗? 是的。所有用户操作都在本地记录 — 文件上传、AI查询、报告生成、登录/登出事件以及管理员更改。日志以JSON格式存储在您的环境中,与Splunk和Elastic等SIEM工具兼容。


合规性和政策

匡优数言有助于GDPR合规吗? 匡优数言 私有化部署为您的组织提供对数据处理的完全控制,支持您的GDPR合规态势。由于数据保留在您的环境中,您仍然是数据控制者。您的法律团队应根据您的具体要求审核架构。

匡优数言是否符合SOX要求? 匡优数言的审计日志、访问控制和数据隔离功能支持SOX相关控制。您的合规团队应根据您的具体SOX要求审核技术架构

匡优数言可以满足数据驻留要求吗? 是的。由于匡优数言在您自己的基础设施上运行,数据保留在您选择的地理位置。您控制服务器所在位置。

匡优数言是否有ISO 27001或SOC 2认证? 请联系了解我们安全认证的最新状态。我们提供详细的安全架构参考和数据流文档以支持您的内部审核流程。

我们可以在匡优数言部署上运行渗透测试吗? 可以。由于匡优数言在您的环境中运行,您可以按自己的计划运行渗透测试和安全评估。如果需要架构文档来支持评估,请联系我们。


模型和AI

匡优数言支持哪些AI模型? 开源:DeepSeek-V2、Qwen2.5、Kimi。闭源(通过您的API密钥):GPT-4o、Claude 3.5、Gemini 1.5 Pro。参见模型选择指南了解完整比较。

我们可以用不同模型处理不同工作流吗? 是的。匡优数言支持模型路由 — 您可以在同一部署中为不同用例配置不同的模型。

我们可以使用自定义或微调模型吗? 自定义模型支持在企业级提供。请联系我们讨论您的要求。

我们需要自己下载模型权重吗? 不需要。部署包包含模型获取指南。对于空气隔离环境,我们提供在部署前预加载模型权重的说明。


性能和可靠性

正常运行时间SLA是多少? 99.9%正常运行时间目标。参见性能基准了解完整详情。

响应时间有多快? 首个token延迟小于100ms。平均完整响应时间为3-8秒,取决于任务复杂度和硬件。参见性能基准了解特定于配置的数据。

匡优数言可以处理多少并发用户? 标准配置(16核、64GB RAM、NVIDIA A10)下50+并发用户。企业集群配置支持200+并发用户。

如果服务器宕机会怎样? 匡优数言在计划重启后60秒内恢复。对于高可用性要求,建议使用多节点Kubernetes部署。


更新和支持

如何交付更新? 更新作为版本化Docker镜像或部署包发布。您的IT团队按您的时间表应用更新 — 没有自动更新。

匡优数言在部署期间提供远程支持吗? 是的。匡优数言团队通过视频通话和异步通信提供远程部署支持。我们协助环境设置、模型配置和初步测试。

上线后有哪些支持? 支持条款取决于您的协议。请联系我们了解部署后支持选项的详情。

我们可以回滚到以前的版本吗? 是的。回滚通过恢复到以前的Docker镜像版本完成。我们随每个版本提供回滚说明。


评估和采购

最好的第一步是什么? 预约演示。我们将了解您的环境、用例和需求,并帮助您规划结构化评估。

你们提供概念验证吗? 是的。参见POC指南了解匡优数言 POC涉及的完整演练。

有免费试用吗? 由于设置需要与您的IT环境协调,我们为私有部署提供结构化POC而不是自助免费试用。联系我们讨论。

采购审核有哪些文档可用? 部署包包括参考架构、硬件sizing指南、模型兼容性概览和部署清单。在此申请


还有问题吗?

预约演示,我们将直接回答您的具体问题。

您还可以查看: