匡优Excel 命令编写指南

目的

教您如何撰写有效的命令,以便 匡优Excel 能够快速、一致且以最少返工的方式,准确地生成您想要的结果。

为何如此重要

匡优Excel 依赖于您的自然语言指令。模糊或不具体的命令会迫使 AI 进行猜测,从而增加输出不完整、不正确或过于笼统的可能性。清晰的意图 = 更好的电子表格,更快的速度。

1. 命令编写基础

重点关注 4 个支柱:

  1. 操作:应该做什么?(移除重复项、计算、分组、预测、可视化、提取、格式化)
  2. 范围:哪些列/行/工作表/文件?使用单引号括起确切的列名。
  3. 条件:筛选器、阈值、日期范围、业务规则。
  4. 输出形式:新工作表、覆盖、仅摘要、图表、清理后的文件、添加列等。

优劣对比(核心示例)

目标 差(模糊) 好(具体) 优点
移除重复项 修复我的文件 基于 '客户 ID' 移除重复项;保留首次出现;输出为新工作表 'Cleaned'。 指定了关键列 + 规则 + 输出目标
汇总销售额 分析数据 按 '地区' 和 '季度' 汇总 '销售额';包括总计行并按销售额降序排列。 清晰的聚合 + 分组 + 排序
排序数据 让它更好看 按 '日期' 升序排序,然后按 '收入' 降序排序;保留标题行。 明确的多级排序
添加指标 改进文件 添加列 '利润率' = (收入 - 成本)/收入 * 100;格式化为保留两位小数的百分比。 明确的公式 + 格式化
筛选 清理它 筛选 '收入' > 1000 且 '地区' = '西部' 的行;仅输出筛选后的行。 精确的条件
图表 做个图表 创建条形图:x='产品', y='销售额', 降序排序, 标题 '热门产品销售额', 放置在新工作表 'Charts' 中。 定义了坐标轴 + 排序 + 元数据

简单模式

操作 + 目标列 + 条件 + 转换 + 输出格式

示例:计算过去 90 天内('订单日期' >= 2025-05-28)按 '渠道' 分类的平均 '订单价值';输出汇总表 + 条形图。


2. 提升精度

使用这些措辞技巧:

  • 列的特异性:'客户 ID' 而不是 客户id 或 ID(如果可能,匹配大小写)。
  • 聚合:求和、平均值、唯一计数、中位数、最小值、最大值、标准差。
  • 计算:"添加列 '净值' = 收入 - 成本 - 税金"。
  • 时间窗口:过去 30 天、2024-01-01 至 2024-12-31 之间、当前月份。
  • 排序:按 '日期' 升序排序,然后按 '销售额' 降序排序。
  • 格式化:将 '日期' 格式化为 YYYY-MM,将 '利润率' 格式化为保留一位小数的百分比。
  • 输出位置:覆盖当前工作表 / 创建新工作表 'Summary' / 两者都保留。
  • 保留:保持原始工作表不变。
  • 行数限制:按 '销售额' 显示前 20 名。

3. 高级命令技巧

A. 条件逻辑

示例:

  • 筛选 '收入' > 1000 且 '地区' 在 ("西部","北部") 内的行。
  • 将 '类别' = '配件' 的 '价格' 列中的空值替换为中位数。
  • 标记异常值:添加列 '是否异常值' = 如果 'ZScore' > 3 则为 1,否则为 0。

B. 一次性组合任务

当顺序清晰时,将相关操作链接起来。 示例:清理 '订单' 表,基于 '订单 ID' 移除重复项,用中位数填充缺失的 '成本',添加 '利润率'=(收入-成本)/收入*100,然后创建按 '地区' 分类的平均 '利润率' 条形图。

C. 大型数据集策略

  • 开始:提供结构摘要(列、类型、行数)。
  • 然后:生成 10 行样本(随机或头部)以确认假设。
  • 验证后:执行完整的转换。
  • 对繁重任务使用增量命令:(1)清理,(2)添加指标,(3)可视化。

D. 输出管理

指定:"创建新工作表 'Cleaned'"、"替换现有 'Sheet1'"、"将图表添加到新工作表 'Charts'"、"仅返回摘要(无行级导出)"。

E. 请求解释

添加:"解释每一步" 或 "提供公式原理" 以审核转换。

F. 复杂公式

示例:添加列 'LTV' = (平均订单价值 * 购买频率 * 毛利率 %) 在过去 12 个月内按 '客户 ID' 计算;输出按降序排序的客户级表格。

G. 迭代优化

  1. 首先:高层级摘要。
  2. 其次:缩小范围(例如,仅 '地区'='西部')。
  3. 然后:添加指标/视觉效果。
  4. 最后:可视化。

H. 合并文件

"合并上传的月度文件;从文件名(YYYY-MM)中添加 '月份';将所有文件连接成一个表;确保列顺序一致;添加总计行。"

I. 数据质量检查

"列出缺失值超过 10% 的列;建议填充方法;暂时不要修改。"


4. 常用命令模板

复制、修改并运行。替换括号内的项目。

清理与准备

  • 基于 '[主键]' 移除重复项,保留第一个。
  • 将 '[日期列]' 的日期格式标准化为 YYYY-MM-DD。
  • 用中位数填充 '[列]' 中的缺失值。
  • 将 '[全名]' 拆分为 '姓' 和 '名'。
  • 清除所有文本列的前后空格。
  • 使用 z-score > 3 检测 '[指标]' 中的异常值并列出受影响的行。

转换

  • 添加列 '[新指标]' = ([分子] - [分母]) / [分子] * 100,格式化为百分比。
  • 数据透视:按 '[行维度]' 和 '[列维度]' 汇总 '[值]'。
  • 取消数据透视:将 '[一月]'..'[十二月]' 列转换为 '月份','值'。

分析

  • 描述性统计:计算 ['列1','列2'] 的平均值、中位数、最小值、最大值、标准差。
  • '[变量 A]' 和 '[变量 B]' 之间的相关性及解释。
  • 趋势:绘制 '[指标]' 随 '[日期]' 的变化图,并计算周期性增长。
  • 使用线性回归预测 '[指标]' 未来 6 个周期的值;包括置信区间。

可视化

  • 条形图:x='[类别]', y='[值]',降序排序。
  • 折线图:x='[日期]', y='[指标]',移动平均窗口为 7。
  • 饼图:按 '[值]' 显示 '[类别]' 的份额。
  • 散点图:'[X]' vs '[Y]',添加回归线 + 相关性。

商业智能

  • KPI 摘要:计算收入、成本、利润 = 收入 - 成本、利润率 %。
  • 按 '注册月份' 进行同期群分析,显示 0-6 个月的留存率。
  • 假设分析:将 '[价格]' 提高 10% 并重新计算 '利润';汇总差异。

多文件操作

  • 合并所有上传的文件;添加 '源文件' 列;按标题名称对齐列。
  • 追加文件,然后基于 '[ID]' 移除重复项。

格式化与输出

  • 将 '[货币列]' 格式化为保留两位小数的美元货币。
  • 按 '[日期]' 升序排序,然后按 '[收入]' 降序排序。
  • 仅使用聚合表创建新工作表 'Summary'。
  • 保留原始工作表;将转换后的数据放在 'Cleaned' 中。

审计与质检

  • 清理后显示 10 个随机行以供审查。
  • 列出缺失值 >5% 的列;提出填充策略。

5. 优劣命令展示(按场景)

场景 改进 最佳
清理 修复这个 移除重复项 基于 '订单 ID' 移除重复项,用中位数填充空的 '成本',将 '日期' 标准化为 YYYY-MM-DD,输出到新工作表 'Cleaned'。
分析 分析销售额 汇总销售额 按 '地区' 和 '季度' 汇总 '销售额';包括与上一季度的增长,并按 '销售额' 降序排序。
可视化 做个图表 产品条形图 条形图:x='产品', y='销售额', 仅前 15 名, 降序排序, 标题 '前 15 名产品', 新工作表 'Charts'。
商业智能 预测 预测收入 使用线性回归预测未来 6 个月的 '收入';包括表格 + 折线图 + 95% 置信区间。

6. 故障排除与优化

症状 -> 操作:

  • 输出过于笼统:添加具体的列、指标、分组级别。
  • 选择了错误的列:使用确切的带引号的列名;可选择列出列名:"首先列出所有列名"。
  • 筛选后行丢失:明确重申筛选逻辑并提及包含/排除(例如,收入 >= 1000)。
  • 日期解析错误:指定目标格式和时区(如果相关)。
  • 意外的聚合:说明期望的函数(求和 vs 平均值 vs 唯一计数)。
  • 在大文件上运行缓慢:首先请求模式摘要;然后分步运行转换。
  • 公式计算错误:提供明确的公式括号和期望的格式。
  • 图表不符合预期:定义图表类型、坐标轴、排序、限制(前 N 名)、标题以及是否包含图例。
  • 需要撤销:使用 "使用原始数据(忽略先前的修改)" 重新运行。

优化循环模板

  1. 初始概览:"提供列列表和行数;暂不更改。"
  2. 聚焦:"基于 '客户 ID' 移除重复项;显示移除的数量。"
  3. 扩展:"添加 '利润率' 列。"
  4. 可视化:"创建按 '地区' 分类的平均 '利润率' 条形图。"
  5. 润色:"将 '利润率' 格式化为保留一位小数的百分比;降序排序。"

请求解释

添加:"解释步骤" 或 "显示使用的公式" 以验证逻辑。


7. 快速参考备忘单

目标 模板
移除重复项 基于 '[键]' 移除重复项,保留首次出现;输出到新工作表 '[名称]'。
筛选 筛选 '[列]' > / < / = / IN (...) 等条件的行;输出筛选后的工作表。
聚合 按 '[分组1]' 和 '[分组2]' 汇总 '[值]',按总和降序排序。
添加指标 添加列 '[新列]' = ([A]-[B])/[A]*100,格式化为保留一位小数的百分比。
清理日期 将 '[日期]' 标准化为 YYYY-MM-DD。
数据透视 数据透视:按行 '[行维度]'、列 '[列维度]' 汇总 '[值]'。
预测 使用线性回归 + 置信区间预测 '[指标]' 未来 N 个周期的值。
图表 创建 [条形/折线/饼图/散点] 图,x='[X]' y='[Y]',降序排序,前 N=10,新工作表 'Charts'。
异常值 使用 z-score > 3 检测 '[指标]' 中的异常值,仅列出相关行。
合并文件 合并所有上传的文件;从文件名添加 '[来源]' 列;对齐列。

8. 最终提示

  • 首先要明确;一旦掌握了模式,就可以追求简洁。
  • 用引号括起列名以避免歧义。
  • 仅组合逻辑上连续的步骤。
  • 在审计关键财务或合规相关数据时,请求解释。
  • 迭代:概览 -> 定向转换 -> 丰富 -> 可视化 -> 格式化。

需要灵感?重温入门指南中的领域用例。准备好练习了吗?在您的下一个数据集上尝试一个三步链式操作。

有反馈或顽固的命令?请通过 support@kyou.ltd 联系我们。您的改进有助于提升 AI。


9. 您的第一个练习命令

上传最近的销售导出文件,然后运行:

基于 '订单 ID' 移除重复项;用中位数填充缺失的 '单位成本';添加 '毛利率 %'=(收入-成本)/收入*100,格式化为保留一位小数的百分比;创建按 '地区' 分类的平均 '毛利率 %' 条形图,降序排序;将图表放置在新工作表 'Charts' 中。

从那里开始优化——您现在正像高级用户一样编写命令。