匡优Excel 命令编写指南
目的
教您如何撰写有效的命令,以便 匡优Excel 能够快速、一致且以最少返工的方式,准确地生成您想要的结果。
为何如此重要
匡优Excel 依赖于您的自然语言指令。模糊或不具体的命令会迫使 AI 进行猜测,从而增加输出不完整、不正确或过于笼统的可能性。清晰的意图 = 更好的电子表格,更快的速度。
1. 命令编写基础
重点关注 4 个支柱:
- 操作:应该做什么?(移除重复项、计算、分组、预测、可视化、提取、格式化)
- 范围:哪些列/行/工作表/文件?使用单引号括起确切的列名。
- 条件:筛选器、阈值、日期范围、业务规则。
- 输出形式:新工作表、覆盖、仅摘要、图表、清理后的文件、添加列等。
优劣对比(核心示例)
目标 | 差(模糊) | 好(具体) | 优点 |
---|---|---|---|
移除重复项 | 修复我的文件 | 基于 '客户 ID' 移除重复项;保留首次出现;输出为新工作表 'Cleaned'。 | 指定了关键列 + 规则 + 输出目标 |
汇总销售额 | 分析数据 | 按 '地区' 和 '季度' 汇总 '销售额';包括总计行并按销售额降序排列。 | 清晰的聚合 + 分组 + 排序 |
排序数据 | 让它更好看 | 按 '日期' 升序排序,然后按 '收入' 降序排序;保留标题行。 | 明确的多级排序 |
添加指标 | 改进文件 | 添加列 '利润率' = (收入 - 成本)/收入 * 100;格式化为保留两位小数的百分比。 | 明确的公式 + 格式化 |
筛选 | 清理它 | 筛选 '收入' > 1000 且 '地区' = '西部' 的行;仅输出筛选后的行。 | 精确的条件 |
图表 | 做个图表 | 创建条形图:x='产品', y='销售额', 降序排序, 标题 '热门产品销售额', 放置在新工作表 'Charts' 中。 | 定义了坐标轴 + 排序 + 元数据 |
简单模式
操作 + 目标列 + 条件 + 转换 + 输出格式
示例:计算过去 90 天内('订单日期' >= 2025-05-28)按 '渠道' 分类的平均 '订单价值';输出汇总表 + 条形图。
2. 提升精度
使用这些措辞技巧:
- 列的特异性:'客户 ID' 而不是 客户id 或 ID(如果可能,匹配大小写)。
- 聚合:求和、平均值、唯一计数、中位数、最小值、最大值、标准差。
- 计算:"添加列 '净值' = 收入 - 成本 - 税金"。
- 时间窗口:过去 30 天、2024-01-01 至 2024-12-31 之间、当前月份。
- 排序:按 '日期' 升序排序,然后按 '销售额' 降序排序。
- 格式化:将 '日期' 格式化为 YYYY-MM,将 '利润率' 格式化为保留一位小数的百分比。
- 输出位置:覆盖当前工作表 / 创建新工作表 'Summary' / 两者都保留。
- 保留:保持原始工作表不变。
- 行数限制:按 '销售额' 显示前 20 名。
3. 高级命令技巧
A. 条件逻辑
示例:
- 筛选 '收入' > 1000 且 '地区' 在 ("西部","北部") 内的行。
- 将 '类别' = '配件' 的 '价格' 列中的空值替换为中位数。
- 标记异常值:添加列 '是否异常值' = 如果 'ZScore' > 3 则为 1,否则为 0。
B. 一次性组合任务
当顺序清晰时,将相关操作链接起来。 示例:清理 '订单' 表,基于 '订单 ID' 移除重复项,用中位数填充缺失的 '成本',添加 '利润率'=(收入-成本)/收入*100,然后创建按 '地区' 分类的平均 '利润率' 条形图。
C. 大型数据集策略
- 开始:提供结构摘要(列、类型、行数)。
- 然后:生成 10 行样本(随机或头部)以确认假设。
- 验证后:执行完整的转换。
- 对繁重任务使用增量命令:(1)清理,(2)添加指标,(3)可视化。
D. 输出管理
指定:"创建新工作表 'Cleaned'"、"替换现有 'Sheet1'"、"将图表添加到新工作表 'Charts'"、"仅返回摘要(无行级导出)"。
E. 请求解释
添加:"解释每一步" 或 "提供公式原理" 以审核转换。
F. 复杂公式
示例:添加列 'LTV' = (平均订单价值 * 购买频率 * 毛利率 %) 在过去 12 个月内按 '客户 ID' 计算;输出按降序排序的客户级表格。
G. 迭代优化
- 首先:高层级摘要。
- 其次:缩小范围(例如,仅 '地区'='西部')。
- 然后:添加指标/视觉效果。
- 最后:可视化。
H. 合并文件
"合并上传的月度文件;从文件名(YYYY-MM)中添加 '月份';将所有文件连接成一个表;确保列顺序一致;添加总计行。"
I. 数据质量检查
"列出缺失值超过 10% 的列;建议填充方法;暂时不要修改。"
4. 常用命令模板
复制、修改并运行。替换括号内的项目。
清理与准备
- 基于 '[主键]' 移除重复项,保留第一个。
- 将 '[日期列]' 的日期格式标准化为 YYYY-MM-DD。
- 用中位数填充 '[列]' 中的缺失值。
- 将 '[全名]' 拆分为 '姓' 和 '名'。
- 清除所有文本列的前后空格。
- 使用 z-score > 3 检测 '[指标]' 中的异常值并列出受影响的行。
转换
- 添加列 '[新指标]' = ([分子] - [分母]) / [分子] * 100,格式化为百分比。
- 数据透视:按 '[行维度]' 和 '[列维度]' 汇总 '[值]'。
- 取消数据透视:将 '[一月]'..'[十二月]' 列转换为 '月份','值'。
分析
- 描述性统计:计算 ['列1','列2'] 的平均值、中位数、最小值、最大值、标准差。
- '[变量 A]' 和 '[变量 B]' 之间的相关性及解释。
- 趋势:绘制 '[指标]' 随 '[日期]' 的变化图,并计算周期性增长。
- 使用线性回归预测 '[指标]' 未来 6 个周期的值;包括置信区间。
可视化
- 条形图:x='[类别]', y='[值]',降序排序。
- 折线图:x='[日期]', y='[指标]',移动平均窗口为 7。
- 饼图:按 '[值]' 显示 '[类别]' 的份额。
- 散点图:'[X]' vs '[Y]',添加回归线 + 相关性。
商业智能
- KPI 摘要:计算收入、成本、利润 = 收入 - 成本、利润率 %。
- 按 '注册月份' 进行同期群分析,显示 0-6 个月的留存率。
- 假设分析:将 '[价格]' 提高 10% 并重新计算 '利润';汇总差异。
多文件操作
- 合并所有上传的文件;添加 '源文件' 列;按标题名称对齐列。
- 追加文件,然后基于 '[ID]' 移除重复项。
格式化与输出
- 将 '[货币列]' 格式化为保留两位小数的美元货币。
- 按 '[日期]' 升序排序,然后按 '[收入]' 降序排序。
- 仅使用聚合表创建新工作表 'Summary'。
- 保留原始工作表;将转换后的数据放在 'Cleaned' 中。
审计与质检
- 清理后显示 10 个随机行以供审查。
- 列出缺失值 >5% 的列;提出填充策略。
5. 优劣命令展示(按场景)
场景 | 差 | 改进 | 最佳 |
---|---|---|---|
清理 | 修复这个 | 移除重复项 | 基于 '订单 ID' 移除重复项,用中位数填充空的 '成本',将 '日期' 标准化为 YYYY-MM-DD,输出到新工作表 'Cleaned'。 |
分析 | 分析销售额 | 汇总销售额 | 按 '地区' 和 '季度' 汇总 '销售额';包括与上一季度的增长,并按 '销售额' 降序排序。 |
可视化 | 做个图表 | 产品条形图 | 条形图:x='产品', y='销售额', 仅前 15 名, 降序排序, 标题 '前 15 名产品', 新工作表 'Charts'。 |
商业智能 | 预测 | 预测收入 | 使用线性回归预测未来 6 个月的 '收入';包括表格 + 折线图 + 95% 置信区间。 |
6. 故障排除与优化
症状 -> 操作:
- 输出过于笼统:添加具体的列、指标、分组级别。
- 选择了错误的列:使用确切的带引号的列名;可选择列出列名:"首先列出所有列名"。
- 筛选后行丢失:明确重申筛选逻辑并提及包含/排除(例如,收入 >= 1000)。
- 日期解析错误:指定目标格式和时区(如果相关)。
- 意外的聚合:说明期望的函数(求和 vs 平均值 vs 唯一计数)。
- 在大文件上运行缓慢:首先请求模式摘要;然后分步运行转换。
- 公式计算错误:提供明确的公式括号和期望的格式。
- 图表不符合预期:定义图表类型、坐标轴、排序、限制(前 N 名)、标题以及是否包含图例。
- 需要撤销:使用 "使用原始数据(忽略先前的修改)" 重新运行。
优化循环模板
- 初始概览:"提供列列表和行数;暂不更改。"
- 聚焦:"基于 '客户 ID' 移除重复项;显示移除的数量。"
- 扩展:"添加 '利润率' 列。"
- 可视化:"创建按 '地区' 分类的平均 '利润率' 条形图。"
- 润色:"将 '利润率' 格式化为保留一位小数的百分比;降序排序。"
请求解释
添加:"解释步骤" 或 "显示使用的公式" 以验证逻辑。
7. 快速参考备忘单
目标 | 模板 |
---|---|
移除重复项 | 基于 '[键]' 移除重复项,保留首次出现;输出到新工作表 '[名称]'。 |
筛选 | 筛选 '[列]' > / < / = / IN (...) 等条件的行;输出筛选后的工作表。 |
聚合 | 按 '[分组1]' 和 '[分组2]' 汇总 '[值]',按总和降序排序。 |
添加指标 | 添加列 '[新列]' = ([A]-[B])/[A]*100,格式化为保留一位小数的百分比。 |
清理日期 | 将 '[日期]' 标准化为 YYYY-MM-DD。 |
数据透视 | 数据透视:按行 '[行维度]'、列 '[列维度]' 汇总 '[值]'。 |
预测 | 使用线性回归 + 置信区间预测 '[指标]' 未来 N 个周期的值。 |
图表 | 创建 [条形/折线/饼图/散点] 图,x='[X]' y='[Y]',降序排序,前 N=10,新工作表 'Charts'。 |
异常值 | 使用 z-score > 3 检测 '[指标]' 中的异常值,仅列出相关行。 |
合并文件 | 合并所有上传的文件;从文件名添加 '[来源]' 列;对齐列。 |
8. 最终提示
- 首先要明确;一旦掌握了模式,就可以追求简洁。
- 用引号括起列名以避免歧义。
- 仅组合逻辑上连续的步骤。
- 在审计关键财务或合规相关数据时,请求解释。
- 迭代:概览 -> 定向转换 -> 丰富 -> 可视化 -> 格式化。
需要灵感?重温入门指南中的领域用例。准备好练习了吗?在您的下一个数据集上尝试一个三步链式操作。
有反馈或顽固的命令?请通过 support@kyou.ltd 联系我们。您的改进有助于提升 AI。
9. 您的第一个练习命令
上传最近的销售导出文件,然后运行:
基于 '订单 ID' 移除重复项;用中位数填充缺失的 '单位成本';添加 '毛利率 %'=(收入-成本)/收入*100,格式化为保留一位小数的百分比;创建按 '地区' 分类的平均 '毛利率 %' 条形图,降序排序;将图表放置在新工作表 'Charts' 中。
从那里开始优化——您现在正像高级用户一样编写命令。