Copilot 对话分析功能介绍
基本用途: 用户可以先选择一个数据集,并围绕该数据集的相关信息与 Copilot 进行对话。将通过表格、折线图等形式展示相关的分析数据
功能介绍和基本使用 :详见 ++DataEase V2 Copilot 功能介绍++
v2.9.0 中采用的模型:通义千问
备注:在 v2.9.0 中,暂不能使用跨源数据集,社区用户每天限制提问 100 次,企业版用户不限制次数。
提问技巧
-
字段有备注的表回答的会比较准确
-
提问时,尽量指定好返回的类型,比如金额总表,店铺金额对比,用途金额对比,店铺金额占比等,日期金额趋势等,对比->柱状图,占比->饼图,趋势->折线图,表-> 表格
-
提问的字段可用中文命名,如为英文字段时描述需要准确些
-
提问时,问题描述应清晰,如"年份为 2024 时,销售金额的总和"
-
模型会解析用户提问的字段和采用图表类型,分析后转义为 SQL 进而生成图表,可根据这个特点进行提问,如分组、求和、总计、做一个饼图、表格等字眼,能更好地生成图表
6.把一个复杂的问题拆解,如要做一个饼图表示占比信息,直接说 "要 A 的比" 时,生成的效果可能不太好,模型未理解你想表达的意思。可采用 "给出 A 字段中各部分的占比情况,绘制一个饼图"
提问示例
以官方 「茶饮原料费用」 数据集为例,数据集结构:
汇总表:给出各个店铺里面,金额的总和
结果:
明细表:给出店铺为欢果店时,每个日期下的金额明细
结果:
饼图提问:给出店铺的金额占比情况,不需要添加后缀
结果:
折线图提问:给出店铺为乐园店,各个日期的金额增长趋势,绘制折线图
结果:
柱状图提问:店铺为乐园店,给出每个日期下的金额情况,绘制柱状图
结果:
多条件复杂提问,问题要清晰,表达简洁,踩中要点,以 「茶饮订单明细」 为例:
提问:时间在 2024 年 3 月 2 日到 3 月 8 日,店铺为香橙店,菜品名称是超大酷柠,温度是冷,给出菜品名称和销售数量的明细
结果:
常用助词,隔开各个指标,有助于准确度的提升:A "的" B,"根据","在...中","按照","在",A "是" A1,"实现" ,"分组","求和","绘制","以","为","和","或者",A "到" B 等
提示:按照 sql 生成、字段解析和模型使用的角度,来构建提问会有很好的效果,如 select * from A,翻译过来就是「给出所有的字段的明细」。