===== 什么是数据集 ===== 任何一份报表的背后,都关联着一个数据集。数据集是 PowerBI 后台关联的数据集合,或者您自己引入的一个数据源(这在后续的培训中会介绍),在这个数据集合的基础上,我们可通过拖拉的方式,把想要的数据通过一定的可视化组件展现出来。对于区域高频的数据处理的用户,我们均开放了数据集的权限供大家获取相关数据。使用数据集而不是将数据下载到 Excel 加工的好处是,可以: * 利用总部做好的指标直接展示数据 * 能选择关键字段,显示关键信息 * 可按自己的需求、格式展示所需数据 本章教程通过对几个关键的数据集的使用,帮助大家了解最基本的可视化效果的实现,以及常用的数据集所涉及到的字段和指标。 ===== PowerBI 工作环境 ===== 在正式利用数据集获取数据之前,我们先熟悉一下 PowerBI 网页端服务的工作环境: === PowerBI 主页 === 倘若我们通过微软的官方网址: [[https://app.powerbi.cn/]] 访问 PowerBI,登录后将看到如下页面而不是达能预先定制好的导航页面: * {{:bi:3.自助分析:dataset_in_pbi_001.png?600|}} 这个页面主要需要介绍三个按钮,其他地方则望文生义即可: - 通过此按钮,展开或收起左边的导航栏 \\ - 通过此按钮,做一些基础性的设置,如更改界面语言等: \\ {{:bi:3.自助分析:dataset_in_pbi_002.png?600|}} \\ - 通过这里选择不同的工作区 === PowerBI 相关术语 === **工作区**,是与同事协作和创建仪表板、报表、数据集和分页报表的集合的地方。目前我们对销售的数据,将开放 SALES_REPORTSALES_CUBE 两个工作区,分别用于固定格式报表与综合的Cube数据的访问。 对于 Power BI 用户,一个工作区由五个构建基块分别为:数据集可视化效果报表仪表板应用。 它们有时也称为 Power BI 内容。 这些内容都包含于位于工作区中: * {{:bi:3.自助分析:pasted:20211028-153257.png?40|}} **数据集**是数据容器。Power BI 用来创建可视化效果的数据集合数据集是导入或连接到的数据集合。 通过 Power BI,你可以连接到并导入各种类型的数据集并将它们组合在一起。 数据集还可从数据流中获取数据。 * {{:bi:3.自助分析:pasted:20211028-152924.png?40|}} **可视化效果**(或**视觉对象**)是由 Power BI 设计人员生成的一种图表。视觉对象显示报表和数据集中的数据。 * {{:bi:3.自助分析:pasted:20211028-153412.png?40|}} **报表**由一个或多个报表页的交互式视觉对象、文本和图形组成。Power BI 是在一个数据集的基础之上生成报表。 * {{:bi:3.自助分析:pasted:20211028-153350.png?40|}} **仪表板**是一个包含交互式视觉对象、文本和图形的屏幕。 仪表板在一个屏幕上收集最重要的指标,以便呈现某个事实或回答某个问题。仪表板内容来自一个或多个报表以及一个或多个数据集。 * {{:bi:3.自助分析:pasted:20211028-153516.png?40|}} **应用**是设计人员捆绑和共享相关仪表板和报表的一种方式。 企业用户自动接收某些应用,亦可搜索由同事或社区创建的其他应用。 典型工作流包含所有构建基块:用户从数据集收集数据,将数据引入 Power BI 以供分析,创建满是突出显示相关事实和见解的可视化效果的报表,将可视化效果从报表固定到仪表板,并共享报表和仪表板: * {{:bi:3.自助分析:pasted:20211028-153257.png?40|}} --> {{:bi:3.自助分析:pasted:20211028-152924.png?40|}} --> {{:bi:3.自助分析:pasted:20211028-153412.png?40|}} --> {{:bi:3.自助分析:pasted:20211028-153350.png?40|}} --> {{:bi:3.自助分析:pasted:20211028-153516.png?40|}} ===== 如何使用数据集 ===== 我们可以通过 PowerBI 页面左边导航栏的创建按钮,访问到所需要的数据集: === 打开数据集 === 可以从以下两个入口选择目标数据集并创建报表: **入口一:** - 左边导航栏中选择+创建 \\ \\ - 跳出提示框中选择,进入我的工作区内创建空白报表 \\ {{:bi:3.自助分析:pasted:20211126-165545.png?600|}} \\ \\ - 在创建报表页面选择选取已发布的数据集 (//手动添加数据集将在后续培训中讲解//) \\ {{:bi:3.自助分析:pasted:20211126-165640.png?600|}} \\ \\ - 弹出数据集中根据所需主题,选择对应数据集 \\ //例,订单明细,从"订单明细"我们可以看到每个客户的每笔订单的数据,但是我们并不需要使用到每个字段// \\ {{:bi:3.自助分析:pasted:20211126-170427.png?600|}} \\ **入口二:** - 左边导航栏中选择数据集,然后在主体页面选中期望打开的数据集名称 \\ {{:bi:3.自助分析:dataset_in_pbi_006.png?600|}} \\ \\ - 在新打开的页面里,点击可视化此数据里面的从头开始创建以打开空白的数据集 \\ {{:bi:3.自助分析:dataset_in_pbi_007.png?600|}} 以上两个入口,均可让大家能访问到相应的数据集。连接数据集后,进入主体功能页面。如,若打开了订单明细这个数据集,则可以在“报表字段”部分看到“订单明细”可 供拖拉的字段: * {{:bi:3.自助分析:pasted:20211126-165343.png?600|}} \\ 主体功能部分,从左到右分别是 * 导航窗格:这帮助我们选择 PowerBI 的主要功能应用 * 报表画布:这是编辑、展现报表的区域,可以页面的形式分多页展现所需图表 * 筛选器:对报表中的数据做条件过滤,如年份、月份、人员类型等过滤信息 * 可视化组件:这里的按钮决定了您希望在画布中显示什么样的图表,以及调整图表的样式 * 字段:整个数据集可使用的字段。字段根据其属性分门别类,将字段拖入到可视化组件中即可展示数据及图表 事实上,对于前端主页看到的每一份固定格式的 BI 报表,我们都会有一个同名的数据集与之相对应。对于日常的数据跟进,我们的建议是:尽量使用与固定格式报表同名的数据集快速获取数据。因为: * 这些数据集体量较小,能有更快速的数据体验 * 这些数据集比较简单,不会出现混合数据粒度造成的学习成本 * 这些数据集,如考核报表等,已经经过后台的加工处理,省去了大家根据指标定义自己二次加工的过程 === 拖拉数据 === 进入数据集工作页面后,就可以将所需字段拖入画布中,以表格形式展现数据。具体操作有有三种方式: - 直接将字段拉到“画布”中 \\ - 将字段拉到“可视化”的"值"中 \\ - 点击字段前小方块,使其变成 "√"状态 \\ * {{:bi:3.自助分析:pasted:20211126-170605.png?600|}} \\ 默认情况下,直接拖拉数据,数据将以普通表格形式展现。这时候可以看到在“可视化”面板里,“表”这个组件是激活的(凹陷下去),这表示正在用普通表格展示数据: * {{:bi:3.自助分析:dataset_in_pbi_008.png|}} 通过点击不同的可视化组件,可以切换数据的展现形式。在表格形式下,可拖动字段的顺序,改变表格数据列的顺序: * {{:bi:3.自助分析:dataset_in_pbi_009.png|}} === 调整格式 === 在 PowerBI 的“可视化”面板中间,有这样的三个图标,代表三个功能块标签页,{{:bi:3.自助分析:dataset_in_pbi_010.png|}},他们分别是: * {{:bi:3.自助分析:dataset_in_pbi_011.png|}} 字段:这里用以设置、拜访字段的位置和顺序;如透视表行与列的字段,散点图 X/Y 轴分别用哪个字段显示等; * {{:bi:3.自助分析:dataset_in_pbi_012.png|}} 格式:在可视化的组件和字段选择好后,在这个页签对显示的格式和样式做调整,如颜色、字体、条件格式等; * {{:bi:3.自助分析:dataset_in_pbi_013.png|}} 分析:这在少部分可视化组件才会出现,如显示趋势线等; 比如,我们可以通过“格式”标签页,调整表格的表头颜色: - 在“字段”窗格中,拖拉出所需的数据粒度后 \\ {{:bi:3.自助分析:pasted:20211126-190459.png?600|}} \\ \\ - 在“可视化”窗格中,可以将选择好的数据进行调整,包括可视化组件、数据的自定义名称、顺序、样式等 \\ {{:bi:3.自助分析:pasted:20211126-190243.png?600|}} \\ \\ - 点击“格式”页签,找到并展开“列标题”,调整一下字体及背景的颜色 \\ {{:bi:3.自助分析:dataset_in_pbi_014.png|}} \\ \\ 令表头更为明显:\\ {{:bi:3.自助分析:dataset_in_pbi_015.png|}} === 保存样式 === 在做好所需图表后,可以将这个报表保存到自己的工作区,下次则可直接打开使用。点击右上角的保存按钮: * {{:bi:3.自助分析:dataset_in_pbi_017.png?600|}} 报表则可保存到您自己的工作区中,供下次打开使用: * {{:bi:3.自助分析:dataset_in_pbi_019.png?600|}} 接下来我们将通过两个案例了解数据集的应用。 === 数据集应用一:重组晨会表 === 在实际操作中,许多办事处同事都会把晨会报表中的数据下载成 Excel,然后挑选区域当前重点跟踪的指标,重新组织安排后再分发到办事处群里。现在,我们可以通过直接访问这个数据集,重组一份自己的报表: * step 1:找到并连接“晨会报表”数据集 \\ \\ {{:bi:3.自助分析:pasted:20211130-151425.png?600}} \\ \\ * step 2:查看“晨会报表”内的字段 \\ \\ {{:bi:3.自助分析:pasted:20211206-175333.png?600}} \\ \\ 增加“切片器”,对"日期""是否启用""是否虚拟节点"等进行筛选 \\ \\ {{:bi:3.自助分析:pasted:20211206-175208.png?600}} \\ \\ * step 3:在页面中,重组晨会,选取所需字段进行拖拉拽 \\ \\ {{:bi:3.自助分析:pasted:20211206-180324.png?600}} \\ \\ * step 4:保存报告到“我的工作区”,每日打开点击刷新数据即可获取最新数据 \\ \\ {{:bi:3.自助分析:pasted:20211206-172116.png?600}} \\ \\ {{:bi:3.自助分析:pasted:20211206-180435.png?600}} === 数据集应用二:考核报表 === 考核报表亦是一张常用的报表,但上面有很多列。对于不同的人员角色,其考核的指标是不一样的。现在,我们通过连接"销售考核表"数据集,将最核心的考核指标,汇总到一张表里。 例,查看2021年10月业代的销售目标、销售金额及其销售达成率,Top签约目标、Top签约销售金额及其Top签约销售达成率,拜访完成率、拜访成功率等指标: * step 1:新建报表,找到并连接“销售考核表”数据集 \\ \\ {{:bi:3.自助分析:pasted:20211208-181446.png?600|}} \\ \\ * step 2:查看“销售考核表”内的字段,增加“切片器”,对"日期-年月""组织架构层级"等进行筛选 \\ \\ {{:bi:3.自助分析:pasted:20211208-175346.png?400}} \\ \\ * step 3:在页面中,选取所需字段进行拖拉拽 \\ \\ {{:bi:3.自助分析:pasted:20211208-182044.png?600}} \\ \\ * step 4:保存报告到“我的工作区”,每日打开点击刷新数据即可获取最新数据 \\ \\ {{:bi:3.自助分析:pasted:20211208-183801.png?600}} \\ \\ {{:bi:3.自助分析:pasted:20211208-183848.png?600}} **其中需要注意的事项有以下:\\ - 需要对"年月"进行选择"202110" - 仅查看10月数据;\\ - 需要对""组织架构层级"进行选择"片区" - 仅查看业代层级数据;** {{:bi:3.自助分析:pasted:20211208-184158.png?600|}} === 小练习 === 订单明细是我们最常用的数据集之一,大家需要紧密追踪每天订单的进度情况;请使用**订单明细**这个数据集制作一个二维表格,展示您所在团队(By SV)的本月每天的订单完成情况。完成本练习需要注意的有: * 用**矩阵**这个可视化组件显示二维表格; * 订单完成时间是经销商发货确认(批发收货确认)的时间,也是订单最后更新的时间 * 订单的月份最终按确认时间划分,如果需要看下单数量,需选择下单时间 ===== 总结 ===== 本章我们了解了数据集是我们制作报表的基础,日常工作中,可以利用现有的报表背后的数据集,重新定制自己的报表样式。通过对几个重要的数据集的讲解,也了解了在 PowerBI 中制作简单报表并保存的流程。但数据集应用还是有限的,因为数据集的数据范围往往比较单一,往往会缺少一些维度或者其他指标的信息,这时候则需要一个更大、更全面的数据集 -- Cube,来协助做更多的事情。 需要注意的是,因为 Cube 包含了更多的数据,无论是范围还是数据粒度均比普通的数据集大很多,在打开、使用 Cube 时会占用很多的后台计算资源。 因此我们对区域应用的指引是:在现有的数据集能满足需求时,请优先使用数据集而不是 Cube。 ---- [[bi:3.自助分析|<<回到自助分析首页]] \\ [[bi:1.平台概览|<<回到目录]]