免费数据可视化与Microsoft Power BI:您的一步一步的指南

在这个视频教程中,我们将向您展示如何分析一个文件,其中有超过200万条美国航空公司航班延误记录。

123.4. 页3.
第3页,共4页

过滤数据

当我在3月开始使用Power BI时,主要缺点是您无法将文本搜索框添加到报告,表或Sliacer。如果您正在分析具有许多不同类别的信息,例如美国航班数据,则必须令人讨厌地滚动数百个城市以订单,例如查找圣路易斯。

截至6月30 Power BI Desktop软件更新,您可以将文本可搜索的Sliarer添加到您的报告中,使其更容易磨碎一项百分之一(或数千个)。更多关于这一点。但是,您也可以知道列表中只有几个感兴趣的兴趣,并且您希望使用数据的子集创建一个报告。

一种方法是将报告过滤为几个关键类别——在本例中,可能只显示一些已知感兴趣的城市,例如您的公司在哪里设有办事处。

为此,单击画布上的一个空白区域,然后将DEST_CITY_NAME拖到Report级别过滤器(在这里可以看到“drag data fields here”区域)。选择几个城市。如果你跟上了,我选择了亚特兰大、波士顿、芝加哥、克利夫兰、拉斯维加斯、洛杉矶、新奥尔良、纽约、费城、旧金山、圣何塞、西雅图和华盛顿特区

单击过滤器上的dest_city_name标题以关闭它。然后对Origin_City_Name执行相同的操作 - 将其拖到Dest_City_name过滤器的顶部,然后选择您想要的城市 - 您只需在您的主要城市之间的航班信息。

在这一点上,报告本身可能值得注意的是,目前的数据只针对少数城市。您可以通过单击主页ribbon上的“文本框”按钮向页面添加文本。在画布上按您想要的方式移动和塑造它,然后写一些文本解释报告涵盖哪些城市。

我们现在可以通过添加两个切片器让用户更容易地选择出发地和目的地城市。点击画布上的一个空白区域,然后点击切片器可视化图标(它看起来像一个小过滤器/漏斗在可视化下的表格图标——在2016年5月版本的Power BI中,它是可视化下最后一个图标中的第三个)。检查ORIGIN_CITY_NAME。现在再次单击画布的空白区域,再次单击切片器图标,然后单击DEST_CITY_NAME。大小和移动的切片围绕画布,因为你喜欢。

如果切片器中仍然有足够多的城市值得添加搜索框,请单击切片器右上角的省略号并选择search。这将为切片器添加一个文本搜索框。

Microsoft Power BI新切片器搜索

向切片机添加搜索框。

如果文本有点小,难以阅读,单击每个切片器,然后单击笔刷图标,并在项目下选择一个新的文本大小。就像图形一样,您可以更改标题并单击字段来重命名它们(例如,从ORIGIN_CITY_NAME改为Origin City,从DEST_CITY_NAME改为destination City),并增加Header字体大小。

现在您可能已经看到了首先过滤数据的好处:如果没有页面级别的过滤器,那么每个切片机上将有300多个城市需要滚动。

最后,看到实际航班可能很有意思,而不仅仅是航空公司。将航空公司拖到画布上的空点,然后添加FL_NUM。你会得到一张桌子。添加DEP延迟和arr延迟,然后再次确保从总和到平均值(值下)。重命名fl_num飞行。您可以通过单击CRS_DEP_TIME添加计划的出发时间并将其添加到表中。

现在,当您点击切片机的起源和目的地城市时,您将看到所有可用的航班及其平均到达和出发延迟。如果在图中单击一个航空公司的栏,那么该表将显示该航空公司的航班。

(注意:找不到很容易,但您可以自定义页面上的图形如何相互交互。单击一个图形以激活它;然后在格式的功能区中,选择编辑交互。页面上的其他图形将所有这些都有一些额外的图标:过滤器和横跨斜线的圆圈。单击过滤器意味着图形将根据活动图形中发生的情况而改变;单击斜杠的圆圈意味着它不会。)

自一些不幸的事情以来,也很容易采取相同的图形并决定看看中位数而不是平均值。非常晚期航班可能对整个平均水平产生外部效果。如在Excel中,您可以通过单击带有页面名称(默认值为第1页)的选项卡旁边的加号添加页面到电源BI报告。

更方便的是,因为我们已经设置好了切片器和图形:右键单击页面并复制它。现在很容易点击图表;在“值”部分下,单击“Dep延迟平均值”和“Arr延迟平均值”,并将它们更改为“中值”。如果您遵循下面的步骤,还需要将图表和航班数据表的标题从平均值更改为中值。

所有这些城市的所有航空公司都有0或低于所有这些城市的抵达延迟 - 除了精神之外。当我看看抵达波士顿的航班时,精神的延误看起来更加明显 - 虽然是公平的,但他们可能刚刚在2015年享有了一个糟糕的夏天,从那时起得了一个糟糕的夏天。

014年powerbi spiritbostondelays

显示飞行的图表到达波士顿。

互动的钻取

有兴趣的平均延误如何逐月分解下来?Power BI通过日期字段自动钻取,我们可以通过在新页面上创建新的可视化来查看。

再次右键单击Page 1并复制它,单击图表激活它,然后取消单击Airlines并单击FL_DATE。你只会在图表上看到两个条形图,分别代表到达和离开。

这是因为Power BI默认按年绘制图表,而我们只有一年的数据。在Axis下,您可以单击Year旁边的x来删除它,这样图表将停止每年的聚合(这对该数据有些无用)。它现在默认为Quarter。对于这个特定的4个月数据集来说,这也没什么用,但让我们假设它是。

要启用Power BI的日期向下钻取,请单击图右上方的向下箭头。现在,如果你点击第三季度条,它会向下钻取显示月份。点击一个月的栏,它会放大这个月的天数。

若要返回到更大的时间组,请单击图左上角的向上箭头。注意,当您上下钻取时,您将不再影响页面上的其他视觉效果,因此表上的数据不会改变。

日期字段的日期钻取是自动的,但您可以为任何层次结构设置钻取。激活第一页上的图形,然后将FL_NUM拖到Axis字段上,确保它最终位于Airline下面。除了出现下钻图标外,图形上不会出现任何更改。

单击右上方的向下箭头以激活下钻,单击航空公司的工具条,您将看到该航空公司的各个航班的所有数据。同样,因为下钻是活动的,所以您不会看到表上的任何更改。如果您希望能够在此过程中手动筛选特定航空公司的表,则可以临时添加airline作为页面级筛选器,或者为airline添加第三个切片器。

单击左上角的向上箭头以返回原始图形,再次单击向下箭头以禁用钻取功能(如果仍被选中),图形将像以前一样工作。

如果要在此页面上更改图表的标题,请将图形再次激活,单击可视化面板上的画笔图标,然后单击标题。

对于最后一步,您可能希望将页面选项卡重命名为“第1页”和“第1页的重复”到更有意义的东西。这当前并不像Excel中的方式相同 - 而不是右键单击选项卡,则需要双击选项卡名称。

在Power BI中可以生成更多的可视化。除了可视化面板中的所有图标(包括树图和实际地理图)外,还可以从自定义图像画廊.如果你找到一个你喜欢的,从图库下载它,然后在可视化面板中使用最后一个图标旁边的省略号导入它。您必须将它单独导入到任何您想要使用它的报告中。(你可以找到一个最近由微软研究院创建的自定义视觉效果的例子在这里.)

有许多其他方法可以可视化这些数据,例如查看带有延迟原因的列,但现在我将继续讨论。

(继续下一个页面

相关:
123.4. 页3.
第3页,共4页
SD-WAN买家指南:向供应商(和您自己)提出的关键问题