你好。我莎朗马克利斯在IDG通信,这里做一集30多与R:一个月比一个月和去年同期相比,年计算。
如果你要分析,如“上个月VS前一个月”或修改“上个月VS同一个月去年同期,” R是一个不错的选择。这很容易做到这些计算。而且,你不必担心电子表格公式是否正确点击,拖动到覆盖所有你所需要的细胞。
像R中这么多东西,有多种方法可以做到这一点。我会告诉你一对夫妇。
首先,我将进口约上Bluebikes,在波士顿,剑桥自行车共享系统每天骑自行车旅行,和3个附近城市的一些数据。如果你想跟着一起,在InfoWorld的相关文章有数据。
我最初的行程中都会有一些额外的步骤,所以你可以看到发生了什么事情。
第一个代码块添加一个新列的数据,称为YearMonth。它使用基础R的格式()函数;和它会为每个行程开始日期一个YYYY-MM格式。接下来是一个典型的dplyr GROUP_BY和总结。在这种情况下,我被YearMonth分组,然后各组内,创建一个名为列那MonthlyTrips拥有该月的所有行程的总和。确保最后,我让数据通过YearMonth安排。
现在,我已经得到了每月汇总,我会计算使用dplyr的滞后()函数一个月比一个月和去年同期相比的增减幅度。滞后()默认为“如当前排序在数据帧列中的前一个值。”你可以变回要滞后所以它超过1回的项目数。与前一个月相比,1默认是好的。与上年同期比较,我会想滞后是12,12项背。请注意,这只是如果没有任何遗漏个月的工作。你可能想在添加一些代码,以确保这一点。
你也可以选择你想要的列设置为秩序,如果数据不是由列排序滞后。(我并不需要在这种情况下,因为我的数据是由YearMonth已订购。)
所有的数据都在这里,虽然格式可以更好。由100此代码相乘的部分,创建%的格式,然后四舍五入为1个小数位。
这是月度报告的最简单的例子 - 每月只有一个数据点。然而,有时候,你有你想要每个月跟踪多个类别,如城市,或年龄组,或客户类型比较。这是很容易调整这个代码,通过除了一个月前,总结您的类别你刚才组。
看到这里,我在做同样的事情,我以前做过,但我也会喜欢比较按月和用户车次类型。有在这组数据两种类型的用户:“用户”和“用户”。我读的数据,加入YearMonth柱子中,YearMonth和用户类型分组,然后做一切像以前一样:每个月内相加之旅,以及安排。你不必按类别以及每月安排,但我觉得它更容易阅读的结果的方式
你看,双方用户的用户类型和客户的用户类型,现在我已经得到了一个月比一个月和去年同期相比比较。
这也可以使用一些数据格式化打开分数为百分数。
现在很容易与GGPLOT2到图表中的数据,因为它是正确的格式。我会加载库和创建图形。
如果你只需要“上个月”的报告,使用dplyr的过滤器()函数和YearMonth列设置为任何相等的最大值是数据。
周周上略有不同。对于这一点,我一般采用“星期开始日期”,而不是像去年连字符周数的格式。当有在岁月的开始和结束部分周周数可能很复杂
对于每周报告,我将使用lubridate包及其floor_date()函数。您还可以使用基础R的cut.Date()函数,但是这是一个比较复杂一点,因为它返回的因素,而不是日期,所以后来我通常最终会运行额外的代码把他们带回日期。Floor_date()是我想要的一步。
要创建我的“WeekStarting”一栏,我使用floor_date,日期列作为第一个参数,和“周”为我单位。
接下来,通常的计算,这次为期一周的过度周和去年同期。需要注意的是对于去年同期,滞后是52而不是12,我还需要知道我的数据,而且我已经得到了每周行。
如果你想 - 好吧,这是简单的,但它仍然是一个很多周报告只需键入...做出RStudio代码片段!如果你不知道他们是如何工作的,检查出的做多随着代码片段 - [R插曲。
下面是我对月度报告中提出的片段:
您也可以在相关的文章下载 - URL应该是在屏幕上。如果我打开一个新的R脚本文件并加载片段。我有我的月度报告的脚本模板。我现在可以为每个变量标签。
现在你知道了:一旦它的成立,甚至可能快于Excel中。
这是它为这个情节,感谢收看!对于以上R提示,头向做多有R在页面去点InfoWorld的点com削减更多的与R,全部小写除R
您还可以找到做多配合YouTube IDG技术讲座槽R播放列表。
期待您的下一集!