如何使用.SD在data.table包

InfoWorld的|2019年7月18日

了解如何使用特殊符号.SD在R data.table包。

版权所有©2019足球竞彩网下载

你好。我莎朗马克利斯在IDG通信,这里做一集31多与R:在data.table包的点SD符号。
对于一些数据。表用户,点- sd有点神秘。但数据。这个表格的设计者Matt Dowle告诉我,其实它很简单:只要把它想象成一个代表“每一组”的符号。让我给你举几个例子。
我从波士顿地区的自行车共享系统每天骑自行车旅行的数据集。如果您想跟着一起,在InfoWorld的相关物品具有数据。
我会加载data.table和使用data.table的FREAD()函数汇入我的CSV文件。在这里,我将数据保存到名为mydt的数据表。\
接下来,我将看看第6行,看看有什么数据的模样。我已经得到了日期,用户类型列 - 用户或行程单的客户 - 人次,年数和月份开始日期,以便我可以按月轻松小计。
这是第一个例子马特建议:打印的用户类型分组的数据表的前几行。(我们正在筛选的第12行只是为了更容易地看到输出)。
print()遍历每个组并分别打印两个时间,每个用户类型一次。但问题是,我不知道哪个是customer用户组,哪个是subscriber用户组。“by”栏不能打印出来。马特给我演示了一个小技巧。
如果你熟悉data.table语法,有三个部分的括号标记的数据表名称后:I,J,和。我是用于过滤行,J是你想要做什么,以及你是怎么想将数据分组。
见第4行的代码?我只是把花括号围绕“J”的一部分。这是怎么回事,让我补充一点,“J”部分内多个存在的R表达式。如果我现在运行它,它和以前一样。仍然没有用户类型名称。
但现在看我加入将R声明(当然,马特告诉我要补充)第6行:打印(。经)。。通过它包含了很多由值的特殊符号data.table - 什么一列或多列,我通过分组。
如果我运行这段代码我现在有每个分组变量的名称与打印输出一起。
所以这是一个非常简单的例子。我猜你可能想要做一些更有趣的与.SD比打印,虽然。接下来我们来看看这一天有每个月的大部分行程。
的代码,第一行已说明了一切。在括号中的“I”的第一个参数是过滤任何行,其中年份是2019年的一个J参数是最有趣的部分。想点SD为是指每个组的数据。或者像马特说,“你通过做学家就像一个for循环“。让我们来运行该代码。
有趣。每一个最大的用户。接下来的代码行让我看看这一天有大部分由每个用户类型每个月人次。见我的,不只是一个有两个列。
有一对夫妇的方式来表达的多个列中data.table分组。而且,你还可以做围绕每个列名引号传统的基础R载体。的代码,第三线是一样的第二个。
这是它为这个情节,感谢收看!对于以上R提示,头向做多有R在页面去点InfoWorld的点com削减更多的与R,除了R.全部小写
您还可以找到做多配合YouTube IDG技术讲座槽R播放列表。
期待您的下一集!
流行
来自IDG.tv的特色视频