熔化并铸造数据的形状。框架–练习

6月22日,二千零一十八
通过

(本文首次发表于 R型练习,并对 188bet appR博主

数据集通常以不同于建模或可视化功能所需的形式送达我们,而建模或可视化功能又不需要相同的格式。

重塑data.frames是所有分析师都需要的一个步骤,但许多分析师都在努力。实践这种元技能,将在长期的结果中,更多的时间集中在实际分析上。

此集合的解决方案将依赖于data.table,主要是melt()和dcast(),它们最初来自reforme2包。然而,你也可以通过你最喜欢的BASE-R训练出来,然后比较结果。

解决方案可用在这里.

练习1

采用以下数据.frame这种形式

df<-data.frame(id=1:2,Q1= C(“A,“B“)Q2= C(“C”,“A)stringsasFactors=false)df id q1 q21 1 a c2 2 b a


ID问题值1 1 Q1 A2 2 Q1 B3 1 Q2 C4 2 Q2 A

练习2

做相反的事情;将data.frame返回到其原始表单。

练习3

根据问题设置data.frame。如:

问题ID_1 ID_21 q1 a b2 q2 c a

练习4

这个data.frame后面的数据输入有点错误。将所有C和B项都放入相应的列中

df2<-data.frame(a=c(“A1”,““A12”,““A31”,““A4”)B= C(“B4”,“C7”,“C3”,“B9”)C=C(“C3”,“B16”,“B3”,“C4”)

练习5

获取此data.frame

df3<-data.frame(join_id=rep(1:3,每个=2)类型=rep(c(“A,“B)3)v2 = c(8,9,7,6,5,4)* 10)

看起来像这样:

加入\u id a_v2 b_v21 1 80 902 2 70 603 3 50 40

练习6

重新访问以前使用的数据集数据探索练习集;;
加载AER包并运行命令数据(“生育能力)它将数据集生育能力加载到您的工作区。
将其熔化为以下格式,每个孩子一行。

头(ferl)morechids年龄远在西班牙裔其他工作母亲身份证订购性别1 no 27 no no 0 1 1 male2 no 30 no 30 no 30 2 1 female3 no 27 no 0 3 1 male4 no 35 yes no 0 4 1 male5 no 30 no 3022号5号1女6号26号40号6号1男

练习7

拿这个

d1=数据帧(id=c(1,1,1,2,2,4,1,2)药物=C(1),2,三,1,2,7,2,8))D1 ID药物1 1 12 1 23 1 34 2 15 2 26 4 77 1 28 2 8

这种形式:

ID医疗1:1 1,2,三,22:2,1,2,83:47分

注意,解决方案不使用melt()或dcast(),所以你可以看看其他的选择。

练习8

得到这个

fs<-data.frame(name=c(rep(“NAME1,3)代表“NAME2,2)MeDeNe= C(“阿替洛尔25mg,“阿司匹林81mg,“西地那非100毫克,“阿替洛尔50mg,“依那普利20mg)dfs名称medname1名称1阿替洛尔25mg2名称1阿司匹林81mg3名称1西地那非100mg4名称2阿替洛尔50mg5名称2依那普利20mg

格式如下:

名称药物\ 1药物\ 2药物\ 31:名称1阿替洛尔25毫克阿司匹林81mg西地那非100毫克2:名称2阿替洛尔50毫克依那普利20毫克

练习9

以标准格式组织以下data.frame

df7<-data.table(v1=c(“NAME1,NAME2,“名字3,“NAME4,NAME5)V2= C(“1,2“,“3“,“4,5“)V3= C(1)2,3))DF7 v1 v2 v31:名称1,NAME2 1,2 12:姓名3 23:姓名4,NAME5 4,5 3

预期输出:

v1 v2 v31:名称1 1 12:名称2 13:名称3 3 24:名称4 4 35:名称5 5 3

该解决方案既不使用melt()也不使用dcast(),而且非常困难。

练习10

转换:

df<-data.frame(方法=c(“10.折叠.cv套索“,“10、折叠。,“比克”,“修正的BIC)n=C(30);30,50,50,50,50,100,100)λ=C(1);三,1,2,2,0,1,2)DF= C(21)17,29,26,25,32,34,32))>df方法n lambda df1 10.fold.cv lasso 30 1 212 10.fold.cv.1se 30 3 173 bic 50 1 294 modified.bic 50 2 265 10.fold.cv lasso 50 2 256 10.fold.cv.1se 50 0 327 bic 100 1 348 modified.bic 100 2 32

进入

方法lambda_30 lambda_50 lambda_100 df_30 df_50 df_1001 10.fold.cv lasso 1 2 21 25 2 10.fold.cv.1se 3 0 17 32 3 bic 1 29 344 modified.bic 2 2 26 32

(图像由乔交替

留下评论作者,请关注他们博客上的链接和评论: R型练习.

188bet appR博客提供 每日电子邮件更新金宝搏网址 R新闻与 教程关于以下主题: 数据科学,, 大数据,, r作业,可视化(可视化) GGPROTT2,, 箱形图,, 地图,, 动画)程序设计(程序) 演播室,, 斯威夫特,, 乳胶,, SQL,, 日食,, 吉特,, 哈多普,, 刮网)统计 回归,, 主成分分析,, 时间序列,, 交易还有更多…



如果你走这么远,为什么不 订阅更新 从站点?选择您的口味: 电子邮件,, 推特,, 1188bet app,或 脸谱网

注释已关闭。

搜索R-Blo188bet appggers


赞助商

千万不要错过更新!!
订阅R-Bloggers188bet app接收
最新R帖子的电子邮件。
(您将不再看到此消息。)

单击此处关闭(此弹出窗口将不再出现)