%标准化NA.省略(df)删除缺失值适合模型我们删除性别,因为它是我们的变量”“预测”ReDigDATA(“工资待遇“)newdata knitr::kible(newdata,数字=2)工资年龄出生季生活满意度隐瞒调整容忍度”>

提取机器学习模型可视化数据的参考网格

6月24日,二千零一十八
通过

(本文首次发表于 多米尼克·马科夫斯基,请并对 188bet appR博客)

有时,为了可视化的目的,我们希望提取数据集的引用网格。此参考网格通常包含等距的目标变量,以及所有其他变量”固定”按照他们的意思,中位数或参考水平。这个重装心理包裹就是为了这样。

模型

让我们建立一个复杂的机器学习模型(一个神经网络)来预测性别(成为男人的概率,由于女性在这里,我们的参与者的参考水平(具有数据框架的所有变量)。

devtools::安装\u github(“神经心理学/心理学R“)如果需要,安装最新的心理版本

加载包
图书馆()时髦诗
图书馆()插入符号
图书馆()心理

输入数据
测向 <- 心理::情感的 %>% 
  标准化() %>%  标准化
  内奥米特()测向  删除缺少的值

拟合模型
模型 <- 插入符号::火车()性别 ~ .,请,请
                      数据=测向,请,请
                      方法 = 他说:“这是一个很好的选择。”“新英格兰”他说:“这是一个很好的选择。”
瓦利姆()模型,请,请 规模 = 真的
## nnet variable importance## ##                    Overall## Salary2000+        100.000## Concealing          48.761## Adjusting           46.198## Birth_SeasonSpring  39.289## Life_Satisfaction   22.567## Salary<2000          9.176## Birth_SeasonSummer   8.863## Birth_SeasonWinter   6.624## Tolerating           5.686## Age                  0.000

似乎较高的薪金类别(>2000欧元/月)是模型中最重要的变量,其次是隐藏和调整人格特征。有趣的是,但对于这些变量和我们的结果之间的实际关系,金宝搏网址它说了什么呢?是吗?

简单

为了形象化工资的影响,我们可以提取一个参考数据,其中所有工资水平和所有其他变量都固定在其平均水平上。

新数据 <- 测向 %>% 
  选择()-性别 %>%  我们删除性别,因为它是我们的变量”“预测”他说:“这是一个很好的选择。”
  重装()他说:“这是一个很好的选择。”工资待遇“他说:“这是一个很好的选择。”
新数据
骑士::卡伯()新数据,请,请 数字=
薪水 年龄 出生季节 生活满意度 隐藏 调整 耐受性
<1000 零点一一 坠落 -0.01 零点零三 -0.02
< 2000 零点一一 坠落 -0.01 零点零三 -0.02
2000年以上 零点一一 坠落 -0.01 零点零三 -0.02

我们可以从这个最小的数据集上的模型进行预测,并将其可视化。

预测 <- 预测()模型,请,请 新数据,请,请 类型 = 他说:“这是一个很好的选择。”箴言他说:“这是一个很好的选择。”
新数据 <- cBN()新数据,请,请 预测

新数据 %>% 
  G曲线图()俄歇电子能谱()X=薪水,请,请 Y=,请,请 =1个 +
  风水线() +
  经典之作() +
  YLAB()他说:“这是一个很好的选择。”成为男人的可能性”他说:“这是一个很好的选择。”

好,男性似乎更多地出现在工资等级较低和较高的类别中(至少,这就是模型学到的东西)。

多个目标

这与隐藏的性格特征有什么关系?是吗?

新数据 <- 测向 %>% 
  选择()-性别 %>% 
  重装()C()他说:“这是一个很好的选择。”工资待遇“他说:“这是一个很好的选择。”,请,请 他说:“这是一个很好的选择。”隐匿他说:“这是一个很好的选择。”  我们可以分离多个目标
新数据
骑士::卡伯()()新数据,请,请 5个),,请 数字=
薪水 隐藏 年龄 出生季节 生活满意度 调整 耐受性
<1000 -2.52页 零点一一 坠落 -0.01 零点零三 -0.02
< 2000 -2.52页 零点一一 坠落 -0.01 零点零三 -0.02
2000年以上 -2.52页 零点一一 坠落 -0.01 零点零三 -0.02
<1000 -1.99美元 零点一一 坠落 -0.01 零点零三 -0.02
< 2000 -1.99美元 零点一一 坠落 -0.01 零点零三 -0.02

这产生了10个均匀分布的隐藏值(从最小到最大)和“合并“他们拥有各种级别的薪水。

预测 <- 预测()模型,请,请 新数据,请,请 类型 = 他说:“这是一个很好的选择。”箴言他说:“这是一个很好的选择。”
新数据 <- cBN()新数据,请,请 预测

新数据 %>% 
  G曲线图()俄歇电子能谱()X=隐藏,请,请 Y=,请,请 颜色=薪水 +
  风水线() +
  经典之作() +
  YLAB()他说:“这是一个很好的选择。”成为男人的可能性”他说:“这是一个很好的选择。”

这个情节相当难看…

增加长度

新数据 <- 测向 %>% 
  选择()-性别 %>% 
  重装()C()他说:“这是一个很好的选择。”工资待遇“他说:“这是一个很好的选择。”,请,请 他说:“这是一个很好的选择。”隐匿他说:“这是一个很好的选择。”),,请 长度输出=五百  设置扩散数值目标的长度

预测 <- 预测()模型,请,请 新数据,请,请 类型 = 他说:“这是一个很好的选择。”箴言他说:“这是一个很好的选择。”
新数据 <- cBN()新数据,请,请 预测

新数据 %>% 
  G曲线图()俄歇电子能谱()X=隐藏,请,请 Y=,请,请 颜色=薪水 +
  风水线()大小=1个 +
  经典之作() +
  YLAB()他说:“这是一个很好的选择。”成为男人的可能性”他说:“这是一个很好的选择。”

似乎对富人来说,为增加成为男性的可能性而隐藏的侵入性较低。

如何修复(维护)数字变量?是吗?

现在,所有其他变量都固定在平均水平。但当其他变量为低或高时,它们的行为可能会有所不同。

新数据 <- 测向 %>% 
  选择()-性别 %>% 
  重装()C()他说:“这是一个很好的选择。”工资待遇“他说:“这是一个很好的选择。”,请,请 他说:“这是一个很好的选择。”隐匿他说:“这是一个很好的选择。”),,请 长度输出=五百,请,请 数值 = 他说:“这是一个很好的选择。”最小值”他说:“这是一个很好的选择。” %>%  将其他数值变量设置为最小值
  变异()固定的 = 他说:“这是一个很好的选择。”最小值”他说:“这是一个很好的选择。”
新数据最大值 <- 测向 %>% 
  选择()-性别 %>% 
  重装()C()他说:“这是一个很好的选择。”工资待遇“他说:“这是一个很好的选择。”,请,请 他说:“这是一个很好的选择。”隐匿他说:“这是一个很好的选择。”),,请 长度输出=五百,请,请 数值 = 他说:“这是一个很好的选择。”最大值”他说:“这是一个很好的选择。”%>%  将其他数值变量设置为最大值
  变异()固定的 = 他说:“这是一个很好的选择。”最大值”他说:“这是一个很好的选择。”
新数据 <- 圆形()新数据,请,请 新数据最大值

预测 <- 预测()模型,请,请 新数据,请,请 类型 = 他说:“这是一个很好的选择。”箴言他说:“这是一个很好的选择。”
新数据 <- cBN()新数据,请,请 预测

新数据 %>% 
  G曲线图()俄歇电子能谱()X=隐藏,请,请 Y=,请,请 颜色=薪水 +
  风水线()大小=1个 +
  经典之作() +
  YLAB()他说:“这是一个很好的选择。”成为男人的可能性”他说:“这是一个很好的选择。” +
  面包()~固定的

当所有变量都很高时,隐瞒与富人的性行为无关。当变量设置为最小值时,两个较低工资级别的隐藏性侵入较高(约1.5)。

参考数据链

假设我们要一个目标长度为500,另一个目标长度为10,我们可以很好地连接重装.

新数据 <- 测向 %>% 
  选择()-性别 %>% 
  重装()C()他说:“这是一个很好的选择。”调整”他说:“这是一个很好的选择。”,请,请 他说:“这是一个很好的选择。”隐匿他说:“这是一个很好的选择。”),,请 长度输出=五百 %>% 
  重装()他说:“这是一个很好的选择。”调整”他说:“这是一个很好的选择。”,请,请 长度输出=,请,请 数值 = 他说:“这是一个很好的选择。”组合“他说:“这是一个很好的选择。”

预测 <- 预测()模型,请,请 新数据,请,请 类型 = 他说:“这是一个很好的选择。”箴言他说:“这是一个很好的选择。”
新数据 <- cBN()新数据,请,请 预测

新数据 %>% 
  变异()调整=AS.系数()()调整,请,请 )) %>% 
  G曲线图()俄歇电子能谱()X=隐藏,请,请 Y=,请,请 阿尔法=调整 +
  风水线()大小=1个 +
  经典之作() +
  YLAB()他说:“这是一个很好的选择。”成为男人的可能性”他说:“这是一个很好的选择。”

隐藏式侵入高度依赖于调节。调整越高(黑线)。为了增加成为男人的可能性,需要少隐藏一些。

观测值组合

让我们通过生成一个包含所有因素组合的参考网格来观察与调整的联系(工资,出生月份等)将数字固定到中位数(我们也可以选择“组合”但它会产生一个非常,非常大的数据帧,具有所有可能的值组合)。

新数据 <- 测向 %>% 
  选择()-性别 %>% 
  重装()他说:“这是一个很好的选择。”调整”他说:“这是一个很好的选择。”,请,请 长度输出=,请,请 因素 = 他说:“这是一个很好的选择。”组合“他说:“这是一个很好的选择。”,请,请 数值 = 他说:“这是一个很好的选择。”中位数他说:“这是一个很好的选择。” 
 
预测 <- 预测()模型,请,请 新数据,请,请 类型 = 他说:“这是一个很好的选择。”箴言他说:“这是一个很好的选择。”
新数据 <- cBN()新数据,请,请 预测

新数据 %>% 
  G曲线图()俄歇电子能谱()X=调整,请,请 Y= +
  地球抖动()大小=1个,请,请 宽度=,请,请 高度 = 零点零一 +
  风水()大小=1个,请,请 东南方=错误的 +
  经典之作() +
  YLAB()他说:“这是一个很好的选择。”成为男人的可能性”他说:“这是一个很好的选择。”

调整越高,男人的可能性越大。但是我们现在要产生更多的观察结果.

新数据 <- 测向 %>% 
  选择()-性别 %>% 
  重装()他说:“这是一个很好的选择。”调整”他说:“这是一个很好的选择。”,请,请 长度输出=一万,请,请 因素 = 他说:“这是一个很好的选择。”组合“他说:“这是一个很好的选择。”,请,请 数值 = 他说:“这是一个很好的选择。”中位数他说:“这是一个很好的选择。” 
 
预测 <- 预测()模型,请,请 新数据,请,请 类型 = 他说:“这是一个很好的选择。”箴言他说:“这是一个很好的选择。”
新数据 <- cBN()新数据,请,请 预测

新数据 %>% 
  G曲线图()俄歇电子能谱()X=调整,请,请 Y= +
  地球抖动()大小=1个,请,请 宽度=,请,请 高度 = 零点零一,请,请 阿尔法=0.2条 +
  风水()大小=1个,请,请 东南方=错误的 +
  经典之作() +
  YLAB()他说:“这是一个很好的选择。”成为男人的可能性”他说:“这是一个很好的选择。”

我们仍然可以看到,他说:“这是一个很好的选择。”“幕后”,请不同的因素如何影响这种关系。

信用

这个包裹对你有帮助吗?Don't forget to cite the various packages you used 🙂

你可以引用心理如下:

贡献

心理是一个年轻的包裹,仍然需要一些爱。因此,如果你有什么建议,意见等,我们鼓励您通过打开问题,请或者更好,试着自己实施它们贡献到代码。

以前的blogposts

留下评论作者,请关注他们博客上的链接和评论: 多米尼克·马科夫斯基.

188bet appr-bloggers.com网站提供 每日电子邮件更新金宝搏网址 R新闻与 教程关于以下主题: 数据科学,请,请 大数据,,请 R作业,请可视化( GGPROTT2,请,请 箱形图,请,请 地图,请,请 动画),程序设计( RSTUDIO公司,请,请 斯威夫特,请,请 乳胶,请,请 SQL,请,请 日食,请,请 吉特,请,请 Hadoop公司,请,请 刮网)统计数据( 回归,请,请 主成分分析,请,请 时间序列,请,请 交易)等等…



如果你走这么远,为什么不 订阅更新 从站点?选择您的口味: 电子邮件,请,请 推特,请,请 1188bet app,请或 脸谱网

注释已关闭。

搜索R-Blo188bet appggers


赞助商

千万不要错过更新!你说什么?
订阅R-Bloggers188bet app接收
最新R帖子的电子邮件。
(您将不再看到此消息。)

单击此处关闭(此弹出窗口将不再出现)