一个整齐地块中的11264次回归

4月27日,二千零一十九
通过

(本文首次发表于 会计和数据科学书呆子角,并对 188bet appR博主

跟进最近的博客文章讨论了如何使用R来探索研究者的自由度,本文介绍了规范曲线图,如Simonsohn西蒙斯和纳尔逊.有了这个情节,你可以关注研究者的不同自由度如何影响你的主要兴趣结果。

在最近的一篇文章中,我介绍了我的开发中的R包RDFAYAYLSIS它提供了一个编码环境,允许研究人员指定他们的研究人员自由度。事前并系统地探讨它们对研究结果的影响。事后的.利用健康经济学和人口统计学(国民收入与预期寿命的关联)中的一个突出主题,我确定了一组七个研究设计选择,这些选择组合描述了11264种不同的模型规范,被称为研究者自由度。

“RDFanayLSIS”软件包允许系统地用尽所有这些选择,并生成大量估计。现在的一个关键挑战是让所有这些相关的发现都能被读者理解。虽然该包提供了“向下钻取”数据的绘图,它没有提供快速的“一站式”视觉效果。

在他们工作文件,SimonsohnSimmons和Nelson提出了一个规范曲线图,在我看来,它提供了一个很好的视觉效果来观察生成的估计的方差。新实现的功能绘制曲线图生成基于“ggplot”的方法变体。见下文:

devtools::install_github(“joachim gassen/rdfanalysis”)library(rdfanalysis)load(url(“https://joachim gassen.github.io/data/rdf-ests.rdata”))plot_rdf-spec_curve(ests,“EST”“LB”,“UB”

显示研究人员自由度的规格曲线“width=”450“/>

图1:国民收入增长10%对年预期寿命的影响:
显示研究人员自由度的规格曲线

图的顶部显示估计值的范围及其置信区间。估计数衡量了国民收入增长10%与国民出生时平均预期寿命(以年计)之间的关系。你可以看到一个相对广泛的估计范围(从-0.22到0.73年),其中大多数(80.0%,蓝色表示)明显阳性。这一发现与国民收入对预期寿命的积极影响是一致的。

在底部,您可以快速了解哪些设计选择对结果的大小有影响:它是金宝搏网址包含的控制变量列表,模型规范(关于因变量和自变量的对数转换)以及固定效应结构。另一方面,异常值及其处理似乎对研究结果的影响有限,自然地,标准误差的聚类只影响置信区间,而不影响估计值。固定效应结构和控制变量具有影响的事实清楚地表明了国民收入的内生性,并应提醒读者不要以因果的方式解释分析结果。

看到我以前的职位关于这个案例的更多细节以及如何深入研究这些发现。在开发中随意使用“RDFanalysis”包在你自己的项目中耗尽研究者的自由度。如果你对这个项目有意见,金宝搏网址我很想听到你的消息。使用下面的评论部分或通过电子邮件推特.

享受!

留下评论作者,请关注他们博客上的链接和评论: 会计和数据科学书呆子角.

188bet appR博客提供 每日电子邮件更新金宝搏网址 R新闻与 教程关于以下主题: 数据科学大数据, r作业,可视化(可视化) GGPROTT2箱形图地图动画)程序设计(程序) 演播室斯威夫特乳胶SQL日食吉特哈多普刮网)统计 回归主成分分析时间序列交易还有更多…



如果你走这么远,为什么不 订阅更新 从站点?选择您的口味: 电子邮件推特1188bet app,或 脸谱网

注释已关闭。

搜索R-Blo188bet appggers


赞助商

千万不要错过更新!
订阅R-Bloggers188bet app接收
最新R帖子的电子邮件。
(您将不再看到此消息。)

单击此处关闭(此弹出窗口将不再出现)