月度档案:2016年1月

数据清理第1部分-纽约市出租车出行数据,寻找错误背后的故事

1月31日,二千零一十六
通过
数据清理第1部分-纽约市出租车出行数据,寻找错误背后的故事

摘要数据清洗是数据科学项目在现实中一项繁琐而重要的工作,这是我对纽约市出租车出行数据清洗实践的一个探讨,有很多领域的知识。涉及常识和商业思维。

阅读更多

使用rcppnt2计算和

1月31日,二千零一十六
通过
使用rcppnt2计算和

介绍数字模板工具箱(NT2)集合的头只c++库,使得有可能明确地要求使用SIMD指令时,可能的话,当不进行常规的鳞片手术时。NT2本身的动力来自于增强,除了两个提议的Boost库——Boost.Dispatch,它为高效的基于标签的功能调度和boost.simd提供了一种机制,它为实现以下算法提供了一个框架…

阅读更多

把宗教和人口统计联系起来

1月31日,二千零一十六
通过
把宗教和人口统计联系起来

今天我在AriLamstein的博客上发表了第二篇客座文章,在那里我总结了我在ARDA的宗教会众和会员学习的探索。在这篇文章中,我将展示我们如何看待像宗教普查这样的数据集与人口统计数据之间的关系,以获得背景和理解。去那边…

阅读更多

使用rcppnt2计算方差

1月31日,二千零一十六
通过
使用rcppnt2计算方差

介绍数字模板工具箱(NT2)集合的头只c++库,使得有可能明确地要求使用SIMD指令时,可能的话,当不进行常规的鳞片手术时。NT2本身的动力来自于增强,除了两个提议的Boost库——Boost.Dispatch,它为高效的基于标签的功能调度和boost.simd提供了一种机制,它为实现以下算法提供了一个框架…

阅读更多

RCPPNT2简介

1月31日,二千零一十六
通过
RCPPNT2简介

现代CPU处理器是用新的,为特定操作优化的扩展指令集。这些都允许向量化操作,被叫单指令/多数据(SIMD)指令。尽管现代编译器在可能的情况下会使用这些指令,数字模板工具箱(NT2)是一种可以用simdinstructio金宝搏网址ns执行特定代码块的工具。

阅读更多

闪亮的开发者大会

1月31日,二千零一十六
通过
闪亮的开发者大会

真的很享受2016年1月在斯坦福大学举办的RSTUDIO闪亮的开发者大会。张文斯顿刚才表现得很专业,真的很光滑。只需将代码包装在provis()块中,就可以对代码进行概要分析,结果将作为交互式HTML小部件导出。例如,运行下面的R代码:if(!(%rownames(installed.packages())中的'profvis')devtools::install_github('rstudio/profvis')library('profvis')nrow…继续阅读闪亮的…

阅读更多

标签圈!

1月31日,二千零一十六
通过
标签圈!

本文探讨了与R相关的问题的stackoverflow标签之间的相互关系。所以我抓住了所有标有“R”的问题,在每个问题中取下其他标签,制作一些网络图,显示每个标签与其他标签一起出现的频率。重点是看经验关系…

阅读更多

XML包的陷阱:特定于CP932区域设置的问题,日文日文shift-jis,在Windows上

1月31日,二千零一十六
通过
XML包的陷阱:特定于CP932区域设置的问题,日文日文shift-jis,在Windows上

CRAN包XML在解析用CP932(shift-jis)编码的HTML页面时出错。在本报告中,我将展示这些问题以及它们的解决方案,它们在……继续阅读→

阅读更多

希拉里·克林顿2016年最大的竞争对手:她本人

1月30日,二千零一十六
通过
希拉里·克林顿2016年最大的竞争对手:她本人

在最近的一篇文章中,我注意到,尽管伯尼·桑德斯在许多重要指标上做得更好,奥巴马2008年的媒体报道量是桑德斯2016年的3倍。我博客的一位读者指出,并非所有报道都是平等的,总统希望…

阅读更多

加速R代码的策略

1月30日,二千零一十六
通过
加速R代码的策略

R中的for循环,在其原始的未优化形式中可能非常缓慢,尤其是在处理较大的数据集时。有很多方法可以让你的逻辑运行得更快,但你会很惊讶你能走得有多快。这篇文章展示了许多方法,包括简单的调整

阅读更多

搜索R-Blo188bet appggers


赞助商

千万不要错过更新!
订阅R-Bloggers188bet app接收
最新R帖子的电子邮件。
(您将不再看到此消息。)

单击此处关闭(此弹出窗口将不再出现)