R学习教程

12月10日,二千零一十五
通过

有很多资源可以帮助你学习R的不同方面,作为一个初学者,这可能是压倒性的。它也是一种动态的语言,而且变化迅速,所以跟上最新的工具和技术是很重要的。

这就是为什么188bet app数据通信共同努力为R带来一条学习之路。每个部分都会向您指出相关的资源和工具,以帮助您开始学习,并让您继续学习。这是一个混合的材料,从文件,在线课程,书,还有更多。

就像R一样,这个学习路径是一个动态资源。我们希望不断发展和改进资源,以提供最佳的学习体验。所以如果你有改进的建议,请发电子邮件[电子邮件受保护]有你的反馈。

学习路径

入门:R的基础知识

设置您的机器

R包

将数据导入R

数据操作

数据可视化

数据科学与机器学习

在R中报告结果

在(付费)在线课程中学习高级R主题

下一步

入门:R的基础知识

图像02

学习r的最好方法是做。万一你刚开始学习R,这自由的R教程简介由datacamp(第一章是免费的)是一个伟大的资源以及继承者中间R程序设计(需要订阅).这两门课程都互动地教你R编程和数据科学,以你自己的速度,在舒适的浏览器中。在练习过程中,你会得到即时的反馈,并在练习过程中提供有用的提示,这样你就不会陷入困境。

另一个免费的R在线互动学习教程可从O'Reilly的代码学校网站尝试R.离线互动学习资源是旋转,一个R包,如果成为一个R程序员很有趣和容易。你可以通过(i)参加涡流课程。在R中安装程序包,(ii)从课程库中选择课程。如果您想立即开始而不需要安装任何东西,您也可以选择涡流在线版.

还有一些非常好的MOOC在EDX和Coursera上可以找到,它教你R编程的基础知识。在EDX上你可以找到R程序设计概论微软一门8小时的课程,重点是R的基本原理和基本语法。在Coursera有非常受欢迎的约翰霍普金斯R编程的课程.这两种都是强烈推荐的!

如果你更喜欢通过一个书面的教程或书学习R,有很多选择。有CRAN R手册简介,以及一些非常容易阅读的书籍,比如Jared Lander的为每个人辩护动作中的r罗伯特·卡巴科夫。

设置您的机器

你可以下载R的副本来自综合档案网络(CRAN)。Linux有可用的二进制文件,Mac和Windows。

安装R后,您可以选择使用基本R控制台,或者集成开发环境(IDE)。演播室是目前为止最流行的R和支持调试的IDE,工作区管理,绘图和更多(请务必查看rstudio快捷方式

IMAG05

在Rstudio旁边还有建筑师,以及基于Eclipse的IDE。如果您喜欢使用图形用户界面,可以查看R指挥官(又名为Rcmdr)或演绎器.

R包

图像04

R包是驱动R增长和普及的燃料。R包是一组代码,数据,文档,以及易于与他人分享的测试。在使用软件包之前,你必须先安装它。一些软件包,像基本包,在安装r时自动安装。其他包装,比如说GGPROT2软件包,不会随捆绑R一起安装,但需要安装。

许多(但不是所有)R包都是从克朗,世界各地存储相同内容的服务器网络,最新的,R的代码和文档版本。您可以很容易地从R内部安装这些包,使用install.packages功能.克兰还保留了一套任务视图标识与特定任务相关联的所有包,例如时间序列.

在克兰旁边你也有生物导体它有用于分析高通量基因组数据的包,以及例如github比特桶R包开发人员的存储库。您可以使用德沃茨包裹。

很难找到包裹,但幸运的是,你可以很容易地从cran中搜索包,Github和Bioconductor使用文档编制内部R,或者你可以看看这个有用R包的快速列表.

结束,一旦你开始和R合作,您很快就会发现R包依赖性会导致很多麻烦。一旦你面对这个问题,一定要退房包装鼠(见视频教程检查点.当你需要更新R时,如果您使用的是Windows,你可以使用updater()函数安装程序包裹。

将数据导入R

要导入到r中的数据可以有各种格式:平面文件,统计软件文件,数据库和Web数据。

IMAG03

将不同类型的数据放入R中通常需要使用不同的方法。要了解更多有关如何将不同数据类型输入r的一般信息,可以查看以下内容在线导入数据到R教程(需要订阅)这篇关于数据导入的文章,或本网络研讨会通过RStudio。

  • 平面文件通常是包含表数据的简单文本文件。R的标准发行版提供了将这些平面文件作为具有以下功能的数据帧导入R的功能:读表()读取.cv()来自utils包。导入平面文件数据的特定R包是读写器,一个快速且易于使用的包,它不像utils那样冗长,而且速度快了很多倍。(更多信息)和数据。表的Frad()用于将数据导入和咀嚼到r中的函数(使用fread函数
  • 软件包,如SAS,stata和spss使用并生成自己的文件类型。这个港口包裹由哈德利·威克姆负责进口SAS,将stata和spss数据文件放入r中,非常容易使用。或者有国外包装,不仅可以导入SAS,stata和spss文件,但也有一些更奇特的格式,例如systat和weka。它还可以再次将数据导出为各种格式。(提示:如果您要从SAS、SPSS或STATA切换到R,退房Bob Muenchen的教程(需要订阅)
  • 用于连接到关系数据库和从关系数据库导入的包取决于要连接到的数据库类型。假设您想连接到一个MySQL数据库,你需要RMySQL包裹。其他的是例如格雷斯特格雷尔罗马帝国然后可以用来访问和操作数据库的r函数,在另一个名为双折射.
  • 如果您想使用r获取Web数据,您需要使用api或通过类似包的抓取将r连接到在线资源紧身衣.为了开始这一切,有这个伟大的资源可在Rolf Fredheim的博客上免费获取。

数据操作

将原始数据转换为结构良好的数据对于稳健分析很重要,使数据适合处理。R有许多内置的数据处理功能,但它们并不总是那么容易使用。幸运的是,有一些很棒的软件包可以帮助您:

  • 这个蒂迪尔包装允许您“整理”数据。整齐的数据是每列都是变量,每行都是观察值的数据。像这样的,它将您的数据转换为易于使用的数据。查看这个优秀的资源,了解如何使用tidyr整理数据。
  • 如果你想做字符串操作,你应该了解金宝搏网址斯特林格尔包裹。小品很容易理解,并且有很多有用的例子让你开始学习。
  • 当使用类似数据帧的对象(内存中和内存外)时,dplyr是一个很好的包。它结合了速度和非常直观的语法。要了解更多有关dpylr的信息,您可以这个数据操作课程(需要订阅)退房这张方便的纸条.
  • 在执行繁重的数据处理任务时,这个数据表包应该是您的“转到”包。非常快,一旦你掌握了它的语法,你就会发现自己一直在使用data.table。检查此数据分析课程(需要订阅)为了发现data.table的输入和输出,使用此备忘单作为参考.
  • 很有可能你发现自己在某个时刻和时间和日期一起工作。这可能是一个痛苦的过程,但幸运的是卢布酯使工作更容易。检查这是小品为了更好地理解如何在日常分析中使用润滑剂。
  • Base R在处理时间序列数据方面的功能有限。幸运的是,有像这样的包裹动物园XTS量子动力学.阅读Eric Zivot的本教程为了更好地理解如何使用这些包,以及如何处理R中的时间序列数据。

如果您想大致了解R的数据操作,你可以在书中多读一些用R操作数据或者看到与R的数据冲突由rstudio拍摄。如果在处理数据帧时遇到问题,检查15个简单的解决方案数据帧问题。

数据可视化

使R成为如此伟大的工具的原因之一是它的数据可视化功能。在R中执行可视化,GGPROTT2可能是最著名的软件包,初学者必须学习!您可以找到所有相关信息以开始使用ggplot2网址:http://ggplot2.org/一定要检查备忘单以及上书.在ggplot2旁边,您也有一些包,例如格威斯有关交互式Web图形(请参见辅导的(需要订阅)古格利维斯与谷歌图表交互(学习重新创建特德谈话R字形,还有更多。见任务视图对于一些隐藏的宝石,如果你在绘制数据方面有问题这个帖子可能会帮到你。

在R中,有一个专门处理空间数据的完整任务视图,允许您创建漂亮的地图,如这张著名的地图:

IMAGE 01

要开始,请查看例如GGMAP,它允许您在静态地图上可视化空间数据和模型,这些静态地图来自谷歌地图和开放街道地图等来源。或者你可以开始玩地图工具脉络膜,以及TMAP软件包.如果你需要一个很好的教程,就接受这个R中空间数据可视化介绍.

你会经常看到R中的可视化使用了所有这些华丽的配色方案,它们就像一只手套一样适合于图形/地图/…如果你也希望实现这一点,然后把自己深化到R啤酒包染色机.

R中最新的可视化工具之一是HTML控件.HTML小部件的工作方式与R图类似,但它们创建交互式Web可视化,如动态地图(传单)时间序列数据图表(分布图)和交互式表格(数据表)有一些非常好例子所有HTML小部件,和可靠的文件关于如何创建自己的一个(不是在阅读模式下:就看这个视频

如果你想得到一些关于下一步要创建什么可视化的灵感,你可以看一看致力于可视化的博客,比如流水数据.

数据科学与机器学习

关于如何使用R进行数据科学,有许多初学者资源。可用在线课程列表:

或者,如果你喜欢读得好:

一旦你开始用R学习机器,您将很快发现自己使用的软件包包括插入符号REST随机森林.幸运的是,对于这些软件包和一般的机器学习,有一些很好的学习资源。如果你刚开始,本指南很快就会让你去的。或者,你可以看看书用R掌握机器学习用R学习机器。如果你正在寻找一些指导你通过一个真实生活的例子的循序渐进的教程,有凯格尔机器学习课程或者你可以看看Wiekvoet的博客.

在R中报告结果

R标记是一种可轻松创建动态文档的创作格式,演示文稿,以及R.它是以可重复的方式报告数据分析的好工具,从而使分析更加有用和易懂。R降价基于针织物潘多克.用R标记,R生成一个最终文档,用其结果替换R代码。此文档可以是HTML格式,单词PFD,碘油等。格式。您甚至可以使用shining创建交互式r标记文档。这4小时的教程用R标记报告(需要订阅)你要和R马克一起去吗?另外,你可以用这个很好的备忘单供将来参考.

R减价,你还应该确保退房闪亮的.光泽使它使用r非常容易构建交互式Web应用程序。它允许您将分析转换为交互式Web应用程序,而无需了解HTML,CSS或javascript。RSTUDIO维护伟大的学习门户为了让你开始闪亮,包括这套视频教程(点击闪亮学习路线图的要点)。更多高级主题可供使用,以及一系列实例.

图像00

在(付费)在线课程中学习高级R主题

数据通信

数据通信还提供访问全部的每月25美元,这些包括:

乌迪米

另一家公司是乌迪米.虽然他们不提供像数据通信,他们提供了大量的视频课程,在使用R和学习统计时涵盖其他一些主题。rR-Bloggers188bet app的领导者,Udemy提供每门课程15-30美元,使用代码罗布格雷斯30再打30%的折扣。以下是他们的一些课程:

高级R课程:

R入门课程:

统计公司

统计公司是一个在线学习网站,统计课程超过100门,分析学,数据挖掘,文本挖掘,预测,社会网络分析,空间分析,等。

他们已经同意为R-Bloggers的读者提供R-Bloggers的188bet app23门课程中的任何一门降低399美元的费用。蟒蛇,SQL或SAS。这些是高影响力课程,每4周一次(通常成本高达589美元)。他们的特色是实践练习和项目,并有机会在线获得像Paul Murrell(R核心开发团队成员)这样的领先专家的答案。Chris Brunsdon(Gistools软件包的共同开发人员)本·鲍尔默(纽约大都会棒球队前统计员)以及其他。这些讲师将在4周内回答您的所有问题(通过私人讨论论坛)。

注册时可以使用代码“R-Blogger16”。您可以注册任何R,蟒蛇,HadoopSQL或SAS课程从任何日期开始。这是一份R相关课程

使用R作为统计数据包

培养R编程技能——对于熟悉R的人来说,或有其他编程语言或统计计算环境的经验

将r应用于特定域或应用程序

您可以从目录页中选择任何一门R课程:
www.statistics.com/course-catalog网站/

下一步

一旦你能更流利地写r语法(因而对r上瘾),你会想释放更多的能量(读:做一些非常漂亮的事情)。那样的话,一定要退房RCPP,一个R包,使C++代码与R的集成更容易,或修订程序(开始)免费教程

在花了一段时间编写R代码之后(你就成了一个R瘾君子)。您将达到您想要开始编写自己的R包的程度。来自Etsy的Hilary Parker写了一篇短教程关于如何创建第一个包,如果你真的很认真的话,你需要阅读金宝搏网址R包,哈雷·威克姆即将出版的一本书已经在网上免费出售。

如果你想开始学习R的内部工作并提高你对它的理解,最好的方法是阅读高级R.

最后,再来看看我们吧188bet appR博客阅读R社区博客的最新新闻和教程。



如果你走这么远,为什么不 订阅更新 从站点?选择您的口味: 电子邮件推特1188bet app,或 脸谱网

注释已关闭。

搜索R-Blo188bet appggers


最近的热门帖子

赞助商

千万不要错过更新!
订阅R-Bloggers188bet app接收
最新R帖子的电子邮件。
(您将不再看到此消息。)

单击此处关闭(此弹出窗口将不再出现)