如何用基本r制作柱状图

3月10日,二千零一十五
通过

(本文首次发表于 数据中心博客»R,并对 188bet appR博主

在接下来的一周里,我们将介绍如何在R中创建自己的柱状图的基础知识。将探讨三个选项:基本R命令,ggplot2和ggvis。这些帖子针对的是需要易访问和易于理解的资源的初级和中级R用户。想了解更多信息吗?在DataCamp上了解R教程.

什么是柱状图?

柱状图是数据集分布的直观表示。像这样的,柱状图的形状是其最明显和最具信息性的特征:它允许您轻松地看到相对大量的数据位于何处,以及可以找到的数据非常少(Verzani,2004年)。换句话说,您可以看到中间部分在数据分发中的位置,数据在这个中间有多接近,在哪里可以找到可能的异常值。正因为如此,柱状图是了解数据的好方法!

但是直方图的具体形状到底是什么样的呢?简而言之,柱状图由x轴组成,Y轴和不同高度的各种杆。Y轴显示X轴上的值在数据中出现的频率,而“条形”组则是X轴上的值范围或连续类别。后者解释了柱状图之间没有间隙的原因。

注意柱状图的条形图通常称为“箱”;本教程还将使用该名称。

如何用基本r制作柱状图

第一步-给我看数据

因为柱状图首先需要绘制一些数据,您可以很好地导入数据集或使用内置于R中的数据集。本教程使用两个数据集:内置R数据集飞机乘客和一个名为乔尔,存储到.txt文件文件和可供下载.

乔尔

第二步–熟悉hist()函数

您可以使用历史()函数,它计算给定数据值的柱状图。将数据集的名称放在该函数的括号之间,这样地:

Hist(机场旅客)

从而得到以下柱状图:

基本r中的柱状图-基本r

然而,如果只选择数据帧的某一列,乔尔例如,要制作柱状图,你必须使用历史()数据集名称与$签字,后跟列名:

hist(chol$age)计算名为“chol”的数据帧列年龄中数据值的柱状图。

基本R列中的柱状图

第三步-将hist()函数提高一个等级

上一节的柱状图看起来有点单调,他们不是吗?默认的可视化通常对理解柱状图没有多大帮助。因此,您需要再迈出一步,以便更好、更容易地理解柱状图。幸运的是,这并不难:R允许几种简单快速的方法来优化图表的可视化效果,当仍在使用历史()功能。

为了调整柱状图,您只需向历史()函数,就像这样:

Hist(航空旅客,main=“航空旅客直方图”,xlab=“乘客”,border=“蓝色”,col=“绿色”,xlim=c(100700)、LAS=1,断裂=5)

此代码从数据集计算数据值的柱状图飞机乘客,以“航空旅客直方图”为标题,将X轴标记为“乘客”,给箱子一个蓝色的边框和一个绿色的颜色,当X轴限制在100到700之间时,将Y轴上打印的值旋转1,并将纸槽宽度更改为5。

基本r-bin中的柱状图 被这一大串代码压垮了?别担心!让我们把它分解成更小的部分来看看每个参数的作用。

名称/颜色

通过添加主要的作为一个论点历史()功能:

Hist(航空旅客,main=“航空旅客直方图”)标题为“航空旅客直方图”的航空旅客数据集的直方图

要调整X轴的标签,添加XLAB型.同样地,您也可以使用依拉布要标记Y轴:

Hist(航空旅客,xlab=“乘客”,ylab=“乘客频率”)在x轴和y轴上更改标签的航空旅客数据集的柱状图

如果要更改默认柱状图的颜色,只需添加参数边境.你可以调整,因为名字本身有点泄露,柱状图的边框或颜色。

Hist(航空旅客,border=“蓝色”,col=“green”)带有绿色填充物的蓝色边框箱的Airpassengers数据集的柱状图

小费别忘了把颜色和名字放在中间.

X轴和Y轴

通过添加XLIM线性作为历史()功能:

Hist(航空旅客,xlim=c(100700)、ylm=c(0,30))航空旅客数据集的柱状图,X轴限制在100至700,Y轴限制在0至30。

注意这个C()。函数用于在使用时分隔轴上的值XLIM线性.它有两个值:第一个值是起始值,第二个是最终值

通过添加“las=1”作为参数旋转Y轴上的标签。LAS可以是0,1个,2或3。

Hist(航空旅客,las=1)航空旅客数据集的直方图,其中y值水平投影。

根据你选择的方案,标签的位置将不同:如果选择0,标签将始终与轴平行(默认值);如果选择1,标签将水平放置。如果希望垂直于轴,则选择2;如果希望垂直放置,则选择3。

箱子

您可以通过添加打破作为一个论点,以及您希望拥有的断点数:

Hist(航空旅客,breaks=5)带有5个断点的航空旅客数据集的柱状图

如果您想对容器之间的断点有更多的控制权,你可以丰富打破给它一个断点向量。您可以使用C()。功能:

Hist(航空旅客,断裂=C(100);300,500个,700)计算航空旅客数据值的柱状图,把箱子放在100到300之间,300到500和500到700。

然而,这个C()。函数有时会使代码非常混乱。这就是为什么你可以添加=序列(x,YZ).x的值,Y和Z由你自己决定并代表,从外观上看,X轴的起始编号,X轴的结束编号和这些数字出现的间隔。

请注意,您还可以组合这两个功能:

Hist(航空旅客,断裂=C(100);顺序(200700,150))制作航空旅客数据集的柱状图,从X轴100开始,从200到700,把箱子做成150宽

基本r-bin中的柱状图

小费当您使用SEQ争辩!

注意条或箱的不同宽度可能会使人困惑,当您将此技术应用于原始柱状图时,您的数据中最有趣的部分可能会发现自己未被突出显示,甚至隐藏。所以,只需试验一下,看看什么最适合你的目的!

额外:概率密度

这个历史()函数默认显示Y轴上某个肥料箱的频率。然而,如果你想知道X轴值的间隔发生的可能性有多大,你需要的是概率密度而不是频率。因此,我们需要一个比例柱状图。您可以通过设置弗雷克参数设置为false或丙纶变为真:

Hist(航空旅客,main=“航空旅客直方图”,xlab=“乘客”,border=“蓝色”,col=“绿色”,xlim=c(100700)、LAS=1,断裂=5,prob=true)概率密度通过y轴而不是常规频率表示的航空旅客数据集的柱状图。

在你打电话给历史()创建上述概率密度图的函数,随后可以使用行()功能:

线条(密度(AirPassengers))获取密度曲线与AirPassengers柱状图一起使用

基本r中的直方图密度

注意此函数要求您设置丙纶将柱状图的参数设为真!

步骤四。想更进一步吗?

要获得所有可以添加到历史()函数,看看文档文章历史()功能。

这是关于用r创建柱状图的3篇文章中的第一篇。下一篇文章将介绍使用ggplot2创建柱状图。

发现了错误?给我们发个鸣叫

岗位如何用基本r制作柱状图首次出现在DataCamp博客.

发表评论作者,请关注他们博客上的链接和评论: 数据中心博客»R.

188bet appR博客提供 每日电子邮件更新金宝搏网址 R新闻和 教程关于以下主题: 数据科学大数据, r作业,可视化(可视化) ggplot2型箱形图地图动画)程序设计(程序) 演播室斯维夫乳胶SQL日食吉特哈多普刮网)统计 回归主成分分析时间序列交易还有更多…



如果你走这么远,为什么不 订阅更新 从网站上?选择您的口味: 电子邮件推特1188bet app,或 脸谱网……

注释已关闭。

搜索R-Blo188bet appggers


赞助商

千万不要错过更新!
订阅R-Bloggers188bet app接收
最新R帖子的电子邮件。
(您将不再看到此消息。)

单击此处关闭(此弹出窗口将不再出现)