道琼斯股票市场指数(2/4):交易量探索性分析

1月6日,二千零一十九
通过

(本文首次发表于 R编程–数据科学+,并对 188bet appR博主

    类别

    1. 基础统计学

    标签

    1. 数据可视化
    2. 导入数据
    3. R程序设计

    这是关于道琼斯股票市场的4系列文章的第二部分。金宝搏网址要阅读第一部分,请阅读链接.在这一部分,我将分析道琼斯工业平均指数(DJIA)的成交量。

    包装

    本文列出了本系列文章中使用的软件包。

    SuppressPackageStartupMessages(library(lubridate))SuppressPackageStartupMessages(library(fbasics))SuppressPackageStartupMessages(library(lmtest))SuppressPackageStartupMessages(library(urca))SuppressPackageStartupMessages(library(ggplot2))SuppressPackageStartupMessages(library(quantmod))SuppressPackageStartupMessages(library(performanceanalyt)ics))SuppressPackageStartupMessages(库(rugarch))SuppressPackageStartupMessages(库(fints))SuppressPackageStartupMessages(库(forecast))SuppressPackageStartupMessages(库(strucchange))SuppressPackageStartupMessages(库(tsa))。

    获取数据

    我们上传第1部分末尾保存的环境状态。

    加载(file='dowenvironment.rdata')

    日产量探索性分析

    从保存的环境中,我们可以找到我们的DJI对象。我们画出了日销售量。

    djvoL <“音量[阴谋]

    值得注意的是,2017年初的水平跃升,我们将在第4部分中进行调查。

    我们将卷时间序列数据和时间线索引转换为数据帧。

    dj-vol-df<-xts-to-u数据帧(dj-vol)头(dj-vol-df)
    年价值1 2007 32720000 2 2007 25960000 3520000 3 2007 235220000 4 2007 2235000000 5 2007 225190000 6 2007 226570000
    尾部(DJI VulyDF)
    3015 2018 900510000 3016 2018 308420000 3017 2018 433080000 3018 2018 407940000 3019 2018 336510000 3020 2018 288830000

    基本统计汇总

    (dj_stats<-数据帧_basicstats(dj_vol_df))
    \35; \35; \35; \ \ \ \\\ \\2007 2008 2008 2008 2008 2009 2009 2009 2009年2009年2010年\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\571500E+08 6.749200E+08 6.729500E+08 4.598900E+08 1.四分位数2.063000 E+08 2.132100E+08 1.961850E+08 1.633400E+08 3。Quartile 2.727400e+08 3.210100e+08 3.353625e+08 2.219025e+08## Mean        2.449575e+08 2.767164e+08 2.800537e+08 2.017934e+08## Median      2.350900e+08 2.569700e+08 2.443200e+08 1.905050e+08## Sum         6.148432e+10 7.000924e+10 7.057354e+10 5.085193e+10## SE Mean     3.842261e+06 5.965786e+06 7.289666e+06 3.950031e+06## LCL Mean    2.373901e+08 2.649672e+08 2.656970e+08 1.940139e+08## UCL Mean    2.525248e+08 2.884655e+08 2.944104e+08 2.095728e+08## Variance    3.705505e+15 9.004422e+15 1.339109e+16 3.931891e+15## Stdev       6.087286e+07 9.489163e+07 1.157199e+08 6.270480e+07## Skewness    9.422400e-01 1.203283e+00 1.037015e+00 1.452082e+00## Kurtosis    1.482540e+00 2.064821e+00 6.584810E-01 3.214065E+00 \\\\\\\\\\\\\\\\\\\\\\\35; \\\\\\\\\\\\35\\\\35\\\\35\\\\\\\\\\\\\\\07最大值4.799800E+08 4.296100E+08 4.200800E+08 6.554500E+ 08×1。四分位数1.458775E+08 1.107150E+08 9.488000E+07 7.283000E+07 3。Quartile 1.932400e+08 1.421775e+08 1.297575e+08 9.928000e+07## Mean        1.804133e+08 1.312606e+08 1.184434e+08 9.288516e+07## Median      1.671250e+08 1.251950e+08 1.109250e+08 8.144500e+07## Sum         4.546415e+10 3.281515e+10 2.984773e+10 2.340706e+10## SE Mean     3.897738e+06 2.796503e+06 2.809128e+06 3.282643e+06## LCL Mean    1.727369e+08 1.257528e+08 1.129109e+08 8.642012e+07## UCL Mean    1.880897e+08 1.367684e+08 1.239758e+08 9.935019e+07## Variance    3.828475e+15 1.955108e+15 1.988583e+15 2.715488e+15## Stdev       6.187468e+07 4.421660e+07 4.459353e+07 5.211034e+07## Skewness    1.878239e+00 3.454971e+00 3.551752e+00 6.619268e+00## Kurtosis    5.631080e+00 1.852581e+01 1.92009年E+01 5.856136E+01 \\\\\\\\\\\\\\\\\\\\\\\\\ \\\\\\\\\\\\\\\\\35; \\\\\\\\\\\\\\\\\08最大值3.445600E+08 5.734700E+08 6.357400E+08 9.005100E+ 08×1。四分位数8.775250E+07 8.224250E+07 2.695850E+08 2.819550E+08 3。Quartile 1.192150e+08 1.203550e+08 3.389950e+08 4.179200e+08## Mean        1.093957e+08 1.172089e+08 3.112396e+08 3.593710e+08## Median      1.021000e+08 9.410500e+07 2.996700e+08 3.414700e+08## Sum         2.756772e+10 2.953664e+10 7.812114e+10 9.020213e+10## SE Mean     2.433611e+06 4.331290e+06 4.376432e+06 6.984484e+06## LCL Mean    1.046028e+08 1.086786e+08 3.026202e+08 3.456151e+08## UCL Mean    1.141886e+08 1.257392e+08 3.198590e+08 3.731270e+08## Variance    1.492461e+15 4.727538e+15 4.807442e+15 1.224454e+16## Stdev       3.863238e+07 6.875709e+07 6.933572e+07 1.106550e+08## Skewness    3.420032e+00 3.046742e+00 1.478708e+00 1.363823e+00## Kurtosis    1.612326e+01 1.122161e+01 3.848619E+00 3.277164E+00

    在以下内容中,我们对上面显示的一些相关指标做出了具体的评论。

    平均值

    道琼斯日成交量为正均值的年份如下:

    过滤dj_状态(dj_状态,“平均,0)
    〔1〕2007““2008““2009““2010““2011““2012““2013““2014““2015““2016“〔11〕2017““2018““

    所有道琼斯日成交量均按升序排列。

    DjyStists[平均,订单(DJ_stats[”平均,,])
    2014 2015 2016 2013 2012 2011 2010平均92885159 109395714 117208889 118443373 131260600 180413294 201793373 2007 2008 2009 2017 2018平均244957450 276716364 28005330 311239602 359371036

    中值的

    道琼斯日成交量为正中位数的年份为:

    过滤dj_状态(dj_状态,“中位数,0)
    〔1〕2007““2008““2009““2010““2011““2012““2013““2014““2015““2016“〔11〕2017““2018““

    所有道琼斯日成交量中值均按升序排列。

    DjyStists[中位数,订单(DJ_stats[”中位数,,])
    2014 2016 2015 2013 2012 2011 2010 2010中位数81445000 94105000 102100000 110925000 125195000 167125000 190505000 2007 2009 2008 2017 2018中位数235090000 244320000 256970000 299670000 341470000

    偏斜

    道琼斯日成交量出现正偏斜的年份有:

    过滤dj_状态(dj_状态,“偏态,0)
    〔1〕2007““2008““2009““2010““2011““2012““2013““2014““2015““2016“〔11〕2017““2018““

    所有道琼斯日成交量均按升序偏斜。

    DjyStists[偏态,订单(DJ_stats[”偏态,,])
    2007 2009 2008 2018 2010 2017 2011偏态0.94224 1.037015 1.203283 1.363823 1.452082 1.478708 1.878239 2016 2015 2012 2013 2014偏态3.046742 3.420032 3.454971 3.551752 6.619268

    超额峰度

    道琼斯日成交量出现正超额峰度的年份如下:

    过滤dj_状态(dj_状态,“Kurtosis“,0)
    〔1〕2007““2008““2009““2010““2011““2012““2013““2014““2015““2016“〔11〕2017““2018““

    所有道琼斯日成交量均以升序超过峰度值。

    DjyStists[Kurtosis“,订单(DJ_stats[”Kurtosis“,,])
    2009 2007 2008 2010 2018 2017 2011峰度0.658481 1.48254 2.064821 3.214065 3.277164 3.848619 5.63108 2016 2015 2012 2013 2014峰度11.22161 16.12326 18.52581 19.00989 58.56136

    箱形图

    数据帧箱线图(dj_vol_df,“2007-2018年道琼斯工业平均指数日成交量框图”)

    贸易额从2010年开始下降,2017年显著增加。2018年的销量甚至超过了2017年和其他年份。

    密度图

    数据帧密度图(dj_vol_df,“道琼斯工业平均每日产量密度图2007-2018”)

    夏皮罗试验

    数据帧夏皮罗测试(dj_vol_df)
    ##            result## 2007 6.608332e-09## 2008 3.555102e-10## 2009 1.023147e-10## 2010 9.890576e-13## 2011 2.681476e-16## 2012 1.866544e-20## 2013 6.906596e-21## 2014 5.304227e-27## 2015 2.739912e-21## 2016 6.640215e-23## 2017 4.543843e-12## 2018 9.288371e-11

    正态性的无效假设多年来一直被否定。

    QQ图

    数据帧qqplot(dj_vol_df,“道琼斯工业平均指数日成交量QQ地块2007-2018”)

    qqplots直观地确认了日交易量分布的非正态性。

    日容积-对数比探索性分析

    与日志返回类似,我们可以将交易量日志比率定义为。

    \[
    V T \:=ln\frac V T V T-1
    \]
    我们可以通过计算性能分析包中的返回值来计算它并绘制它。

    dj_vol_log_ratio<-计算返回(dj_vol,“原木)dj_vol_log_ratio<-na.省略(dj_vol_log_ratio)图(dj_vol_log_ratio)

    将交易量日志比率时间序列数据和时间线索引映射到数据帧中。

    dj_vol_df<-xts_to_dataframe(dj_vol_log_ratio)头(dj_vol_df)
    年值1 2007-0.233511910 2 2007-0.096538449 3 2007-0.051109832 4 2007 0.007533076 5 2007 0.006109458 6 2007 0.144221282
    尾部(DJI VulyDF)
    年值3014 2018 0.44563907 3015 2018-1.07149878 3016 2018 0.33945998 3017 2018-0.05980236 3018 2018-0.19249224 3019 2018-0.15278959

    基本统计汇总

    (dj_stats<-数据帧_basicstats(dj_vol_df))
    \35; \ \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\1352 1.041216 2.441882 1.四分位数-0.123124-0.128815-0.162191-0.170486-0.157758 3。四分位数0.1300556 0.145512 0.169230.179903 0.137108 \35\\35; \\35\\35\\35\\\\\\\35\\35\\四分位数0.1304556 0.1304556 0.145512 0.1692333 0.179903 0.179903 0.179903 0.137108 \\\\\\\\\\\\\\\\\\35; SE表示0.016984 0.016196 0.017618 0.019318 0.026038 LCL MEAn-0.036135-0.036135-0.030693-0.036670-0.039596-0.051141 \35; \\\35; \\35; \\\\\\\\\\\\35-0.036135-0.036135-0.0.030693-0.036670-0.039595-0.036135-0.036135-0.036135-0.036135-0.036135-0.051140.0.030.032725 0.032725 0.036425 0.0.03偏度-0.802037-0.632586 0.066535-0.150523 0.407226峰度5.345212 2.616615 1.500979 1.353797 1.353797 14.554642 35\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\35\\\35\\\\\\\\352012 2012 2012 2012 2012 2013 2013 2013 2014 2014 2014 2014 2014 2014 2015 2015 2015最大值1.292956 1.245202 2.008667 1.130289 1.319713_1.四分位数-0.152899-0.145444-0.144280-0.143969-0.134011 3。四分位数0.144257 0.149787 0.134198 0.144257 0.149787 0.134198 0.134198 0.150003 0.141287 \35\\\\\35\\\35\\\35\\\\\0.144257 0.144257 0.149787 0.134198 0.134198 0.14425642-0.002442 0.002442 0.002442 0.000200 0.000200 0.000488 0.004228 \\\\\\\\\\;SE表示0.021293 0.019799 0.023514 0.019010 0.019089 LCL MEAn     -0.040295  -0.041435  -0.046110  -0.036952  -0.033367## UCL Mean      0.043579   0.036551   0.046510   0.037929   0.041823## Variance      0.113345   0.098784   0.139334   0.091071   0.091826## Stdev         0.336667   0.314299   0.373274   0.301780   0.303028## Skewness     -0.878227  -0.297951  -0.209417  -0.285918   0.083826## Kurtosis   8.115847 4.681120 9.850061 4.754926 4.647785 2017 2018 Nobs 251.000000 251.000000 nas 0.000000.000000最小-0.817978-1.071499最大0.915599 0.926101 1。四分位数-0.112190-0.119086 3。Quartile   0.110989   0.112424## Mean         -0.000017   0.000257## Median       -0.006322   0.003987## Sum          -0.004238   0.064605## SE Mean       0.013446   0.014180## LCL Mean     -0.026500  -0.027671## UCL Mean      0.026466   0.028185## Variance      0.045383   0.050471## Stdev         0.213032   0.224658## Skewness      0.088511  -0.281007峰度3.411036 4.335748

    在以下内容中,我们对上面显示的一些相关指标做出了具体的评论。

    平均值

    道琼斯日成交量对数比率为正均值的年份为:

    过滤dj_状态(dj_状态,“平均,0)
    〔1〕2008““2011““2012““2014““2015““2016““2018““

    所有道琼斯日成交量对数比率平均值按升序排列。

    DjyStists[平均,订单(DJ_stats[”平均,,])
    2007 2013 2009 2010 2017 2011 2014平均-0.002685-0.002442-0.001973-0.00155-1.7E-05 0.00014 2E-04 2018 2015 2008 2012 2016平均0.000257 0.000488 0.001203 0.001642 0.004228

    中值的

    道琼斯日成交量对数比率中位数为正的年份为:

    过滤dj_状态(dj_状态,“中位数,0)
    〔1〕2008““2014““2015““2018““

    所有道琼斯日成交量对数比率中值按升序排列。

    DjyStists[中位数,订单(DJ_stats[”中位数,,])
    2009 2011 2007 2017 2013 2010中位数-0.031748-0.012839-0.010972-0.006322-0.004922-0.004217 2016 2012 2008 2018 2015 2014中位数-0.002044-1e-05 0.002222 0.003987 0.004112 0.01346

    偏斜

    道琼斯日成交量对数比率出现正偏态的年份如下:

    过滤dj_状态(dj_状态,“偏态,0)
    〔1〕2009““2011““2016““2017““

    所有道琼斯日成交量对数比率平均值按升序排列。

    DjyStists[偏态,订单(DJ_stats[”偏态,,])
    2012 2007 2008 2013 2015 2018倾斜-0.878227-0.802037-0.632586-0.297951-0.285918-0.281007 2014 2010 2009 2016 2017 2011倾斜-0.209417-0.150523 0.066535 0.083826 0.088511 0.407226

    超额峰度

    道琼斯日成交量出现正超额峰度的年份如下:

    过滤dj_状态(dj_状态,“Kurtosis“,0)
    〔1〕2007““2008““2009““2010““2011““2012““2013““2014““2015““2016“〔11〕2017““2018““

    所有道琼斯日成交量对数比均按升序超过峰度值。

    DjyStists[Kurtosis“,订单(DJ_stats[”Kurtosis“,,])
    2010 2009 2008 2017 2018 2016 2013 Kurtosis 1.353797 1.500979 2.616615 3.411036 4.335748 4.647785 4.68112 2015 2007 2012 2014 2011 Kurtosis 4.754926 5.345212 8.115847 9.850061 14.55464

    箱形图

    数据帧箱线图(dj_vol_df,“2007-2018年道琼斯工业平均指数日成交量框图”)

    最积极的极端值可以在2011年发现,2014和2016。最负极端值,2007年,2011,2012,2014。

    密度图

    数据帧密度图(dj_vol_df,“道琼斯工业平均每日产量密度图2007-2018”)

    夏皮罗试验

    数据帧夏皮罗测试(dj_vol_df)
    ##            result## 2007 3.695053e-09## 2008 6.160136e-07## 2009 2.083475e-04## 2010 1.500060e-03## 2011 3.434415e-18## 2012 8.417627e-12## 2013 1.165184e-10## 2014 1.954662e-16## 2015 5.261037e-11## 2016 7.144940e-11## 2017 1.551041e-08## 2018 3.069196e-09

    根据报告的p值,总之,我们可以拒绝正态分布的零假设。

    QQ图

    数据帧qqplot(dj_vol_df,“道琼斯工业平均指数日成交量QQ地块2007-2018”)

    所有报告年份都可以发现偏离正常状态。

    保存当前环境以便进一步分析。

    save.image(file='dowenvironment.rdata')

    如果你有任何问题,请在下面发表评论。

    工具书类

    1. 道琼斯工业平均指数
    2. 偏斜
    3. 峰态
    4. 财务数据分析导论,威利瑞茜特塞
    5. 时间序列分析及其应用,Springer ed.R.H.舒姆韦D.S.斯塔夫
    6. 应用计量经济学时间序列,威利W恩德斯第四版。
    7. 预测——原则和实践,课文,R.J.海德曼
    8. 选项,期货和其他衍生产品,Pearson ed.J.C.船体
    9. 橄榄球包简介
    10. 应用计量经济学与R,Achim Zeileis克里斯汀·克莱伯-斯普林格·艾德。
    11. GARCH建模:诊断测试

    免责声明

    本帖中提及的任何证券或数据库仅供说明之用,在任何情况下,此处提出的调查结果都不应被解释为投资建议或任何特定证券或来源的推广。

    相关帖子

    1. 道琼斯股票市场指数(1/4):对数回报探索性分析
    2. R中的六西格玛DMAIC系列-第4部分
    3. 纽约公交:公司级预测指标
    4. R中相关矩阵的可视化
    5. AUC的解释

    留下评论作者,请关注他们博客上的链接和评论: R编程–数据科学+.

    188bet appR博客提供 每日电子邮件更新金宝搏网址 R新闻与 教程关于以下主题: 数据科学,, 大数据,, r作业,可视化(可视化) GGPROTT2,, 箱形图,, 地图,, 动画)程序设计(程序) 演播室,, 斯威夫特,, 乳胶,, SQL,, 日食,, 吉特,, 哈多普,, 刮网)统计 回归,, 主成分分析,, 时间序列,, 交易还有更多…



    如果你走这么远,为什么不 订阅更新 从站点?选择您的口味: 电子邮件,, 推特,, 1188bet app,或 脸谱网

    注释已关闭。

    搜索R-Blo188bet appggers


    赞助商

    千万不要错过更新!!
    订阅R-Bloggers188bet app接收
    最新R帖子的电子邮件。
    (您将不再看到此消息。)

    单击此处关闭(此弹出窗口将不再出现)