预测使用R和斯坦由@ ellis2013nz 2020年的新西兰大选

2020年6月5日
通过

[本文首次发表于免费范围统计 - R的,并慷慨解囊,以188bet app]。(您可以在本网页上的内容报告问题金宝搏网址在这里
想在R-bloggers上分享你的内容吗?188bet app188bet app 如果你有博客,或者在这里如果你没有。

新西兰选举预测

我已经完成我的新西兰大选预测的第一个适当的发行版本将于2020年9月19日这里是座位数的现实可能的联盟数量的预测概率分布:

可以看出,它在寻找总理贾辛达·阿德恩和她的工党非常好,单独或联合执政任概率非常高。除非发生戏剧性的变化,在国家党组建政府的机会都没有形成与新西兰首先一个不太可能的联盟微乎其微,而小甚至然后。

预测真正的多党政治这很有趣

新西兰的选举很有意思,因为联立制系统。在此基础上的第一次选举是在1996年自那时以来,没有一个政党已经没有统治联盟伙伴。这是一个鲜明的对比前几年先过去最后单座的选民。与新西兰议会的单体别墅,这导致了一个政党在正式的政治体制最小的制衡选举之间称雄。与此相反,每天总理自1996年以来已经有他们的政府任期内与正在进行的基础上为其未成年联盟伙伴认真谈判。

在预测方面,我们有两个步骤:

  • 估计概率分布在选举日投票党。这些都必须在不完美的测量,我们从调查数据有很大程度上是基于。他们需要考虑到对“今天”和投票日之间的变化帐户的不确定性;金宝搏网址
  • 转换的那些概率分布票通过模拟议会席位,并观察建立联盟的可能性。

党的票需要估计与代表在议会一个现实的机会各方,使之成为一个更为计算密集的锻炼比预测澳大利亚大选。对于代表的澳大利亚联邦议会众议院,只要估计一个两方首选号码,获得大选的一个很好的模式outcom。当然,proportionaal表示参议院则是另一回事。

对于我的投票预测,我用同样的贝叶斯潜伏状态空间模型,我在2017年的选举预测使用。我已下降我作为在选举中,这是一个广义相加模型推算转发备份第二种方法。与花键外推是很难做好事,我觉得有点增加与明确的假设优质贝叶斯模型。

在斯坦模型的规范在GitHub上。它只需133行代码。该代码的“参数”块包含需要估计大约25,000看不见的值。这些包括:

  • 七方(包括“其他”),为每个3223天至2020年9月19日的未观测到的支持从2011年11月26日(估计实际的参数是一天一天的变化)。金宝搏网址7×3223 = 22561。
  • 对于每七名当事人的测量误差,共239次调查。7×239 = 1673。
  • 的六个民意调查机构的房子影响了七方7×6矩阵。7×6 = 42。
  • 7 7对称相关矩阵为每天的变化。7×6/2 = 21。
  • 对每一方支持度的每日变化的标准差。7 x 1=7。
  • 2017年一位民意调查机构改变调查方法对各方的影响。7 x 1=7。

虽然目前在新西兰只有两三位民意调查者发表了投票意向民意调查,但我估计以前活跃的民意调查者的众议院效应,因为他们有助于了解那些仍然站着的人的众议院效应。也就是说,随着时间的推移,通过观察所有的民意调查者,我可以更好地估计出“真实的”未被注意到的投票倾向,以及每个民意调查者的平均水平。

这里一个关键的假设是这种趋势的房子效果高估或低估各个民调机构对每一方是恒定的一段时间。这显然是错误的,但似乎是一个必要的简化的假设,我希望仍有模型有用。

预计政党票为单个席位的转换必须考虑到MMP泻的座椅,特别是(由ACT党召开否则谁也不会超过表示5%的阈值)有关毛利人的座位和不确定性的变幻莫测。金宝搏网址开展此项研究的有simulate_seats功能这与我2017年的版本基本上没有变化,主要的变化是如何对待毛利人的席位,因为工党在上一次选举中占据主导地位,而在2020年几乎没有任何信息可以抵消这一点。

掺入非轮询期望作为先验分布

我对2017年新西兰大选或2019年澳大利亚大选的模型的一个改进是,根据我松散地称之为“政治科学模型”,引入了对总理政党投票的事先预期。我在这里的意思是基于经济表现、丑闻等预测投票的模型。不幸的是,我们只有少量的选举可以用来估计投票的分布(因为在我看来,MMP选举前的选举对理解投票没有帮助)。

下面是对现任首相新西兰自MMP波动的历史:

产生该图表的代码在这个脚本用于获取之前的参数对预测模型。

人眼这里有一个有趣的模式。他们的第一次选举后,总理的党有一个秋千他们,然后摆动下降,直到它变成负的。显然,与对他们的党摆动每个周期结束,因为什么需要为他们不再是那个的是围绕现任下一次。但正摆幅的PM在他们第一次去的现任有趣。

然而,只有8个数据点,并在该时间序列(时间序列数据是不值得尽可能独立于海誓山盟的数据点),我不认为我应该假定格局仍将延续。毕竟,如果分析的单位是“面对首个当选为现任第一任期总理”,我们只有两个数据点 - 克拉克于2002年,约翰·基在2011年也没有足够的数据来尝试做一个回归of pro-PM swing on economic growth or unemployment as I’d like. Instead, I chose as my prior the very flat assumption that the swing against Jacinda Ardern’s party will be drawn from a distribution with a mean of 1.3% and standard deviation of 3.4%. I still have to make a call on the形状该分配的;这显然不是正态分布所以选择一个相对脂肪尾t分布与用于形状4个自由度。这一切都感觉有点武断,但至少它是透明的。

为什么4个自由度,而不是我第一次运行模型时的1?这个发行版是为了表达如果我根本没有任何轮询信息,我将看到的结果。结果是,如果你从一个自由度和比例的t分布样本中选取适当的均值和标准差,那金宝搏网址么有太多的值离均值太远,我认为它们是合理的,就像选举结果的观察者一样。所以我选择了真正反映我先前的那个。

我们可以在估计潜在投票意图和投票(投票意图的不完全测量)的图表中看到该先验期望的影响。工党在最近两次非常积极的民调和选举日的预期结果之间的向下猛击,可以看出前一次的“拉动作用”:

围绕向下的较大不确定性的刺拳也清楚地显示。我很满意的预测区间在那里。他们是宽,但也正好体现出缺乏新西兰轮询数据。

更多更新将遵循民意调查进来

该模型需要较长的时间来适应 - 我的笔记本电脑18+小时。我对减少一些想法,但他们似乎涉及抛出的一些信息:

  • 开始于2014年,而不是2011
  • 改变从每日粮食的基本表决意向每周估计
  • 包装更小方(如ACT和毛利党)到“其他”

如果我认为必须运行模型批,并且频繁地更新轮询数据,那么我将执行其中的一个或多个操作。但由于预期的民调如此之少,我想我不会费心的。

我会更新这个模型(以及nzelect公司[R包,它借鉴了)随着越来越多的民意调查进来了。

关键环节:

发表评论对于作者,请按照自己的博客上的链接和评论:免费范围统计 - R的

188bet appR-bloggers.com报价每日电子邮件更新金宝搏网址 [R新闻和教程金宝搏网址金宝搏网址 和许多其他议题。点击这里,如果你正在寻找张贴或找到一个R /数据科学工作
想在R-bloggers上分享你的内容吗?188bet app188bet app 如果你有博客,或者在这里如果你没有。



如果你走到这一步,为什么不订阅更新从网站?选择你的味道:电子邮件推特1188bet app, 要么Facebook的...

评论被关闭。

搜索R-博客188bet app

赞助商

决不会错过的更新!
订阅R-博客188bet app接受
电子邮件与最新的[R帖子。
(您将不会再看到这条消息。)

点击此处关闭(此弹出不会再次出现)