设计现场实验中的相关处理:第一部分

4月29日,二千零一十九
通过

(本文首次发表于 在生物学家和统计学家之间的断桥上,并对 188bet appR博主

观察结果分组

当我们在不同的科目中记录了两个特征时,我们有兴趣描述它们的联合变异性,利用皮尔逊相关系数。没关系,尽管如此,我们必须尊重其他地方详细说明的一些基本假设(例如线性)。(看到这里)当我们需要检验相关系数等于0的假设时,可能会出现问题。在这种情况下,我们需要确保所有成对的观察都是在独立的受试者身上进行的。

不幸的是,当从设计的现场试验中采取措施时,这通常是错误的。在这种情况下,观察可按一个或多个治疗/阻断因素分组。布兰德和奥尔特曼(1994年)对此作了明确的描述;我们想举一个与植物/作物科学更为密切相关的例子。想想基因型实金宝搏网址验,在这里,我们比较了随机分组设计中几个基因型的行为。通常,我们不仅衡量产量。我们还测量其他特征,如作物高度。实验结束时,我们可能有兴趣报告产量和高度之间的相关性。我们该怎么办?这看起来很容易,但事实并非如此。

假设我们有一个随机的块设计,有27个基因型和3个复制品。对于每一个情节,我们记录了两个特征,即产量和千粒重(tkw)。最后,我们有81个地块,所有的测量方法都一样多。我们将使用数据集“wheatsquality.csv”,可在“Github”上找到。

library(hmisc)library(knitr)library(plyr)dataset<-read.csv(“https://raw.githubusercontent.com/onofriendreapg/aomisc/master/data/wheatsquality.csv”,header=t)head(数据集)
##基因型区块高度tkw产量为whctol \35\35\35\\35\35\\35\35\35\\35\\\35\\\\35\\35\\35\\\35\\35\\\35\\\\\\35;6 baio 3 76 41.1 47.78 81.1

有多少相关性?

考虑到各种措施,计算出产量与总千瓦的相关系数,是一种很有吸引力的方法。结果是:

RA<-与(数据集,RCOR(产量)tkw)ra$r[1,2]相关系数
α〔1〕0.540957
RA$P[1,2]P-级
##[1]1.850931E-07

我们观察到正相关,和[(r)]似乎与0大不相同。因此,我们可以得出这样的结论:产量高的地块在tkw上往往具有较高的价值,也。不幸的是,数据不支持这样的结论。

的确,意义检验显然无效,因为81个地块不是独立的;它们是分块和基因型分组的,我们完全忽略了这两种效应。我们确定所有基因型/基因块的相关性相同吗?让我们检查一下。

wcor<-函数(x)cor(x$收益率,x$tkw)wgcors<-ddply(数据集,基因型,WCOR
##       Genotype         V1## 1   arcobaleno  0.9847228## 2         baio  0.1611952## 3      claudio -0.9993872## 4     colorado  0.9837293## 5     colosseo  0.4564855## 6        creso -0.5910193## 7       duilio -0.9882330## 8       gianni -0.7603802## 9       giotto  0.9520211## 10      grazia  0.4980828## 11       iride  0.7563338## 12    meridano  0.1174342## 13      neodur  0.4805871## 14      orobel  0.8907754## 15 pietrafitta -0.9633891## 16  portobello  0.9210135## 17   portofino -0.9900764## 18   portorico  0.1394211## 19       preco  0.9007067## 20    quadrato -0.5840238## 21    sancarlo -0.6460670## 22      simeto -0.4051779## 23       solex -0.6066363## 24 terrabianca -0.4076416 25 Verdi 0.5801404 26 Vesuvio-0.7797493 27 Vitromax-0.8056514
WBCORS<-ddply(数据集,~块,WCOR
##块v1 1 1 0.5998137 2 0.5399990 3 0.5370398

至于基因型,我们有27个相关系数,范围从-0.999到0.985。我们每个基因型只有三对测量值,很明显这并不多,可靠地估计相关系数。然而,足够怀疑产量与总千瓦的关联程度,金宝搏网址因为它可能取决于基因型。

另一方面,块内的相关性更为稳定,独立于地块上,类似于地块之间的相关性。

获得组内相关平均值的估计可能很有趣。为了这个目的,我们可以执行两个独立的方差分析(每个特征一个)。包括所有相关效应(区块和基因型),并计算残差之间的相关性:

mod1<-lm(产量因子(分块)+基因型,数据=数据集)mod2<-lm(tkw~因子(block)+基因型,数据=数据集)wcor<-rcorr(残差(mod1)残值(mod2))wcor$r
##X Y X 1.00000000 0.03133109 Y 0.03133109 1.00000000
华盛顿邮报
##x y x na 0.7812693 y 0.7812693 na

组内平均相关系数很小且不显著。让我们考虑一下这个相关性金宝搏网址:残差代表所有图的产量和tkw值,一旦阻断和基因型的效应被消除。残差的高相关性意味着,抛开它所属的基因块和基因型的影响,产量值高的图也显示了tkw的高值。这种相关性的存在显然不受数据集的影响。

作为下一步,我们可以考虑基因型/基因块的方法,看看它们是否相关。区块和基因型是独立的,原则上,允许进行显著性测试。然而,建议不要采用阻塞方式,因为三个数据太少,无法进行测试。

表示<-ddply(数据集,基因型,总结,mu1=平均值(产量)mu2=平均值(tkw))rgpear<-rcorr(as.matrix(means[,2:3]))rgpear$r
##μ1μ2μ1 1.0000000 0.5855966μ2 0.5855966 1.0000000
RPGPEA$P
##MU1 MU2 MU1 NA 0.00133149 MU2 0.00133149 NA
表示<-ddply(数据集,~块,总结,mu1=平均值(产量)mu2=平均值(tkw))rbpear<-cor(as.matrix(means[,2:3])rbpear
##μ1μ2μ1 1.00000000-0.08812544μ2-0.08812544 1.00000000

我们注意到基因型平均值之间的相关性很高且显著。相反地,块平均值之间的相关性接近于0。

那又怎样?

在这个阶段,你可能会困惑……让我们试着消除迷雾。

从设计的实验中获得可靠的相关性测量并不明显。的确,在每个设计的现场实验中,我们都有一组受试者,并且有几种可能的相关性:

  1. 绘图测量之间的相关性
  2. 残差之间的相关性
  3. 治疗/阻滞平均值之间的相关性

应研究所有这些相关性,并将其用于解释。

  1. 绘图测量之间的“幼稚”相关性很容易计算,但这是严重的误导。的确,它忽略了治疗/阻滞效应,不允许假设测试,因为受试者不是独立的。在这个例子中,看看“幼稚”相关系数,我们错误地认为高产的地块也有很高的tkw,虽然进一步的分析表明这不是真的,一般来说。我们可以合理地认为,“幼稚”相关系数从未用于解释。
  2. 残差之间的相关性是联合变量的可靠度量。因为实验设计有充分的参考价值,通过消除策略/块的影响。在这个例子中,残差不相关。进一步分析表明,产量与总千瓦的相关性。如果有的话,可能取决于基因型,但它不依赖于块。
  3. 治疗/阻滞之间的相关性意味着可以评估治疗/阻滞对两个性状的影响是否相关。在这种情况下,虽然我们不能得出这样的结论:产量和总功率一般来说,相关的,我们可以得出结论,产量高的基因型也显示出高水平的tkw。

带回家信息

每当我们有设计的现场实验数据时,我们的相关分析不应局限于计算观测值之间的“原始”相关系数。这可能没有意义!相反地,我们的解释应主要集中在残差之间的相关性和处理/区块效应之间的相关性。

Piepho(2018)提出了一种对设计现场试验数据进行声学相关分析的先进方法。在混合模型的框架内。这种方法将在另一篇文章中描述。

工具书类

  1. 温和的,J.M.奥特曼D.G.1994。统计说明:相关性,回归,以及重复的数据。BMJ 308,896—896。
  2. PiephoH.P.2018。在评估和测试特性相关性时,考虑到设计实验的结构。《农业科学杂志》156,59—70。

留下评论作者,请关注他们博客上的链接和评论: 在生物学家和统计学家之间的断桥上.

188bet appR博客提供 每日电子邮件更新金宝搏网址 R新闻与 教程关于以下主题: 数据科学大数据, r作业,可视化(可视化) GGPROTT2箱形图地图动画)程序设计(程序) 演播室斯威夫特乳胶SQL日食吉特哈多普刮网)统计 回归主成分分析时间序列交易还有更多…



如果你走这么远,为什么不 订阅更新 从站点?选择您的口味: 电子邮件推特1188bet app,或 脸谱网

注释已关闭。

搜索R-Blo188bet appggers


赞助商

千万不要错过更新!
订阅R-Bloggers188bet app接收
最新R帖子的电子邮件。
(您将不再看到此消息。)

单击此处关闭(此弹出窗口将不再出现)