How to manually create box plots in R with two categories on x-axis
我看到了非常相似的问题,但没有一个完全符合我的尝试。
我有以下RWE:
1 2 3 4 5 6 7 8 9 10 11 12 13 | n1 = 177 avg1 = 7.508192 sd1 = 5.439677 error1 <- qnorm(.975) * sd1/sqrt(n1) avg1 - error1 avg1 + error1 n2 = 93 avg2 = 6.713011 sd2 = 3.22479 error2 <- qnorm(.975) * sd2/sqrt(n2) avg2 - error2 avg2 + error2 |
通过计算平均误差,我可以看到置信区间重叠的程度;但是,我希望以均值的方式并排绘制这两组数据
嘿,如果要绘制95%CI,则以R为底的箱线图可能不是最好的。因为您必须使用晶须作为置信区间?您可以将geom_point()与geom_errorbar()结合使用,请参阅我使用您的值创建的示例数据集:
1 2 3 4 5 6 7 8 9 10 | x = data.frame( x=rep(c("a","b"),each=2), data=rep(c("A","B"),2), avg=rep(c(avg1,avg2),2), lower=rep(c(avg1 - error1,avg2 - error2),2), upper=rep(c(avg1 + error1,avg2 + error2),2) ) ggplot(x,aes(x=x,y=avg,col=data,ymin=lower,ymax=upper)) + geom_point(position=position_dodge(width=0.1)) + geom_errorbar(width=0.1,position=position_dodge(width=0.1)) |
您的数据表明,您希望绘制平均值并指出95%的置信区间。这可以通过
当然,与"炸药图"(又称带有误差线的条形图)相比,正确的箱形图可提供更多的信息。因此,如果您确实有原始数据,或者可以获取构造一个原始数据所必需的摘要统计信息,则更好。