关于 r:tapply 与 FUN = function(x){} 的用法

usage of tapply with FUN = function(x){}

在我的任务中,我想按性别找到温度的平均值。我们可以通过 tapply 命令来做到这一点。我也不允许使用平均命令:

1
tapply(df$temperature,df$gender,FUN = function(x){sum(x)/length(df[,1])})

但它给了我错误的结果。它只是将结果除以 2,而不是找到两个性别的平均值。
我该如何解决?
因为聚合函数一切正常:

1
  aggregate(df$temperature,by = list(df$gender),function(x){sum (x)/length(x)})


确认 sum(x)/length(x) 是这里的方法:

创建模拟数据集:

1
2
3
set.seed(1)
d<-data.frame(temperature=rnorm(1000,500,20),
              gender=rep(c('M','F'),500))

使用带有自定义平均函数的tapply按性别计算平均温度

1
2
3
> tapply(d$temperature, d$gender, function(x){ sum(x)/length(x)})
       F        M
500.0884 499.4457

确认这与基础 mean() 函数匹配:

1
2
3
4
> mean(d$temperature[d$gender=='F'])
[1] 500.0884
> mean(d$temperature[d$gender=='M'])
[1] 499.4457