关于python：为什么numpy std()与matlab std()给出不同的结果？

Why does numpy std() give a different result to matlab std()?

我尝试将matlab代码转换为numpy，并发现numpy与std函数的结果不同。

在MATLAB中

1 2	std([1,3,4,6]) ans = 2.0817

以numpy

1 2	np.std([1,3,4,6]) 1.8027756377319946

这正常吗？而我应该如何处理呢？

NumPy函数np.std采用可选参数ddof："自由度增量"。默认情况下，这是0。将其设置为1以获得MATLAB结果：

1 2	>>> np.std([1,3,4,6], ddof=1) 2.0816659994661326

要添加更多上下文，在计算方差(标准差为平方根)时，通常将其除以我们拥有的值的数量。

但是，如果我们从较大的分布中随机选择N个元素的样本并计算方差，则将N除以会导致实际方差的低估。为了解决这个问题，我们可以将除以(自由度)的数字降低到小于N(通常是N-1)的数字。 ddof参数允许我们按指定的数量更改除数。

除非另有说明，否则NumPy将计算方差(ddof=0除以N)的有偏估计量。如果要使用整个分布(而不是从较大的分布中随机选择的值的子集)，这就是您想要的。如果给出了ddof参数，则NumPy会除以N - ddof。

MATLAB std的默认行为是通过除以N-1来校正样本方差的偏差。这消除了标准偏差中的某些(但可能不是全部)偏差。如果您是在较大分布的随机样本上使用该函数，则可能正是您想要的。

@hbaderts的不错回答给出了进一步的数学细节。