标准差公式计算

时间:2020-11-17 15:38:19

标准差：标准差是数值分散的测量，在这里我们会解释标准差的公式，标准差的符号是 σ，

这是标准差的公式：

好的。逐步来，假设我们有一些数值，像：9、2、5、4、12、7、8、11，计算这些数值的标准差：

一、求数值的平均
二、从每一个数值减去平均，然后求差的平方
三、求结果的平均。
四、取平均的平方根。就是这么简单！

公式已经包括了这四步，下面我再具体解释。

公式说明，我们会用一些数值作为例子：

例子：森森有 20棵蔷薇丛，每棵丛上花的数目是

9、2、5、4、12、7、8、11、9、3、7、4、12、5、4、10、9、6、9、4，求标准差。

一、求数值的平均，在上面的公式 μ（希腊语字母 "缪"，英语 "mu"）是全部数值的平均……

例子：9、2、5、4、12、7、8、11、9、3、7、4、12、5、4、10、9、6、9、4

平均是：

9+2+5+4+12+7+8+11+9+3+7+4+12+5+4+10+9+6+9+420

= 14020 = 7

所以：

μ = 7

二、从每一个数值减去平均，然后求差的平方

这诗式的这个部分：

x_i 是什么意思？它们是个别的 x值：9、2、5、4、12, 7、…例如， x₁ = 9, x₂ = 2, x₃ = 5 等等，就是说： "从每一个数值减去平均，然后求差的平方"，像这样：

例子（续）：

(9 - 7)² = (2)² = 4

(2 - 7)² = (-5)² = 25

(5 - 7)² = (-2)² = 4

(4 - 7)² = (-3)² = 9

(12 - 7)² = (5)² = 25

(7 - 7)² = (0)² = 0

(8 - 7)² = (1)² = 1

等等 ……结果是：4、25、4、9、25、0、1、16、4、16、0、9、25、4、9、9、4、1、4、9，

三、求结果的平均。

求平均：把所有的值加起来，然后除以值的个数。

先把上一步算出来的值加起来，我们怎样用数学的语文来说："加起来"？我们用 "西格马": Σ

这个简单的总和符号的意思是把项相加：

我们想从 1 到 N 把数值加起来，N=20，因为有 20个数值：

例子（续）：

这个的意思是：从 (x₁-7)² 到 (x_N-7)²，把所有的数值加起来，

在上一步我们已经计算了 (x₁-7)²=4 等，所以我们只需把结果加起来：

= 4+25+4+9+25+0+1+16+4+16+0+9+25+4+9+9+4+1+4+9 = 178

这还不是平均值，我们要除以个数，就是乘以 "1/N":

例子（续）：

平方差的平均 = (1/20) × 178 = 8.9

（注意：这叫 "方差"）

四、取平方根：
例子（终）：

σ = √(8.9) = 2.983……

样本标准差，慢着，还有一点……有时我们的数据只是总体的一个样本。

例子：森森有 20棵蔷薇丛，但她只数了 6棵上的花！"总体" 是全部 20棵蔷薇丛，而 "样本" 是森森数的 6棵。假设森森的数据是：9、2、5、4、12、7，

我们可以估计标准差的值，但当我们用样本作为总体的估计，标准差的公式变成这样：

样本标准差公式：

重要的改变是除以 "N-1"，而不除以 "N"（这叫 "贝塞尔无偏估计校正系数"），我们也改变了符号，以显示数据是样本而不是总体：平均变成 x （代表样本平均），而不是 μ（总体平均），答案是 s（样本标准差），而不是 σ。但算法是一样的，不过用 N-1 而不用 N。

我们来计算样本标准差：

一、求数值的平均

例 2：用样本值 9、2、5、4、12、7，平均是 (9+2+5+4+12+7) / 6 = 39/6 = 6.5，所以：x = 6.5，

二、从每一个数值减去平均，然后求差的平方

例 2（续）：

(9 - 6.5)² = (2.5)² = 6.25

(2 - 6.5)² = (-4.5)² = 20.25

(5 - 6.5)² = (-1.5)² = 2.25

(4 - 6.5)² = (-2.5)² = 6.25

(12 - 6.5)² = (5.5)² = 30.25

(7 - 6.5)² = (0.5)² = 0.25

三、求结果的平均。
求平均，把所有的数值加起来，然后除以数值的个数，慢着……我们是在计算样本标准差，所以我们不除以个数（N），而除以 N-1，

例 2（续）：

和 = 6.25 + 20.25 + 2.25 + 6.25 + 30.25 + 0.25 = 65.5

除以 N-1: (1/5) × 65.5 = 13.1

（这叫 "样本方差"）

四、取平方根：

例 2（续）：

[ (1/(N-1)) 乘 (xi - xbar)^2 从 i=1 到 N 的总和] 的平方根

s = √(13.1) = 3.619……

比较，用总体来计算，结果是：平均 = 7，标准差 = 2.983,用样本，结果是：样本平均 = 6.5，样本标准差 = 3.619,样本平均的误差是 7%，样本标准差的误差是 21%,

为什么要用样本？
主要是因为比较容易和便宜,想象你想知道所有国民的想法,你不可能问上亿的人，所以你只问 1,000个人。

有句名言（相传是英国文人塞缪尔·约翰逊讲的）：

你不需要吃掉整条牛来知道它的肉是韧的,这就是取样本的精髓。我们不需要看总体来知道它的资料（例如平均和标准差），我们只需要看样本,可是，当我们取样本时，精确度便会降低。

总结

总体标准差：
样本标准差：

载入中…

点这里查看与之相关的计算

下一篇：互动三角形--三角形三边关系

上一篇：标准差在线计算器

标准差公式计算

例子：森森有 20棵蔷薇丛，每棵丛上花的数目是

例子：9、2、5、4、12、7、8、11、9、3、7、4、12、5、4、10、9、6、9、4

二、从每一个数值减去平均，然后求差的平方

例子（续）：

三、求结果的平均。

例子（续）：

例子（续）：

例子：森森有 20棵蔷薇丛，但她只数了 6棵上的花！"总体" 是全部 20棵蔷薇丛，而 "样本" 是森森数的 6棵。假设森森的数据是：9、2、5、4、12、7，

例 2：用样本值 9、2、5、4、12、7，平均是 (9+2+5+4+12+7) / 6 = 39/6 = 6.5，所以：x = 6.5，

二、从每一个数值减去平均，然后求差的平方

例 2（续）：

例 2（续）：

四、取平方根：

例 2（续）：

相关文章