最当地

 找回密码
 立即注册

!tpl_text1!

微信扫码登录

!qq_htm_1!

搜索
热搜: 活动 交友 特产
新来朋友

快乐37

是超超呀

米卡尼卡

mx49781

测试

洁菓

粉色娇嫩

半城烟雨

9186猛子

野猪川苦茶

KE9335

XUEBI

oldm

Eden

坚持。就是胜利

L2152

巴巴拉拉

单瓶霜

是条谜

Yuki言炎

遗忘梦想

W

余笙

mx17183

老鱼

查看: 939|回复: 0

样本标准差分母为何是n-1?

[复制链接]

202

主题

224

帖子

8673

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
8673
发表于 2017-4-6 01:43:45 | 显示全部楼层 |阅读模式 IP属地: 中国浙江杭州
大家好,今天给大家介绍标准差。标准差在统计领域是一个重要概念,有些地方晦涩难懂,特别是样本标准差的分母为何是n-1,而不是n或n-2,接下来我会一一介绍并用计算机模拟难点。    什么是标准差?下面看两组数[28,29,30,31,32],[10,20,30,40,50],它们的平均数都是30。这两组数是一致的吗?实际上,这两组数离散程度有很大区别。

e454251d113821e7a1c09b4a2c5d4a8d.jpg

用numpy模块计算,两组数的标准差相差10倍

e9c610c7f6c810c5b59e7fff3628118e.png


8823f85bdcb4dd0a7251157048d1a5e1.jpg
方差是实际值与期望值之差平方的平均值。方差,通俗点讲,就是和中心偏离的程度!用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差。记作S2。 在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定。标准差就是方差的平方根。方差和标准差用于不同场合,方便计算。
(标准差英文解释)
73812c5ce7a057d805c76b6f03a0f878.jpg

方差公式

466644028d676ff677a914452259e37e.png

标准差公式

9b3c8e6378bd5b61066062408edbd92f.png

难点来了,总体标准差和样本标准差的公式是有区别的,如下图

6a0497326ec5a288c805dd751811e03b.jpg

样本标准差公式中,分母是n-1。

f97a7686bd8a65cbf2397c98892f06d2.png

为何样本标准差的分母为何是n-1,而不是n或n-2?
我们用计算机建模,环境Anaconda(python2.7)

3c7dd5d35b6db9a6329e7f64ca6c84df.jpg

参数解释
Sigma表示总体标准差
S表示样本标准差
ddofValue=0 表示样本标准差分母是n
ddofValue=1 表示样本标准差分母是n-1
ddofValue=2 表示样本标准差分母是n-2
算法思路
1.模拟出一个总体(服从正态分布的1000个随机数)
2. 从总体中随机抽样(100个随机数)
3.分别算出总体和样本的标准差,然后相减得到distance差值
4.循环1000次试验,把1000个distance相加,得到total_distance
5.在步骤3中,分别对样本标准差的分母取n, n-1,n-2,  最终得到dict_modes
观察dict_modes,ddof1的绝对值最小3.8
ddof1=1 表示样本标准差分母是n-1

398a7360e453e281f0c3ec8bcb126471.jpg
总结:s样本标准差的分母采用n-1更加接近真实的总体标准差。通过计算机模拟,我们证明了为什么样本标准差的分母n-1比较合适,而不是n或n-2。
4b1dd4d522bce0359bab79a23b202306.gif
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册  

本版积分规则

Archiver|手机版|小黑屋|最当地 |浙!beian!33049802000143!hao!

GMT+8, 2026-4-21 22:08 , Processed in 1.830921 second(s), 32 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表