作者yonex (戴奥尼索斯)
看板tutor
标题Re: [解题] 高二下数学 叙述统计观念
时间Tue Jun 19 00:58:58 2007
※ 引述《choucj (心尘)》之铭言:
: ※ 引述《yonex (戴奥尼索斯)》之铭言:
: : 4.重点开始:为何计算样本变异数要用 n-1 除?
: : 假设:母体平均数μ 样本平均数 M
: : 计算母体变异数时用 N 来除,无论就逻辑或直觉而言,都是非常显然的
: : 但是我们现在要做的是:以样本变异数来估计母体变异数
: : ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
: : 在处理样本时,计算「观测值与"平均数"间离差的平方加总」的当下,
: : 那个"平均数"究竟是母体平均数还是样本平均数呢?
: : 当然以母体平均数是最好,不过如"2."所述,我们拥有的只是样本平均数
: : ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
: : 母体的变异量:Σ(Xi-μ)^2
: : 样本的变异量:Σ(Xi-M)^2
: : Σ(Xi-μ)^2=Σ(Xi-M+M-μ)^2=Σ(Xi-M)^2+n(M-μ)^2
: : ^^^^^^^^^^^^ ^^^^^^^^^^^
: 抱歉这边我切断一下,
: 因为您底下的叙述,又是利用更多问题来解释一个问题的方式。
: 当然您有提出一个故事
你好,我想你误会我的原意了...
因为我预设回覆的问题是:为何样本变异数不选择 n,而选择 n-1
对於一个资质普通的高中生,
我的陈述说明了:
样本变异量仍然除以n,所估计到的母体变异数就会「低估」了
就估计母体而言,样本变异量的分母放 n-1,会缓和低估现象...
就二选一的前提来说,我的工作已经结束....
我承认一个程度较佳的学生可能还会进一步的问:
换成n-1来估计母体,难道就不会高估吗?
n-0.5 n-0.3 .....其余的可能性不该继续考虑吗?
是的,这确实是有继续努力下去的必要...
但我并不打算继续回答下去...
因为这讨论牵扯到不偏估计理论,对一个中学生无疑是不胜负荷的...
用 n-1 除是为了满足「不偏性」使得E(s^2)=σ^2成立...
在统计上一个好的估计量常被要求满足不偏性
样本变异数究竟是否为母体变异数的不偏估计
这还牵扯到各样本是否独立的问题
经由简单随机抽样,若所选取之样本可以再放回
此时母体变异数定义为以 N 为分母,
那麽样本变异数以n-1来除才满足不偏性
若是有限母体取後不放回(事实上这更普遍),
即使样本变异数以n-1来除仍是有偏的
这时反而是母体该采取 N-1....(国外教材中以这个观点更为常见)
至於「标准差」估计母体,以不偏性考量,
则无论是以 n-1、n 来除,标准差的估计都有「误差」...
换言之...除以 n 或除以 n-1,都是「人为」的...
既然是「人为」的,当然就可以讲出一番道理,但这道理却不绝对,
这也是统计学和数学在学习心理上的差异(统计学不是数学)
(或许我们说:随机性数学与确定性数学之差异会更好)
即使对於初学统计的大学生来说,这一整串的论证仍然容易造成混淆
何况是对於没接触过推论统计的中学生而言呢?
这也是我提起费曼的故事以为殷监的原因...
我同意一个老师要尽量站在高观点的立场来指导数学
但是当此立场与学习者之认知有所冲突时,
便应该以学生的可接受性为主要考量。
仅仅解释为何 n-1 会比 n 来的适当,对中学生我想是够了....
在这里提供一个自由度观点解释的理路
对象是中学生,当然不偏性估计的讨论只好舍弃.....
.............
样本点对於平均数的离差定义为 Di=Xi-M
但是 n 个离差 D1,...,Dn , 并不代表n个独立自由变数
因为受一个先天的限制式所约束:ΣDi=Σ(Xi-M) = 0
所以只有 n-1 个是自由的
换言之...当我们知道了五个离差中的四个,第五个离差值便自动决定
这就是最初浅的「自由度」解释,大概也是一般高中生比较能接受的....
n 个离差,具有n-1个自由度
这代表离差布於R^n空间中的n-1度子空间
而其平方和 ΣDi^2 (样本变异"量") 也具有 n-1个自由度
这在向量空间中代表着 n 度空间中,一点至原点距离的平方
因而样本变异"数"也是具有 n-1 个自由度
一个自由度提供一份变异量,
n-1 个自由度提供 n-1 份变异量。
所以总变异量是 n-1 份变异量的和,
除以 n-1 就是平均每一自由度的贡献。
这就是之所以除以自由度,而不是除以离差数的原因...
娴熟线性代数的学生,更可以用较抽象的高观点去体会...
R^n 中的一个向量 X=(X1,...,Xn)
投影到 S=(1,1,...,1)的分量就是样本平均数。
样本变异数即是垂直投影向量,也就是残差向量的长度平方
显然....S的自由度为1,X的自由度为n,(空间概念中可能你会喜欢叫它维度,这无妨..)
因而样本变异数的自由度为n-1
................
试图以「包装後的数学语言」让一个中学生得以体会
你的出发点是值得嘉许的
但切莫注意不可曲学以诠释...
即使是良善的立意也不代表什麽事情都能妥协
像是该用数学期望值时,就不应该刻意省略,
写下 "Σ(Xi-M)^2= n-1个母体变异数" 是不被允许的
发明一些不存在的统计陈述更要避免...
这对学生的误导比帮助还要更大....
你可以再仔细检视一下自己的论述,讹误处挺多的...
我就不一一举证了...
不过你的立意是良好的,我赞美你尝试的努力...
规避不偏性而又能具备完备的解释,就我而言也是做不到.....
但我却也不想走一条以偏盖全的路啦...
把努力放在未来,对学生还是比较好的....
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.56.182.48
1F:推 alamabarry:未看先推....一系列要看都还没看 06/19 01:06
※ 编辑: yonex 来自: 61.56.182.48 (06/19 04:07)