作者choucj (心尘)
看板tutor
标题Re: [解题] 高二下数学 叙述统计观念
时间Wed Jun 20 10:36:50 2007
※ 引述《yonex (戴奥尼索斯)》之铭言:
: ※ 引述《choucj (心尘)》之铭言:
: : 抱歉这边我切断一下,
: : 因为您底下的叙述,又是利用更多问题来解释一个问题的方式。
: : 当然您有提出一个故事
: 你好,我想你误会我的原意了...
: 因为我预设回覆的问题是:为何样本变异数不选择 n,而选择 n-1
: 对於一个资质普通的高中生,
: 我的陈述说明了:
: 样本变异量仍然除以n,所估计到的母体变异数就会「低估」了
: 就估计母体而言,样本变异量的分母放 n-1,会缓和低估现象...
: 就二选一的前提来说,我的工作已经结束....
: 我承认一个程度较佳的学生可能还会进一步的问:
: 换成n-1来估计母体,难道就不会高估吗?
: n-0.5 n-0.3 .....其余的可能性不该继续考虑吗?
: 是的,这确实是有继续努力下去的必要...
: 但我并不打算继续回答下去...
: 因为这讨论牵扯到不偏估计理论,对一个中学生无疑是不胜负荷的...
原文已阅毕,感谢您精辟的回应。
但对於我切断的部分,实在是「正常」的一位中学生都会产生的疑问。
即便知道许多对於他们现阶段会有的难度问题,
但以「低估」的这种敷衍的回应方式,
实在是一种更规避且不负责任的作法。
我不知道从哪一本书里,开始产生这样的解释,
但我相信在初始状况,
这样的用法应该只是阐明使用 n 将会造成的问题,
尔後,却被引用为使用 n-1 会比较好?!
明白的说,与其不清不楚的用了一个有理论基础的 n-1,
我倒宁可中学生就乾脆用 n ,就用 n。
理由很简单,
1.中学生不会教到不偏。
2.变异数在中学的阶段的目的是为了比较,在同样的标准之下,
其实这两者是没有差别的。
3.在早期用 n 的时代里面,我们曾经会因此在用 n-1 替换时,产生困扰吗?
我相信不仅没有,反而正重视这突来的改变。
4.您既然打从一开始就不打算告诉他原因了,
何必让学生了解了一堆摸不着边际的原因,浪费了依堆学习时间在上面?
却换不到一个有理论依据的答案??
: 用 n-1 除是为了满足「不偏性」使得E(s^2)=σ^2成立...
: 在统计上一个好的估计量常被要求满足不偏性
: 样本变异数究竟是否为母体变异数的不偏估计
: 这还牵扯到各样本是否独立的问题
: 经由简单随机抽样,若所选取之样本可以再放回
: 此时母体变异数定义为以 N 为分母,
: 那麽样本变异数以n-1来除才满足不偏性
: 若是有限母体取後不放回(事实上这更普遍),
: 即使样本变异数以n-1来除仍是有偏的
: 这时反而是母体该采取 N-1....(国外教材中以这个观点更为常见)
................................这句话有待商榷,母体采取 N-1 ?
: 至於「标准差」估计母体,以不偏性考量,
: 则无论是以 n-1、n 来除,标准差的估计都有「误差」...
: 换言之...除以 n 或除以 n-1,都是「人为」的...
: 既然是「人为」的,当然就可以讲出一番道理,但这道理却不绝对,
这里实在难以认同,
1.样本统计量当然有误差,但不代表用 n, n-1因此都没差。
2.道理不绝对也是道理,就是依据。
: 这也是统计学和数学在学习心理上的差异(统计学不是数学)
: (或许我们说:随机性数学与确定性数学之差异会更好)
: 即使对於初学统计的大学生来说,这一整串的论证仍然容易造成混淆
: 何况是对於没接触过推论统计的中学生而言呢?
这点我认同,
所以使用 n-1实在是挖个洞让别人跳的行为。
更何况放眼高中数学教师,有多少比例知道不偏?
普遍知道的解释就是「因为用 n 会低估所以用 n-1....」
: 这也是我提起费曼的故事以为殷监的原因...
: 我同意一个老师要尽量站在高观点的立场来指导数学
: 但是当此立场与学习者之认知有所冲突时,
: 便应该以学生的可接受性为主要考量。
: 仅仅解释为何 n-1 会比 n 来的适当,对中学生我想是够了....
: 在这里提供一个自由度观点解释的理路
: 对象是中学生,当然不偏性估计的讨论只好舍弃.....
: .............
: 样本点对於平均数的离差定义为 Di=Xi-M
: 但是 n 个离差 D1,...,Dn , 并不代表n个独立自由变数
: 因为受一个先天的限制式所约束:ΣDi=Σ(Xi-M) = 0
: 所以只有 n-1 个是自由的
: 换言之...当我们知道了五个离差中的四个,第五个离差值便自动决定
: 这就是最初浅的「自由度」解释,大概也是一般高中生比较能接受的....
: n 个离差,具有n-1个自由度
: 这代表离差布於R^n空间中的n-1度子空间
: 而其平方和 ΣDi^2 (样本变异"量") 也具有 n-1个自由度
: 这在向量空间中代表着 n 度空间中,一点至原点距离的平方
: 因而样本变异"数"也是具有 n-1 个自由度
: 一个自由度提供一份变异量,
: n-1 个自由度提供 n-1 份变异量。
: 所以总变异量是 n-1 份变异量的和,
: 除以 n-1 就是平均每一自由度的贡献。
: 这就是之所以除以自由度,而不是除以离差数的原因...
: 娴熟线性代数的学生,更可以用较抽象的高观点去体会...
: R^n 中的一个向量 X=(X1,...,Xn)
: 投影到 S=(1,1,...,1)的分量就是样本平均数。
: 样本变异数即是垂直投影向量,也就是残差向量的长度平方
: 显然....S的自由度为1,X的自由度为n,(空间概念中可能你会喜欢叫它维度,这无妨..)
: 因而样本变异数的自由度为n-1
: ................
: 试图以「包装後的数学语言」让一个中学生得以体会
: 你的出发点是值得嘉许的
: 但切莫注意不可曲学以诠释...
: 即使是良善的立意也不代表什麽事情都能妥协
: 像是该用数学期望值时,就不应该刻意省略,
: 写下 "Σ(Xi-M)^2= n-1个母体变异数" 是不被允许的
这部分实在是不得已的误谬,
只能说要找到适当的词汇来叙述这样的感觉不容易。
: 发明一些不存在的统计陈述更要避免...
: 这对学生的误导比帮助还要更大....
: 你可以再仔细检视一下自己的论述,讹误处挺多的...
: 我就不一一举证了...
这话轻轻带过,但挺重的,您可以每段有误的地方简单用「...」
正如同我对您的文章论述,
您可以自己看看你自己的论述,引用了自由度、离差、向量,
却始终在边边绕,
我们就单针对一点,
「为何平均每一个自由度的贡献就能达到不偏?」
: 不过你的立意是良好的,我赞美你尝试的努力...
: 规避不偏性而又能具备完备的解释,就我而言也是做不到.....
: 但我却也不想走一条以偏盖全的路啦...
: 把努力放在未来,对学生还是比较好的....
何为偏?何为全?
数学要教给学生,抓的是他的精神跟价值,
今天我们即使用自由度去作诠释,
但自由度的代表性本身就存在一个疑问,
我们用一个疑问去解释另一个疑问,
我想最大的效益就是让授课的教师当下免除自己的责任,
至少他当下说的有凭有据,学生听不懂或不理解的以後就懂了...
然而,这样的方式应是最後的手段啦~
只是放在统计这边,让人觉得似乎还太早。
中学教师教学,
学生听的懂是教师的责任,学生学到会是他自己的责任。
如果我们连第一个责任都要规避,
那似乎不是一个应有的敬业态度。
我宁可教科书上写的解释是,
「使用 n-1系属大学统计不偏估计部分,高中阶段不做详述。」
也不愿意它给个,
「因为用 n低估,所以用 n-1」的答案....
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 163.21.252.200
1F:推 showind83:个人觉得本文最後两个说法可以是学生程度告知 06/20 10:38
2F:→ showind83:但是重点是考试要会得分,不要想太多,也不要都不思考 06/20 10:40