作者choucj (心尘)
看板tutor
标题Re: [解题] 高二下数学 叙述统计观念
时间Sat Jun 16 23:57:41 2007
※ 引述《yonex (戴奥尼索斯)》之铭言:
: ※ 引述《Simon (我是素食宝宝N ﰠ )》之铭言:
: : 1.年级:高二
: : 2.科目:数学
: : 3.章节:叙述统计
: : 请问 为何母体变异数(标准差) 与 样本变异数(标准差)的公式中
: : 前者分母取 N 後者则取 N-1
: : 为何会有这样的差别,有何理论根据吗?
: : 另外,考试时如果要考母体的变异数(标准差) 是否一定会指明?
: 考试的话,通常会说明这是样本或母体...
: 否则,可依照现行课本所陈述,一律视为讨论「样本」变异数(标准差)
: 1.如果说,「平均数」提供了观测资料「中心点」的位置
: 那麽,「离差」就是表达资料分散的状况(离差越小,资料同质性越高)
: 在各种离差统计量中,以「标准差」最为常用...
: 2.母体的统计量常常是不容易得到的
: (例如:调查全国老百姓体重,困难度可想而知了)
: 所以抽样调查,用样本统计量推论母体统计量
: 如果说母体的全部资料总是可以(轻松)取得,那还学什麽统计呢?
: 在这里先谨记:我们往往拥有的,只是样本的资料数据
: 当然,样本数越大越好,至於要多大,在这里就不节外生枝了....
: 3.将:「观测值与平均数间离差的平方加总後,再取平均」
: 我们称之为「变异数」,可是因为变异数将资料的测量单位取了平方
: 所以为了让单位一致起见,取其开平方值,定义为「标准差」
: 无论是标准差或变异数,都是衡量观测值和平均值之间差异的统计量
: ---------------------
: 4.重点开始:为何计算样本变异数要用 n-1 除?
: 假设:母体平均数μ 样本平均数 M
: 计算母体变异数时用 N 来除,无论就逻辑或直觉而言,都是非常显然的
: 但是我们现在要做的是:以样本变异数来估计母体变异数
: ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
: 在处理样本时,计算「观测值与"平均数"间离差的平方加总」的当下,
: 那个"平均数"究竟是母体平均数还是样本平均数呢?
: 当然以母体平均数是最好,不过如"2."所述,我们拥有的只是样本平均数
: ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
: 母体的变异量:Σ(Xi-μ)^2
: 样本的变异量:Σ(Xi-M)^2
: Σ(Xi-μ)^2=Σ(Xi-M+M-μ)^2=Σ(Xi-M)^2+n(M-μ)^2
: ^^^^^^^^^^^^ ^^^^^^^^^^^
抱歉这边我切断一下,
因为您底下的叙述,又是利用更多问题来解释一个问题的方式。
当然您有提出一个故事,不过,
我想这是可以「努力」的部分,暂时还不用靠一个例子来带过。
我们的目的想是在解释Σ(Xi-M)^2代表的应该是多少个变异数。
例如:标准差的基本定义里面,
我们允许Σ(Xi-μ)^2代表n个样本变异数。
(这点同时代表(Xi-μ)^2为1个样本变异数..................(*))
所以针对样本的变异数表达方式,
我们只要了解Σ(Xi-M)^2应该是代表多少个变异数?n或n-1,n-2甚至n-(1/2)?
这个数字的答案,就是我们去除以n或n-1,n-2,...的理由。
我们若将上式转为
Σ(Xi-M)^2 = Σ(Xi-μ)^2 - n(M-μ)^2
= n个母体变异数 - n个平均数的母体变异数
~~~~~~~~~~~~~~~~~~~~~~(**)
(**) = n[(X1+X2+...+Xn)/n-μ]^2
= n[(X1+X2+...+Xn)-nμ]^2/n^2
= [(X1+X2+...+Xn)-nμ]^2/n
= [(X1-μ)+(X2-μ)+...+(Xn-μ)]^2/n
= [(X1-μ)^2+(X2-μ)^2+...+(Xn-μ)^2+...]/n , PS:...略XD
= n个母体变异数/n
= 1个母体变异数
上面也就说明了,如果说每个样本Xi都产生1个母体变异数,
那n个样本X1,X2,...,Xn就产生了n个母体变异数,
那这n个样本的平均数M就是产生了1/n个母体变异数。
所以,Σ(Xi-M)^2 = n个母体变异数 - n个平均数的母体变异数
= n个母体变异数 - n*(1/n个母体变异数)
= n-1个母体变异数。
上面便解释了将Σ(Xi-M)^2除以n-1的理由。
: 由式子我们可看出:样本变异量低估了母体变异量
: 如果说样本变异量仍然除以n,所估计到的母体变异数就会「低估」了
: 就估计母体而言,样本变异量的分母放 n-1 ,会缓和低估现象...
: 不用 n 而以 n-1 来除的合理性就在於此...
: 事实上,本问题在初等统计中...通常是以「不偏性」等观念来说明...
: 「自由度」的解释,则是需要线性代数的观念
: 这样的学习路线,对於一个高中生来说是无以负荷的....
: 即使对初学统计者而言,也不适当
: 至於为什麽? 这又是另一出漫长的故事,不打算继续罗唆了....
: : 虽然公式就是公式 但还是想了解一下比较学理方面讲解
: : 像我教学生时 也会试着去解释公式的来源与意义
: : 例如 母体的平均数 μ 与 样本平均数的不同意义
: : 所以想了解一下 上述的问题
: 有一次加州理工学院的物理学家请教费曼:
: 何以自旋(spin)1/2的粒子必须遵守费米-狄拉克统计?
: 费曼说:「先给我一些时间,我准备用大一普通物理的观念程度试着回答你」
: 过没几天费曼告诉那位教授:
: 「很抱歉,我已经试过了,但是一直无法把它简化到大一程度。
: 也就是说,我们其实还不了解真正了解这个现象...」
: 同样的,挑战者号太空梭失事的真相调查,忙坏了全世界的科学家....
: 其实那也不过是一杯冰水与橡皮筋的故事...
: 任何正常程度的中小学生都能掌握.....
: 还有後话,不过先就此打住了....
: 我只是相信:当一个人能够用深入浅出的方式表达,
: 通常意味着对问题的脉络有着更通透的了解...
: 否则,我会怀疑他对於那些观念,真有他以为的那麽充分掌握?!
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 59.120.196.114
1F:推 handicap:讲得相当清楚, 不晓得教给高中生的接受度如何? :D 06/17 01:16