作者yonex (戴奥尼索斯)
看板tutor
标题Re: [解题] 高二下数学 叙述统计观念
时间Sat Jun 16 14:22:52 2007
※ 引述《Simon (我是素食宝宝N ﰠ )》之铭言:
: 1.年级:高二
: 2.科目:数学
: 3.章节:叙述统计
: 请问 为何母体变异数(标准差) 与 样本变异数(标准差)的公式中
: 前者分母取 N 後者则取 N-1
: 为何会有这样的差别,有何理论根据吗?
: 另外,考试时如果要考母体的变异数(标准差) 是否一定会指明?
考试的话,通常会说明这是样本或母体...
否则,可依照现行课本所陈述,一律视为讨论「样本」变异数(标准差)
1.如果说,「平均数」提供了观测资料「中心点」的位置
那麽,「离差」就是表达资料分散的状况(离差越小,资料同质性越高)
在各种离差统计量中,以「标准差」最为常用...
2.母体的统计量常常是不容易得到的
(例如:调查全国老百姓体重,困难度可想而知了)
所以抽样调查,用样本统计量推论母体统计量
如果说母体的全部资料总是可以(轻松)取得,那还学什麽统计呢?
在这里先谨记:我们往往拥有的,只是样本的资料数据
当然,样本数越大越好,至於要多大,在这里就不节外生枝了....
3.将:「观测值与平均数间离差的平方加总後,再取平均」
我们称之为「变异数」,可是因为变异数将资料的测量单位取了平方
所以为了让单位一致起见,取其开平方值,定义为「标准差」
无论是标准差或变异数,都是衡量观测值和平均值之间差异的统计量
---------------------
4.重点开始:为何计算样本变异数要用 n-1 除?
假设:母体平均数μ 样本平均数 M
计算母体变异数时用 N 来除,无论就逻辑或直觉而言,都是非常显然的
但是我们现在要做的是:以样本变异数来估计母体变异数
^^^^^^^^^^^^^^^^^^^^^^^^^^^^
在处理样本时,计算「观测值与"平均数"间离差的平方加总」的当下,
那个"平均数"究竟是母体平均数还是样本平均数呢?
当然以母体平均数是最好,不过如"2."所述,我们拥有的只是样本平均数
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
母体的变异量:Σ(Xi-μ)^2
样本的变异量:Σ(Xi-M)^2
Σ(Xi-μ)^2=Σ(Xi-M+M-μ)^2=Σ(Xi-M)^2+n(M-μ)^2
^^^^^^^^^^^^ ^^^^^^^^^^^
由式子我们可看出:样本变异量低估了母体变异量
如果说样本变异量仍然除以n,所估计到的母体变异数就会「低估」了
就估计母体而言,样本变异量的分母放 n-1 ,会缓和低估现象...
不用 n 而以 n-1 来除的合理性就在於此...
事实上,本问题在初等统计中...通常是以「不偏性」等观念来说明...
「自由度」的解释,则是需要线性代数的观念
这样的学习路线,对於一个高中生来说是无以负荷的....
即使对初学统计者而言,也不适当
至於为什麽? 这又是另一出漫长的故事,不打算继续罗唆了....
: 虽然公式就是公式 但还是想了解一下比较学理方面讲解
: 像我教学生时 也会试着去解释公式的来源与意义
: 例如 母体的平均数 μ 与 样本平均数的不同意义
: 所以想了解一下 上述的问题
有一次加州理工学院的物理学家请教费曼:
何以自旋(spin)1/2的粒子必须遵守费米-狄拉克统计?
费曼说:「先给我一些时间,我准备用大一普通物理的观念程度试着回答你」
过没几天费曼告诉那位教授:
「很抱歉,我已经试过了,但是一直无法把它简化到大一程度。
也就是说,我们其实还不了解真正了解这个现象...」
同样的,挑战者号太空梭失事的真相调查,忙坏了全世界的科学家....
其实那也不过是一杯冰水与橡皮筋的故事...
任何正常程度的中小学生都能掌握.....
还有後话,不过先就此打住了....
我只是相信:当一个人能够用深入浅出的方式表达,
通常意味着对问题的脉络有着更通透的了解...
否则,我会怀疑他对於那些观念,真有他以为的那麽充分掌握?!
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 59.105.9.48
1F:推 tuyuchieh:精辟的讲解 推推推~~~ 06/16 15:41
2F:→ austin1119:可惜不管是学校还是补习班,很多老师也不懂为何:n与n-1 06/16 20:24
3F:→ austin1119:很有意义的统计,却被强调在一些无谓的计算与背公式上 06/16 20:25
4F:推 choucj:很详细, 不过难解释的是不取n-2,n-3的理由 06/16 22:25
5F:→ choucj:高中课本就是这样的解释版本, 不过却让学生以为原来用 06/16 22:26
6F:→ choucj:用n-1的理由也只是凑出来的,这让学统计的挺难接受就是.. 06/16 22:27
7F:推 alamabarry:先推..晚点在来看....不选 n-2有理由吗?? 06/16 22:39
8F:推 alamabarry:不过讲到自由度跟线性代数让我有点意外 06/16 22:42
9F:推 yonex:如果你把自由度当成是独立自由变数 便不会感到有什麽意外吧 06/19 01:02
10F:→ yonex:线性代数对於统计学的学习倒是蛮有必要的 06/19 01:04