作者a0099090 (a0099090)
看板Statistics
标题Fw: [其他] 分组资料的全距有好几种算法?
时间Wed Oct 7 22:49:53 2015
※ [本文转录自 Math 看板 #1M5J123l ]
作者: a0099090 (a0099090) 看板: Math
标题: [其他] 分组资料的全距有好几种算法?
时间: Wed Oct 7 22:46:23 2015
例如20~29岁.......60~69岁
2人 .........5人
在某些地方看到全距的算法有下面几种
1.用最大组的上限-最小组的下限=>69-20=49
2.用最大组的组中点减最小组的组中点=>64.5-24.5=40
3.组距=最大组的组上界-最小组的组下界
而组下界=组下限-1/2(最小测量单位)
组上界=组上限+1/2(最小测量单位)
所以变成69.5-19.5=50
一个全距有这麽多种算法!?有没有人能帮忙解释一下阿 囧
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.26.20.39
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Math/M.1444229186.A.0EF.html
※ 发信站: 批踢踢实业坊(ptt.cc)
※ 转录者: a0099090 (114.26.20.39), 10/07/2015 22:49:53
1F:→ yhliu: 才3种而已, 不多. 如果你学到中位数, 那才是无语... 10/08 05:29
2F:→ yhliu: 第3种是最保守的, 也就是说算出来的全距最大. 不过, 10/08 05:30
3F:→ yhliu: "最小测量单位" 似乎改成 "最小记录单位", 也就是资料记录 10/08 05:32
4F:→ yhliu: 之单位较适当? 10/08 05:33
恩...我大概懂你的意思,不过我也不敢确定@@(统计菜鸟)
最小测量单位是从书上抄来的
5F:→ yhliu: 第1种与第3种接近, 但它把资料记录都当成精确值而非近似值. 10/08 05:35
6F:→ yhliu: 以上2种都是基於一个假设: 在每组中, 原资料都是分散於整组 10/08 05:36
7F:→ yhliu: 之范围. 而原问之第2种, 则是另一种假设: 各组资料集中於组 10/08 05:37
8F:→ yhliu: 准差之计算, 也是采用这样的假设. 10/08 05:40
感谢,大概知道为什麽会有第2种的方式了(我原本以为应该是第1种 by直觉)
不过第3种还是不太懂,在未分组资料=>分组资料,决定组距,组数的时候
不是应该已经包含所有的资料在里面了吗?
譬如说 22 33 44 55 66 77 88 用2^k法来决定组数=3 组距为(88-22)/3=22
为求方便,组距一般采整数原则(最好为2、5、10的倍数)(须包含所有数据)=>组距为25
这样分组後就会变成20~45、45~70、70~95
这样不是表示,分组资料的原始资料,最大不会超过95,最小不会低於20吗?
为什麽还需要+-1/2最小记录单位呢?
※ 编辑: a0099090 (114.26.30.155), 10/08/2015 09:16:08
9F:→ yhliu: 如果分组是写成 0-45, 45-70 之类的, 上下组限就等於上下组 10/08 20:33
10F:→ yhliu: 界. 不过这好像是很老的中文教本才有这样的写法? 10/08 20:35
11F:→ yhliu: 近40年来的原文(及中译)教本不是这样做的, 以你举的资料, 10/08 20:38
12F:→ yhliu: 可能分组会是 20-44, 45-69, ... 或 21-45, 46-70, ... 10/08 20:39
13F:→ yhliu: 虻1位1疆种, 第一组下组限是 20, 上组限是44, 而下组界就是 10/08 20:40
14F:→ yhliu: 19.5, 上组界是44.5。 10/08 20:40
15F:→ yhliu: 以前一种分, 第一组下组限是 20, 上组限是44, 而下组界就是 10/08 20:41
16F:→ yhliu: 19.5, 上组界是44.5。 10/08 20:41
我这边书写的是,要看是否为连续资料,若为连续则"20<=第一组<45","45<=第二组<70"
若为间断(有些翻译为离散)资料则分组如y大你写的那样,20-44,45-69
我的疑问在,原始资料一定在分组里面吧?(不可能有样本是19,却被归在20-45)
全距的意思不是最大数-最小数吗?
因已分组,不晓得20-45里的样本有没有20,70-95里的样本有没有95
以最保守来看95-20=75
那最大组的组上界-最小组的组下界相减95.5-19.5=76
是有什麽含意在里面呢@@?
※ 编辑: a0099090 (114.26.30.155), 10/08/2015 21:23:01
17F:→ yhliu: 就记录的资料而言, 表面疥是离散的. 以年龄为例, 记录都是 10/09 02:00
18F:→ yhliu: 整数岁, 但实际年龄当然不是只有整数岁. 10/09 02:01
19F:→ yhliu: 再以体重为例, 记录可能都是整数公斤, 当然实际上体重是连 10/09 02:03
20F:→ yhliu: 续资料. 这也是为什麽我用 "最小记录单位" 这名词. 10/09 02:03
21F:→ yhliu: 另者, 若资料中有 19, 最低值一组当然耍包含 19 在内, 而 10/09 02:05
22F:→ yhliu: 不可能是 20-44 或 21-45. 10/09 02:05
23F:→ yhliu: 至於分组应该是 20-45, 45-70 之类的, 或是 20-44, 45-69 10/09 02:08
24F:→ yhliu: 之类的, 个人是有些不同看泠. 只是目前看到的美国教本大概 10/09 02:09
25F:→ yhliu: 都是後一种... 10/09 02:10
26F:→ yhliu: 以 "年龄" 而言, 台湾以前的惯例是用 "足岁". 因此, 实际上 10/09 02:12
27F:→ yhliu: 20-29岁指的是 "满20岁, 不满30岁", 所以真正的组界应是 10/09 02:13
28F:→ yhliu: 20 与 40. 但美国人惯例用 "最近岁", 所以20岁代表的是19岁 10/09 02:14
29F:→ yhliu: 半到20岁半, 所以 20-29岁组就是19.5岁至29.5岁. 10/09 02:15
30F:→ yhliu: 修正: 以足岁而言, 20-29岁组的真实组界是 20 与 30. 10/09 02:16
31F:→ yhliu: 再说体重的例子: 如果记录是到小数点1位, 分组取整数, 古老 10/09 02:18
32F:→ yhliu: 的分组写法有, 例如 30-35,35-40..., 30-34.9, 35-39.9... 10/09 02:19
33F:→ yhliu: 在解释上都认为是一样的. 而美式教本的方法, 是把记录先化 10/09 02:20
34F:→ yhliu: 简成整数(采四舍五入), 再以新记录资料分组为 30-34,35-39 10/09 02:22
35F:→ yhliu: 之类的. 此时 30-34 代表的是 29.5-34.5。 10/09 02:23
非常感谢,我终於理解为什麽会有+-1/2这种做法了
※ 编辑: a0099090 (114.26.30.155), 10/10/2015 16:01:08