看板Statistics
標 題Re: [問題] 請問一個分組資料的問題
發信站無名小站 (Mon Mar 27 19:47:03 2006)
轉信站ptt!Group.NCTU!grouppost!Group.NCTU!wretch
※ 引述《yhliu (老怪物)》之銘言:
> ※ 引述《[email protected] (新電腦新氣象~~)》之銘言:
> > 有一族群觀測值N=15如下
> > 假設以組距h=2
> > 則
> > 21 23 19 19 24 22 22 26
> > 25.5 26 24 25 18 23 29
> > 請問最小下限該為多少?
> > 請問是用 0.1/2 =0.05 所以最小下限是17.95
> > 還是用 0.5/2 =0.25 所以最小下限是17.75
> > 哪一個才對呢???
> 似乎沒有明確法則?
> 個人觀點 (與以前所讀的書給的先入為主觀念不無關係),
> "組界" 應以 "簡單數字" 為宜. 不過,證諸目前美系教本
> 的習慣, 是以 "組中點" 為考量重點.
> 依個人習慣, 既然組距是 2, 會採用分組如下:
> 18-20, 20-22, ..., 28-30
> 若以目前教本方法, 可能以 19, 21, 23,... 為組中點?
> 但或者作者會偏愛偶數為組中點?
> 但在限定組距為 2 的情況下,以 17.95 或 17.75 等為組
> 限或組界, 個人認為是有點怪.
也許說 "以 17.95 或 17.75 為組界有點怪" 只是個人偏見?
若非有一筆是 25.5 比較特殊, 依美系教本的方法, 大概會
分成 18-19, 20-21, ..., 28-29 或 17-18,...,29-30, 則
其組界、組中點都有 0.5 出來。而依分組原則,前者的次數
與前回 18-20,...,28-30 相同, 但整個解釋平移 0.5。
> 只有 15 筆資料, 而全距達 11, 數據除了一筆有 0.5 以
> 外都是整數, 組距為 2 可能不很理想? 事實上只有 15筆
> 資料, 不論如何分組恐怕都很難得知分布特性?
如果是實際資料, 如上之記錄並不很適當. 記錄資料最好
採相同精確度, 以本例來講, "25.5" 或許要當做 "26"? 然
後採用上述現行教本方法。因為除了記錄時的漫不經心造成
一筆資料特別怪以外, 可以想到一種情形, 是像量身高體重
等, 限於儀器精密度只能到整數, 但有時不易判讀是 25 或
26, 因而跑出 25.5 的數據, 但這 "25.5" 並不像它給人的
印象:
"這精確到小數點後一位喔!" 相反地, 它只是測量不
精確造成的!
如 "18-19, 20-21, ..., 28-29" 這種分組, 適用於如此
例 (假設 "25.5" 實際上已改成 "26" 或 "25"), 可說是
離散資料的情形. 如此分組的唯一缺點是組界及組中點不
符合 "簡單數字" 的要求。
而 "18-20, 20-22,...,28-30" 的分組, 適合原資料記錄
至小數點一位以上, 是本質為連續資料的分組方式。
其實, 這種資料整理, 被歸為 "敘述統計" 的東西還是很
重要的! 資料該如何記錄, 如何分組, 現在的教本都忽略
了! 或許有人認為調查時的非抽樣誤差不知多嚴重都不能
處理了, 何必在這小處作文章? 或者說現在的統計分析已
不需要這些甚麼次數分布表、直方圖等老掉牙的東西了!
真的嗎?
調查的非抽樣誤差確實是大問題, 但統計資料蒐集並不只
是調查一種, 其他來源資料難道都不理? 即使調查資料,
也沒必要為有誤差的資料加上一種額外的誤差. 而次數分
布表、直方圖沒有用嗎? 雖然密度曲線估計的研究汗牛充
棟, 實務上處處可見的, 不管來自政府或民間, 不管蒐集
方式是調查或登記, 不都是直方圖、次數表? 真正做密度
曲線估計而報告出來的, 恐怕只見諸所謂 "學術研究" 論
文吧?
有時, 分組還要看一般資料記錄的習慣, 而不是照方抓藥,
完全以教本上所講的為準。年齡的分組是一個典型。美國
習慣, 依書本例子的描述, 大概是以 nearest year 為準,
即四捨五入的結果, 因此如年齡分組 15-19, 20-24 等,
依教本上的解讀依次為 14.5-19.5, 19.5-20.5 等, 是適
當的。但在台灣, 官方紀錄或一些謹慎的調查, 是以 "足
歲" 為準的 (調查時隨便問, 有人回答足歲有人回答虛歲
的不在討論之內)。因此, "15-19歲" 組的意義就是: "15
足歲以上, 未滿20歲", 也就是 "15-20" 的意義。
--
來自統計專業的召喚...
無名小站 telnet://wretch.twbbs.org Statistics (統計方法討論區)
成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區)
盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話)
交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率)
★本文未經本人同意請勿轉載; 回覆請勿全文引用, 請僅留下直接涉及部分。
--
夫兵者不祥之器物或惡之故有道者不處君子居則貴左用兵則貴右兵者不祥之器非君子
之器不得已而用之恬淡為上勝而不美而美之者是樂殺人夫樂殺人者則不可得志於天下
矣吉事尚左凶事尚右偏將軍居左上將軍居右言以喪禮處之殺人之眾以哀悲泣之戰勝以
喪禮處之道常無名樸雖小天下莫能臣侯王若能守之萬物將自賓天地相合以降甘露民莫
之令而自均始制有名名亦既有夫亦將知止知止可以不殆譬道之在天 163.15.188.87海