作者celestialgod (攸藍)
看板Statistics
標題Re: [問題]偏離問題
時間Sun Aug 2 16:43:02 2015
※ 引述《chenfafa (fafa)》之銘言:
: 如果是跟統計軟體有關請重發文章。
: 如果跟論文有關也煩請您重發文章。
: 請詳述問題內容,以利板友幫忙解答,過短文章依板規處置,請注意。
: http://i.imgur.com/UGLc09A.jpg
: 不好意思
: 想問這上面的圖
: 為什麼median一定在mean跟mode中間?
: 還有可以解釋為什麼左偏的平均數會在最左邊?反之亦然
: 有用假設一次考試大家都考很好去想
: 但還是不太能理解這三者間的關係
: 我有查一些網站了
: 但都沒有講的很清楚
: 謝謝大家~
: http://i.imgur.com/4AaPpvb.jpg
: 還有這張圖 感覺跟上面觀念有點像
: 解說是用outlier去解釋
: 但我還是有點不懂
: 再次謝謝大家
我自己教的時候是這樣說明的,提供參考:
平均數會受極端值影響,
會出現右偏(right-skewed)的圖形,比median小
反之,則是左偏(left-skewed),比median大
眾數則是出現在出現次數最多的次數 (就density來看就是density最高的地方)
一個右偏的分配,眾數會出現在較小的值,會比median小
反之,會出現在較大的值,會比median大
PS: median是比50%的資料大的值,所以右偏時,會出現在過最大density的地方
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.205.27.107
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1438504985.A.954.html
1F:推 chenfafa: 還是不太懂也 能再講清楚mean的部分嗎 謝謝08/02 16:58
2F:推 chenfafa: 但圖上 右偏時 小的值叫多 平均值是比中、眾數大08/02 18:51
3F:→ chenfafa: 平均值是較大08/02 18:51
4F:→ chenfafa: 跟你講的不一樣也08/02 18:51
抱歉,剛剛搞混,應該更正成,右偏時,有一些大的值就會把平均值拉大
5F:→ LiamIssac: 1 2 3的平均 跟1 2 19的平均08/02 20:09
6F:→ yhliu: 以前似乎我曾說明過這問題, 可能是貼在 成大計中站 吧? 現08/03 06:02
7F:→ yhliu: 在該站已關, 找不到了. orz08/03 06:03
8F:→ yhliu: 正偏, 又稱 右偏, 是指右邊尾巴拉得較長. 以中位數為準, 中08/03 06:04
9F:→ yhliu: 位數右邊的資料被拉開(拉長), 也就是說, 相對於中位數左邊 08/03 06:05
10F:→ yhliu: 有些資料離得比較遠, 因此平均數被拉高. 反之, 中位數左邊08/03 06:06
11F:→ yhliu: 擠在較小範圍, 整個分布曲線被擠壓, 所以高峰可能出現在中08/03 06:07
12F:→ yhliu: 位數左邊. 也就是說, 呈現 眾數 < 中位數 < 平均數 的樣子.08/03 06:08
13F:→ yhliu: 負偏, 又稱左偏, 則是相反乎, 中位數之左被拉長, 因而比較08/03 06:09
14F:→ yhliu: 少出現高峰; 而右邊被擠壓, 所以眾數可能在中位數之右.08/03 06:10
15F:→ yhliu: 以上說明教本上對偏斜分布的一般描述, 中位數在眾數與平均 08/03 06:11
16F:→ yhliu: 數中間. 不過, 這都只是 "典型". 如果套用某種特定分布, 可08/03 06:12
17F:→ yhliu: 能發現並不是這樣的, 例如 Weibull 分布之 shape parameter08/03 06:20
18F:→ yhliu: 在某些範圍時可能出現 median < mode < mean, 另某些範圍時08/03 06:21
19F:→ yhliu: 可能出現 median < mean < mode. 請參見 08/03 06:22
20F:→ yhliu: telnet://bs2.twbbs.org 之 P_cjosephlu 版, "What about08/03 06:23
21F:→ yhliu: the skewness?" 討論串.08/03 06:24
22F:→ yhliu: 第2張圖, 很明顯的正偏分布, 右邊尾巴拉得較長, 並不需要有08/03 06:26
23F:→ yhliu: outlier 才能解釋 mean > median.08/03 06:26
24F:→ yhliu: 事實上該圖也沒顯示有無 outlier, 只是最簡單的盒形圖.08/03 06:28
謝謝老師詳細的說明
我有到該站去看了相關討論串
Weibull(λ,k)的mode, median, mean分別是:
mode: λ((k-1)/k)^(1/k)
mean: λG(1+1/k), G is gamma function
median: λ(ln(2))^(1/k)
假設λ=1,我們可以得到下圖
http://i.imgur.com/6eov2N6.png
三條灰色虛線分別是 3.258921 3.312487 3.439541
而skewness在大於3.602345時,小於0
code:
http://pastebin.com/yDbnRmMs
PS: skewness都很小,在這種case下,看不太出來distribution是否真的左偏或右偏...
因此,median, mean, mode的大小順序是"典型",但大多數情況是可以參考的
25F:推 goshfju: 推樓上~08/03 07:35
※ 編輯: celestialgod (123.205.27.107), 08/03/2015 09:58:55
26F:推 chenfafa: 謝謝大家.....真的很感謝 08/03 15:52
27F:推 chenfafa: 我第二張圖本來是選D,是不清楚為什麼能知道平均值,沒 08/03 15:54
28F:→ chenfafa: 有給個數有多少,想請問這是為什麼? 08/03 15:54
29F:→ celestialgod: 上面劉老師有說明喔 08/03 17:25