作者j7874110 (Chiu)
看板Statistics
標題[問題] 箱型圖中outlier上下限如何定義的?
時間Thu Oct 26 10:51:45 2017
目前知道在箱型圖中,outlier是利用Q3+1.5*IQR, Q3+3*IQR, Q1-1.5*IQR, Q1-3*IQR這
些內限外限決定出來的,那想了解這四個值為什麼要這樣定義(ex:為何不是Q3+2*IQR等等
之類的…)?是有什麼理論依據或是經驗法則?煩請各位大哥大姐解惑~謝謝。
如果是跟統計軟體有關請重發文章,使用程式做為分類。
統計軟體,如SPSS, AMOS, SAS, R, STATA, Eviews,請都使用程式做為分類
請詳述問題內容,以利板友幫忙解答,過短文章依板規處置,請注意。
為避免版面混亂,請勿手動置底問題,擅用E做檔案編輯
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.139.173.108
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1508986308.A.D13.html
2F:→ celestialgod: When John Tukey was inventing the box-and- 10/26 19:03
3F:→ celestialgod: whisker plot in 1977 to display these values, 10/26 19:04
4F:→ celestialgod: he picked 1.5×IQR as the demarkation line for 10/26 19:04
5F:→ celestialgod: outliers. This has worked well, so we've 10/26 19:04
6F:→ celestialgod: continued using that value ever since. 10/26 19:04
7F:→ celestialgod: 不過從標準常態想,就是2.7個標準差 10/26 19:05
8F:→ celestialgod: 掉出去的機率只有 0.7%左右 10/26 19:05
9F:→ j7874110: 感謝C大提供此資訊。 10/27 11:53