作者j7874110 (Chiu)
看板Statistics
标题[问题] 箱型图中outlier上下限如何定义的?
时间Thu Oct 26 10:51:45 2017
目前知道在箱型图中,outlier是利用Q3+1.5*IQR, Q3+3*IQR, Q1-1.5*IQR, Q1-3*IQR这
些内限外限决定出来的,那想了解这四个值为什麽要这样定义(ex:为何不是Q3+2*IQR等等
之类的…)?是有什麽理论依据或是经验法则?烦请各位大哥大姐解惑~谢谢。
如果是跟统计软体有关请重发文章,使用程式做为分类。
统计软体,如SPSS, AMOS, SAS, R, STATA, Eviews,请都使用程式做为分类
请详述问题内容,以利板友帮忙解答,过短文章依板规处置,请注意。
为避免版面混乱,请勿手动置底问题,擅用E做档案编辑
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 101.139.173.108
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1508986308.A.D13.html
2F:→ celestialgod: When John Tukey was inventing the box-and- 10/26 19:03
3F:→ celestialgod: whisker plot in 1977 to display these values, 10/26 19:04
4F:→ celestialgod: he picked 1.5×IQR as the demarkation line for 10/26 19:04
5F:→ celestialgod: outliers. This has worked well, so we've 10/26 19:04
6F:→ celestialgod: continued using that value ever since. 10/26 19:04
7F:→ celestialgod: 不过从标准常态想,就是2.7个标准差 10/26 19:05
8F:→ celestialgod: 掉出去的机率只有 0.7%左右 10/26 19:05
9F:→ j7874110: 感谢C大提供此资讯。 10/27 11:53