作者Aerisleu (aa)
看板Statistics
標題[問題] 描述資料結構的統計指標
時間Tue Nov 28 23:40:38 2017
大家好
我脫離大學時代修統計有一段時間 但最近遇到資料處理的一些問題
所以想請各位先進幫我看一下 整個觀念是否正確
我們有兩個資料row data
資料一: 地區性的住房指數 原則上數字越高代表每坪售價/租金越貴
共834筆資料 資料分佈1.25~4.8 標準差0.7911
資料二: 地區性的剝奪指數 是一些"正規化"過後的6個指標總和
共834筆資料 資料分佈-9.24~18.41 標準差5.949 平均值0
(指標包含失業率/教育程度/老年撫養/單親家庭...等)
今天我跟老師討論時 我認為資料二較資料一變異大
但老師不這麼認為
他說如果我們將 標準差除以資料範圍(4.8-1.25)
那麼得出來的數值 資料一會稍大於資料二
但我怎麼覺得怪怪的
因為標準差已經有考慮每個資料與平均值的差異 所以應該已經具代表性
並且我查了半天沒有看到關於這個"除以資料範圍"的統計指數
因此想了半天想不透 所以上來請教各位先進
還請多加指點
另外再請教有沒有什麼統計指數是可以描述資料聚集的程度(cluster)
先謝謝您的回答
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 194.95.79.11
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1511883640.A.DA3.html
1F:推 oh123: 用CV值 11/29 00:11
2F:→ oh123: (標準差 / 平均值 )*100% 11/29 00:12
3F:→ andrew43: 峰度 11/29 00:59
4F:→ Pieteacher: Boxplot 11/29 10:29