作者murmurer (呢喃)
看板Statistics
標題[問題] 比較兩組數據 正規化的目的
時間Sat Jan 10 18:18:20 2015
google了些關於正規化(normalize)的資料
都只有公式和分布狀態的資訊
但我疑惑的點是
在比較兩筆資料時
為什麼要正規化呢?
舉例
現在我有六組data
分別是
第一次實驗 感冒後 黃人(10人) 白人(10人) 黑人(10人) 的體溫
第二次實驗 感冒後 黃人(10人) 白人(10人) 黑人(10人) 的體溫
我現在想要用兩次實驗得到的體溫
將這三個人種分群(clustering)
在做分群前必須先將資料normalize
但我就不太懂這邊normalize的意義在哪裡...
而且又要如何normalize呢?
(我們當然可算出這三組data的各別平均和標準差)
統計新手有這疑問
還請高手講解觀念
謝謝各位 :)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.94.64
※ 文章網址: http://webptt.com/m.aspx?n=bbs/Statistics/M.1420885103.A.87E.html
※ 編輯: murmurer (140.112.94.64), 01/10/2015 18:45:26
1F:推 Pieteacher: 去掉單位 01/10 18:53
2F:→ andrew43: 這個例子不明顯。有時候測值是不同的量,單位不同。 01/10 19:58
※ 編輯: murmurer (140.112.94.64), 01/10/2015 20:05:32
3F:→ murmurer: 單位都是度C的話呢 01/10 20:05
4F:→ murmurer: P大既然單位都是度C 為什麼還需要去掉單位~ 01/10 20:06
5F:→ murmurer: A大能舉個淺顯的例子嗎 QQ 01/10 20:06
6F:→ andrew43: 像身高和體重,有不同的單位和不同的分散呈度。 01/10 20:40
7F:→ murmurer: 不是很懂 QQ 大大方便用站內信討論嗎 01/10 21:49
8F:→ andrew43: 先看看中文的維基百科「標準化 (統計學)」吧。 01/11 01:21
9F:推 alice90426: 值代表的是單位,標準差代表的是刻度。 01/11 10:22
10F:→ alice90426: 比說我皮包裡面有5單位的錢,我的單位是1百還是1千 01/11 10:22
11F:→ alice90426: 意義是不同的。所以給值得同時也要給單位。 01/11 10:23
12F:→ alice90426: 而標準化(normalize)就是去掉單位的影響。 01/11 10:24