作者murmurer (呢喃)
看板Statistics
标题[问题] 比较两组数据 正规化的目的
时间Sat Jan 10 18:18:20 2015
google了些关於正规化(normalize)的资料
都只有公式和分布状态的资讯
但我疑惑的点是
在比较两笔资料时
为什麽要正规化呢?
举例
现在我有六组data
分别是
第一次实验 感冒後 黄人(10人) 白人(10人) 黑人(10人) 的体温
第二次实验 感冒後 黄人(10人) 白人(10人) 黑人(10人) 的体温
我现在想要用两次实验得到的体温
将这三个人种分群(clustering)
在做分群前必须先将资料normalize
但我就不太懂这边normalize的意义在哪里...
而且又要如何normalize呢?
(我们当然可算出这三组data的各别平均和标准差)
统计新手有这疑问
还请高手讲解观念
谢谢各位 :)
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.94.64
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/Statistics/M.1420885103.A.87E.html
※ 编辑: murmurer (140.112.94.64), 01/10/2015 18:45:26
1F:推 Pieteacher: 去掉单位 01/10 18:53
2F:→ andrew43: 这个例子不明显。有时候测值是不同的量,单位不同。 01/10 19:58
※ 编辑: murmurer (140.112.94.64), 01/10/2015 20:05:32
3F:→ murmurer: 单位都是度C的话呢 01/10 20:05
4F:→ murmurer: P大既然单位都是度C 为什麽还需要去掉单位~ 01/10 20:06
5F:→ murmurer: A大能举个浅显的例子吗 QQ 01/10 20:06
6F:→ andrew43: 像身高和体重,有不同的单位和不同的分散呈度。 01/10 20:40
7F:→ murmurer: 不是很懂 QQ 大大方便用站内信讨论吗 01/10 21:49
8F:→ andrew43: 先看看中文的维基百科「标准化 (统计学)」吧。 01/11 01:21
9F:推 alice90426: 值代表的是单位,标准差代表的是刻度。 01/11 10:22
10F:→ alice90426: 比说我皮包里面有5单位的钱,我的单位是1百还是1千 01/11 10:22
11F:→ alice90426: 意义是不同的。所以给值得同时也要给单位。 01/11 10:23
12F:→ alice90426: 而标准化(normalize)就是去掉单位的影响。 01/11 10:24