作者Dminor (低小调)
看板DataScience
标题[问题] Naive Bayes请教
时间Sat Jun 22 17:27:43 2019
最近在学贝氏分类器,看了很多网路上的文章,
证明过程我都能理解,但是一直对结论很头痛。
假设X为特徵向量,N为标签类别;给定一组特徵向量x,用贝氏分类器判断属於哪一类别
为什麽是比较
P(X=x|N=n1)和
P(X=x|N=n2)的大小,
而不是比较
P(N=n1|X=x)和
P(N=n2|X=x)的大小呢?
直觉来说,给定一组特徵,在已知此特徵的条件下,比较各类别的条件机率感觉很合理?
以下面这个网站的范例来说:
http://hadoopspark.blogspot.com/2016/05/spark-naive-bayes.html
给定特徵向量[高气压,湿度51~60,西风],判断该情况会不会下雨。
他比较了
P(高气压,湿度51~60,西风|会下雨)、
P(高气压,湿度51~60,西风|不下雨)两者的大小,判断出不会下雨。
但给定特徵向量了,为什麽不是比较
P(会下雨|高气压,湿度51~60,西风) 和
P(不下雨|高气压,湿度51~60,西风)的大小?
困扰好几天了,爬了好多文都没解释到这一部份,求大大们解惑,
感激不尽!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 117.56.186.8 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1561195666.A.6D8.html
1F:→ jiyu520: 这是条件机率定义吧 06/22 18:26
2F:→ jiyu520: 在此“资料”-->进行“分类” 06/22 18:29
3F:推 youngman77: 想求的是你说的後验,按照Bayes rule把後验展开成: 06/22 18:38
4F:→ youngman77: P(会)P(特徵|会)和P(不会)P(特徵|不会)比较大小 06/22 18:38
5F:→ jiyu520: 可是和原PO说的一样..我也有点困惑了@@ 06/22 18:38
7F:推 jiyu520: 感谢楼上 06/22 20:48
8F:→ Dminor: 看来关键是前面有乘以一个类别的机率,我漏看了@@ 06/23 22:52
9F:→ Dminor: 感谢各位 06/23 22:52
10F:推 erre: 你有call package吗… 06/24 06:57