作者Dminor (低小調)
看板DataScience
標題[問題] Naive Bayes請教
時間Sat Jun 22 17:27:43 2019
最近在學貝氏分類器,看了很多網路上的文章,
證明過程我都能理解,但是一直對結論很頭痛。
假設X為特徵向量,N為標籤類別;給定一組特徵向量x,用貝氏分類器判斷屬於哪一類別
為什麼是比較
P(X=x|N=n1)和
P(X=x|N=n2)的大小,
而不是比較
P(N=n1|X=x)和
P(N=n2|X=x)的大小呢?
直覺來說,給定一組特徵,在已知此特徵的條件下,比較各類別的條件機率感覺很合理?
以下面這個網站的範例來說:
http://hadoopspark.blogspot.com/2016/05/spark-naive-bayes.html
給定特徵向量[高氣壓,濕度51~60,西風],判斷該情況會不會下雨。
他比較了
P(高氣壓,濕度51~60,西風|會下雨)、
P(高氣壓,濕度51~60,西風|不下雨)兩者的大小,判斷出不會下雨。
但給定特徵向量了,為什麼不是比較
P(會下雨|高氣壓,濕度51~60,西風) 和
P(不下雨|高氣壓,濕度51~60,西風)的大小?
困擾好幾天了,爬了好多文都沒解釋到這一部份,求大大們解惑,
感激不盡!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 117.56.186.8 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1561195666.A.6D8.html
1F:→ jiyu520: 這是條件機率定義吧 06/22 18:26
2F:→ jiyu520: 在此“資料”-->進行“分類” 06/22 18:29
3F:推 youngman77: 想求的是你說的後驗,按照Bayes rule把後驗展開成: 06/22 18:38
4F:→ youngman77: P(會)P(特徵|會)和P(不會)P(特徵|不會)比較大小 06/22 18:38
5F:→ jiyu520: 可是和原PO說的一樣..我也有點困惑了@@ 06/22 18:38
7F:推 jiyu520: 感謝樓上 06/22 20:48
8F:→ Dminor: 看來關鍵是前面有乘以一個類別的機率,我漏看了@@ 06/23 22:52
9F:→ Dminor: 感謝各位 06/23 22:52
10F:推 erre: 你有call package嗎… 06/24 06:57