作者prosen (波神)
看板Statistics
標題[問題] good-turing smoothing
時間Fri Dec 31 21:47:35 2021
這是自然語言處理的作業,但跟統計比較有關係,所以發來這版。
先上公式:
https://i.imgur.com/gaLfn8e.jpg
https://i.imgur.com/3k73lo7.jpg
我其他題跟著上課的ppt 做沒太大問題,但做到good-turing 的頻率值(excel 上為r*_gt
那欄)就卡關了。
https://i.imgur.com/7dqhYos.png
(作業設定M為5)
上網查了許久還是不會normalized 成正確的答案,而且把正確的答案套上公式p=r*/N總和
還是沒1啊………是我理解哪裡有問題?
有人知道怎麼做嗎?
以下是excel
https://docs.google.com/file/d/13jFgT3la4EkVC390VPlObJRexDRWuRbv/edit?usp=docsli
st_api&filetype=msexcel
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.192.20.44 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1640958458.A.0DF.html
※ 編輯: prosen (123.192.20.44 臺灣), 12/31/2021 21:56:44