作者prosen (波神)
看板Statistics
标题[问题] good-turing smoothing
时间Fri Dec 31 21:47:35 2021
这是自然语言处理的作业,但跟统计比较有关系,所以发来这版。
先上公式:
https://i.imgur.com/gaLfn8e.jpg
https://i.imgur.com/3k73lo7.jpg
我其他题跟着上课的ppt 做没太大问题,但做到good-turing 的频率值(excel 上为r*_gt
那栏)就卡关了。
https://i.imgur.com/7dqhYos.png
(作业设定M为5)
上网查了许久还是不会normalized 成正确的答案,而且把正确的答案套上公式p=r*/N总和
还是没1啊………是我理解哪里有问题?
有人知道怎麽做吗?
以下是excel
https://docs.google.com/file/d/13jFgT3la4EkVC390VPlObJRexDRWuRbv/edit?usp=docsli
st_api&filetype=msexcel
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 123.192.20.44 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1640958458.A.0DF.html
※ 编辑: prosen (123.192.20.44 台湾), 12/31/2021 21:56:44