作者shy7shawn (帥氣翔)
看板Statistics
標題[問題] F檢定自由度問題與機器學習迴歸預測F檢定
時間Thu Aug 18 16:58:58 2022
各位大大好, 小弟我的論文是在利用機器學習做迴歸數值的預測,但被口委詢問說有沒有用F檢定來看這個迴歸模型的預測力,如果沒有那R平方再高也沒用,但小弟我的資料有三百萬筆,測試集當作抽樣的話也有一百萬筆,探討迴歸模型的Beta係數是否全為0的F檢定,自由度為一百多萬,這樣出來的F值都非常奇怪,想問各位大大自由度的上限有沒有限制,或是口委的問題根本不適用於機器學習?
-----
Sent from JPTT on my iPhone
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.9.64.236 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1660813140.A.205.html
1F:→ raiderho: 既然是機器學習,準確度的判準幹嘛看R^2 08/18 17:41
2F:→ raiderho: 另外預測準確度、和係數顯著是否異於0是兩回事 08/18 17:42
3F:推 raiderho: 口委說的應該是 Lack-of-fit sum of squares 的 F test 08/18 17:47
4F:→ yhliu: "由度為一百多萬" 是分母自由度,分此時對迴歸係數的檢定可 08/19 08:30
5F:→ yhliu: 以用 z test 和 chi-squr test. 08/19 08:31
6F:→ yhliu: Lack-of-fit 或 goodness-of-fit test 也許只能用模型比較 08/19 08:36
7F:→ yhliu: 表示分母(MSE)很接近誤差變異數,而分子用平方和不用均方, 08/19 08:43
8F:→ yhliu: 兩者相除即是卡方統計量,也就是 F統計量*分子自由度。 08/19 08:45
9F:→ andrew43: 怪是怎麼怪?分母自由度很大並不是壞事啊。 08/19 16:37