DataScience 板


LINE

※ 引述《NDEJG (NDE)》之銘言: : 1.使用時機 : 最近在用PointNet去預測植物的特性,老闆不斷要我做cross validation,因為我們的資 : 料數量很少,總共只有450筆,她認為cross validation可以避免因為test set選得不好 : 導致模型有偏誤的結果,但我讀的文章都是在有多個model時,才會用cross validation : 來決定哪個模型最適合這個dataset。不知道有沒有版友可以解惑是否是老闆弄錯還是我 : 誤會了什麼。 以下是個人看法,請自行斟酌 情況一: cross-validation(CV)可以用來做模型選擇,或者是所謂的hyperparameter tuning, 模型選擇之後,再用test set評估效果。 情況二: CV也可以在資料少的情況下,用來評估效果,在這樣的情況下, CV類似用於情況一的test set。 要這樣做,並需要注意,你不可以用CV做hyperpatameter tuning ,然後再用CV評估效果,否則會有overfitting的問題。 如果你沒有hyperparameter tuning的需求,可以用CV來評估效果,這是比較簡單的問題。 如果你要hyperparameter tuning,又要評做效果,你必需要用 "nested cross-validation" : 2.bias, variance : 在讀cross validation variants的比較時,我觀察到作者們都會用bias跟variance來評 : 估這個cross validation variant的效果。Ron Kohavi 1995年的文章裡就是以bias及var : iance評估到底哪一個variant可以最好地評估一個model。以leave one out cross valid : ation為例,他就說是unbiased但有非常大的variance所以這個variant不甚理想。但是這 : 些文章都是以classification為基礎來推導,我想請教若是對regression model用cross : validation時,要如何評估bias跟variance呢? : 總結 : 我不清楚只有一個model時做cross validation的意義何在,以及若要做的話,我該如何 : 選擇哪一種cross validation呢?考慮到我們的樣本數少,老闆認為因為樣本數少,不適 : 合10 fold cross validation,論文大部分以classification來討論,想請教版友該以什 : 麼方法來評估regression的模型。 : 感謝各位的幫忙Q___Q 樣本數少的時候可以考慮用5-fold CV,我印象中CV建議至少要用5 folds, 不過這應該也只是經驗值,沒有什麼真正的學理去支持這個5數字怎麼來的。 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.116.26.161 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1645031167.A.6F5.html
1F:推 NDEJG: 我沒讀到nested cross validation,感謝大大分享。我讀的 02/17 06:47
2F:→ NDEJG: 文獻也是幾乎都推薦5fold以上。 02/17 06:47
3F:→ NDEJG: 另外請問一下,若不需要調hyperparameter,我是隨便抓一組v 02/17 06:50
4F:→ NDEJG: alidation set即可嗎? 02/17 06:50
5F:→ VIATOR: 不需要調hyperparameter的話,可以做一般CV就好了 02/17 08:45
6F:→ NDEJG: 好的,感謝大大分享Q__Q 02/18 02:49







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:iOS站內搜尋

TOP