作者fz77 (fz77)
看板DataScience
標題[問題]10-fold validation的資料集非10的倍數
時間Wed Jan 11 03:36:06 2023
請問各位前輩,若我有一個資料集要進行多分類(如:每類79張圖片共116類),共有9164張
圖片,但9164不是10的倍數,是否就無法進行10-fold cross validation了呢?
因按照定義,應該要切出9/10進行訓練,1/10進行測試,但該資料集是無法被10除盡的,
實務上應該如何進行呢?
感謝各位!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 150.117.153.60 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1673379368.A.46B.html
1F:→ lycantrope: 認真問?反串?洗文章?どっち 01/11 07:00
2F:推 wang19980531: 下一篇 data size是64*64*3 input neurons是 32*3 01/11 09:57
3F:→ wang19980531: 2*3 是不是就不能做了呢 01/11 09:57
4F:推 wieldthewave: 如果有10個糖果要分給3個人要怎麼辦 01/11 17:17
5F:→ wieldthewave: 10不能被3整除是不是就不能分給3個人了呢 01/11 17:17
6F:→ chang1248w: 某類多幾張少幾張不是問題,class weight修正一下 01/12 22:44
7F:推 NDEJG: 我做的時候是讓他數量盡量平均,stratification 有做就好 01/13 12:27
8F:→ NDEJG: 的話出來結果也不會差多少 01/13 12:27
9F:→ chang1248w: 髒的樣本去掉還比較重要 01/13 16:43