作者acctouhou (acctouhou)
看板DataScience
標題[問題] 有關kaggle 的競賽生態
時間Thu May 21 21:55:05 2020
我最近參與Severstal: Steel Defect Detection,基本上就是利用pix2pix的技術去pred
ic
我先按照很多notebook 分享的方法下去train效果都達不到他送交答案的成績(dice loss
為
請問 是都有藏一手還是說testing data比training data簡單? 我目前還沒送教過答案想
說
他原圖大小是1600*256我先pooling到800*256然後random corp 400*256 並利用UNET (ef
fi
loss 是用 dice+bce (有試過focal loss 但效果好像沒有說很好)
不曉得有什麼淺在可以改進的點嗎?
--
Sent from my Windows
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.63.186 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1590069307.A.A9B.html
1F:→ f496328mm: 你可以提交答案試試看05/21 23:58
2F:→ f496328mm: 生態沒你想的這麼差,看過不少比賽,前三名都樂於分享05/21 23:58
我可能直接問作者看看好了
3F:推 OnePiecePR: 同意二樓05/22 08:13
4F:推 sxy67230: kaggle 的精華在討論區啊,去多看一些討論銀牌的討論可05/22 19:17
5F:→ sxy67230: 以學到很多trick05/22 19:17
分數高的幾乎部會透露資訊,樂於分享的通常training效果不優,這有點尷尬
6F:→ truehero: local cv 和public lb本來就不一定一致05/22 21:36
我的理解是這樣 testing 分成2份 你只知道其中一份,競賽結束後才公布另外一份?
7F:→ truehero: 如一樓所言先提交吧05/22 21:37
Ok 測下去就知道問題出哪了XD
8F:→ truehero: 另這是已結束的比賽,解答不是都出來了?05/22 21:38
9F:→ truehero: 仔細逛逛討論區05/22 21:38
已經結束的比賽會直接連testing data都揭秘喔? 這個我不太清楚因為現在kaggle還可
以給我late sub (我之前有加入,但是太忙了就忘了這件事)
10F:推 fsuhcikt1003: 討論區有時候有人直接把自己方式公布,可以多看看05/22 22:03
這就是矛盾點,他們公佈出來的方法train出來效果都沒LB上面的高
※ 編輯: acctouhou (106.1.224.206 臺灣), 05/23/2020 13:06:53
11F:推 jigfopsda: 比賽結束以後前幾名都很樂於分享 有些還會附 github05/23 15:49
12F:→ sxy67230: 樂於分享不一定會直接貼code給你啊,但是我看到前幾名05/23 17:29
13F:→ sxy67230: 都蠻樂於分享他們的訓練思路的,按照他們的思路去做通常05/23 17:29
14F:→ sxy67230: 都蠻接近結果的。畢竟沒有人有義務強制開源代碼給你,ka 05/23 17:29
15F:→ sxy67230: ggle 也沒像GitHub那麼方便設定開源規範 05/23 17:29
後來我才知道除了kaggle的notebook區域,可以直接搜尋作者的留言,裡面也確實很多有
用的資訊如各位所說,感謝各位。
16F:推 albertviking: notebook跑的結果跟分享的是否一樣? 05/25 09:31
會不一樣喔,而且有些你可以看到他notebook都跑出error了。
17F:→ albertviking: 提交結果再各別比較,我跑的結果通常都很接近05/25 09:31
※ 編輯: acctouhou (140.113.63.186 臺灣), 05/25/2020 21:29:52
18F:→ f496328mm: 跑 error 很正常拉,在上面提交 notebook 05/25 23:35
19F:→ f496328mm: 有些要設定,反正就找 pass 的看 05/25 23:35