作者acctouhou (acctouhou)
看板DataScience
标题[问题] 有关kaggle 的竞赛生态
时间Thu May 21 21:55:05 2020
我最近参与Severstal: Steel Defect Detection,基本上就是利用pix2pix的技术去pred
ic
我先按照很多notebook 分享的方法下去train效果都达不到他送交答案的成绩(dice loss
为
请问 是都有藏一手还是说testing data比training data简单? 我目前还没送教过答案想
说
他原图大小是1600*256我先pooling到800*256然後random corp 400*256 并利用UNET (ef
fi
loss 是用 dice+bce (有试过focal loss 但效果好像没有说很好)
不晓得有什麽浅在可以改进的点吗?
--
Sent from my Windows
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.113.63.186 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1590069307.A.A9B.html
1F:→ f496328mm: 你可以提交答案试试看05/21 23:58
2F:→ f496328mm: 生态没你想的这麽差,看过不少比赛,前三名都乐於分享05/21 23:58
我可能直接问作者看看好了
3F:推 OnePiecePR: 同意二楼05/22 08:13
4F:推 sxy67230: kaggle 的精华在讨论区啊,去多看一些讨论银牌的讨论可05/22 19:17
5F:→ sxy67230: 以学到很多trick05/22 19:17
分数高的几乎部会透露资讯,乐於分享的通常training效果不优,这有点尴尬
6F:→ truehero: local cv 和public lb本来就不一定一致05/22 21:36
我的理解是这样 testing 分成2份 你只知道其中一份,竞赛结束後才公布另外一份?
7F:→ truehero: 如一楼所言先提交吧05/22 21:37
Ok 测下去就知道问题出哪了XD
8F:→ truehero: 另这是已结束的比赛,解答不是都出来了?05/22 21:38
9F:→ truehero: 仔细逛逛讨论区05/22 21:38
已经结束的比赛会直接连testing data都揭秘喔? 这个我不太清楚因为现在kaggle还可
以给我late sub (我之前有加入,但是太忙了就忘了这件事)
10F:推 fsuhcikt1003: 讨论区有时候有人直接把自己方式公布,可以多看看05/22 22:03
这就是矛盾点,他们公布出来的方法train出来效果都没LB上面的高
※ 编辑: acctouhou (106.1.224.206 台湾), 05/23/2020 13:06:53
11F:推 jigfopsda: 比赛结束以後前几名都很乐於分享 有些还会附 github05/23 15:49
12F:→ sxy67230: 乐於分享不一定会直接贴code给你啊,但是我看到前几名05/23 17:29
13F:→ sxy67230: 都蛮乐於分享他们的训练思路的,按照他们的思路去做通常05/23 17:29
14F:→ sxy67230: 都蛮接近结果的。毕竟没有人有义务强制开源代码给你,ka 05/23 17:29
15F:→ sxy67230: ggle 也没像GitHub那麽方便设定开源规范 05/23 17:29
後来我才知道除了kaggle的notebook区域,可以直接搜寻作者的留言,里面也确实很多有
用的资讯如各位所说,感谢各位。
16F:推 albertviking: notebook跑的结果跟分享的是否一样? 05/25 09:31
会不一样喔,而且有些你可以看到他notebook都跑出error了。
17F:→ albertviking: 提交结果再各别比较,我跑的结果通常都很接近05/25 09:31
※ 编辑: acctouhou (140.113.63.186 台湾), 05/25/2020 21:29:52
18F:→ f496328mm: 跑 error 很正常拉,在上面提交 notebook 05/25 23:35
19F:→ f496328mm: 有些要设定,反正就找 pass 的看 05/25 23:35