作者reck0916 (升格当学长)
看板DataScience
标题有关sklearn中的GridSearchCV 的问题
时间Sat Mar 17 19:05:24 2018
请问各位爲何我用GridSearchCV 使用r2当scoring跑出来的最佳参数带回原本模型xgboost中 ,重跑出来的r2却不是最好的,是哪里有问题?
-----
Sent from JPTT on my OPPO CPH1605.
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 223.141.36.134
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1521284731.A.181.html
1F:推 goldflower: seed? 03/17 19:47
2F:→ reck0916: gridsearchcv seed default 值不是0?? 03/17 22:52
3F:推 goldflower: 应该是看xgboost的seed 不过我看它也是default 0没错 03/17 23:28
4F:→ goldflower: 只好交给熟的回答 或是你可以放个扣让大家看看 03/17 23:29
5F:→ hl4: training set不一样? 03/17 23:49
6F:→ hl4: best_score_是CV得到的平均值,和refit用的training set不同 03/18 05:19
7F:→ reck0916: 所以是改成refit=True?? 03/18 12:58
8F:→ hl4: 要看你的目的是什麽,cv的score和refit後的score本来就不一样 03/18 16:31
9F:→ reck0916: 我要的只是得到模型最佳参数而已,还是用其他的调参例如 03/18 18:39
10F:→ reck0916: np 比较好? 03/18 18:39
11F:→ hl4: 那就是GridSearchCV给的那组了阿 03/18 19:37
12F:→ hl4: GridSearchCV只保证给你val score最佳而已,剩下是你的问题 03/18 19:40