Re: [问题] Validation set 到底在做什麽?

时间Sun Apr 1 06:29:10 2018

一点浅见提供思考：其实 epoch number 也可以想成是另一个要选择的「超参数」而这个超参数对於模型复杂度的影响，可以看这个投影片的第二十一页 https://www.csie.ntu.edu.tw/~htlin/mooc/doc/212_handout.pdf ※ 引述《lucien0410 (lucein)》之铭言： : ot大的建议让我弄懂了neural net训练时 : 为什麽都要附上一组validation set : (如果我又错了再请g大帮我validate一下！) : 是的我们就假设如果没有validation set会发生什麽事 : 另外我们再来假设我们有无穷无尽的时间或是运算资源 : 没有validation set 我们可以训练neural net吗? : 答案是可以的 YES! : 训练到底需要什麽： : (1) 训练资料 : (2）预先设好的超参数 (e.g. layer size, layer type, mini batch size 等等; : 特别注意我没有设定epoch size; 或者我们把epoch size设为无限大(反正我们有无限 : 的时间和运算资源); : (1）(2) 弄好就可以开始epoch by epoch 的训练了; : 每次搞定一个epoch 我们就会得到一个模组 : 我们让它训练到天荒地老; 产生无数个模组; : 用数学集合的方式来表示的话,我们就会得到下面的集合. : trained_models= : {<epoch_i, train_preplexity_i, train_accuracy_i, Same_HyperParameter> ｜for i : in N } : 这个时候问题就来了！！！ : trained_models 是一个无限大的集合我们想要从中挑一个最好成员那该怎麽挑呢? : 这些成员的超参数都一样所以超参数不能用来作为挑选的依据 : 那有哪些特徵是可能有用的呢? : train_preplexity, train_accuracy 可能有用但很可能不准因为我们会有overfitting : 的问题; epoch number也不能用, 因为也不一定高的epoch越好, 一样是overfitting的问 : 题. : 每个epoch的模组都一模一样！！！ : 这样就像唐伯虎点秋香每个都戴上面具那个才是我们的秋香呢? : 随便选一个大家拼人品吗? 挑到石榴姊怎麽办? : 唐伯虎就大喊了 "别人笑我太疯癫我笑他人看不川 ..." : 看谁抖了一下 : 我们可以用类似的方式 : 预先准备好一个validation set,每个epoch训练好,就要它预测validation set看看 : 现在加进了validation set, 我们的模组集合就会变成这样 : {<epoch_i, train_preplexity_i, train_accuracy_i, validation_preplexity_i, : validation_accuracy_i, Same_HyperParameter> ｜for i in N } : 现在我们就可以从validation preplexity 和 accuracy 来判断要挑那个好. : 注意这里,我们依然*不是*挑超参数,因为这组模组集合的成员的超参数还是依然一模一样 : 现在我的理解就变成跟着一起训练的validation set的作用就是用来挑ephoch number了 : 还有这里的validation 跟 cross validation 没有关联; 因为我们没有*cross* : 用的一直是同一份的validation dataset : 这个就仅仅算是*hold-out validation* : 以上是算是澄清事实吧 : 要是讲错了再麻烦大家指点! : ###################################### : 以下我再来提问两个问题 : （a）用偷偷把validation set塞回去这样好吗? 会有什麽问题? : 如果这个validation set就是拿来挑那个ephoch好, : 那我们现在可以作弊一下 : 我们先使用validation set 找到最佳的ephoch number : 记住这个黄金数字 : 现在把validation set放到training set 两个合在一起 : (这样我们就有更多样本了) : 再把这个新的较大的training set再重新一次 : 反正我们已经*预先*知道那个epoch最好了 : 用偷偷把validation set塞回去这样好吗? 会有什麽问题? : 实作上这是惯用手法吗? : （b）用了validation set 就*一定*能挑到最好的了吗? : 我认为觉得不是这跟我们的validation set挑的好不好非常有关 : 要是人品不好正好挑到不具代表性的样本来做validation : 那我们的validation preplexity 和 accuracy 也就不可靠了 : (以後我要骂人都要骂 "祝你的validation set都挑到坏样本！" : 推文就说 "希望你的validation set挑的特别好!") : 这个也呼应了pipidog大前文说的 validation set 怎麽挑是个大学问 : validation成绩最好应该也不是一定最好的模组吧 : 要避免挑到极端样本的机会还是得来弄一下n-fold cross-validation : 但是弄了n folds 之後训练时间就增加了n倍 : 除了增加时间成本外这样的作法可能会有什麽问题呢? : 实作上这是惯用手法吗? : ※ 引述《outrunner (ot)》之铭言： : : 不如你来回答问题, 你怎麽知道模型要训练到什麽时候(epoch size)? : : 这样做当然很好, 但代价也很昂贵. : : 回到上面的问题, 你需要验证多少次? 每个epoch验证一次? : : 更别提很多时候是没办法这样做的. : : (ex. B没有答案. 有的话我会拿来做训练) : : 他就是边训练边测试啊, 不然你怎麽知道训练得如何了? : : 其实就是把你想手动做的事情自动化啦. : : 如果你有看他的说明书: : : Validation files are required and used to evaluate : : the convergence of the training. : : It usually contains no more than 5000 sentences. : : 第一句就是前面讲的. : : 第二句的意思是做这个很浪费时间. (别误会, 是学问很大的意思) : : 然後"找寻最佳的hyperparameter"也不是很重要, : : 想太多不如先train下去, train久了就有fu了. --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.171.48.158 ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1522535352.A.1BC.html

1^F：推 lucien0410: 多谢老师指导! stop in the middle 04/01 06:59

2^F：推 lucien0410: 有不靠validation 就能估计middle 在哪里的可能性吗 04/01 07:01

3^F：推 TOEFLiBT100: \田神/ 04/01 18:45

4^F：推 warex14: 推推！ 04/01 20:14

5^F：推 EQQD: 拜田神 04/02 08:58

6^F：推 kevin1ptt: 推田神！ 04/06 16:46

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

DataScience 板

Re: [问题] Validation set 到底在做什麽?

热门看板

赞助商连结