Re: [问题] Validation set 到底在做什麽?

时间Tue Mar 27 15:31:55 2018

感谢pipidog前辈的回文深入浅出的概念教育! 你的回文有大量的讯息真的学了不少抽象的讯息最难学但你教的方式特别好可是可是我的问题没有回答到 (是我一开始没问对问题) 我做的是机器翻译 seq2seq + attention (Bahdanau, Dzmitry, Kyunghyun Cho, and Yoshua Bengio (2014), “Neural ma- chine translation by jointly learning to align and translate.” arXiv preprint arXiv:1409.0473. Cho, Kyunghyun, Bart Van Merri nboer, Dzmitry Bahdanau, and Yoshua Ben- gio (2014a), “On the properties of neural machine translation: Encoder- decoder approaches.” arXiv preprint arXiv:1409.1259. Cho, Kyunghyun, Bart Van Merri nboer, Caglar Gulcehre, Dzmitry Bah- danau, Fethi Bougares, Holger Schwenk, and Yoshua Bengio (2014b), “Learn- ing phrase representations using rnn encoder-decoder for statistical machine translation.” arXiv preprint arXiv:1406.1078.) OpenNMT是把上述演算法实践的library之一 OpenNMT建立模组的时候validation set就是必需的了开始训练前必需先设定hyperparameter ephoch size; learning rate ... 这些hyperparameter 都要预先设定除此之外 **还要再给** val set 这样才能开始训练所以这样的 validation set 对 OpenNMT 不是用来挑选hyperparameter的＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃换个方式讲假设我有两份已知资料(AB两份资料） A拿来训练 B拿来测试 B的测试结果告诉我们成果到底怎样公平的验证 B就是终极测试但其实训练A之前可以调整很多hyperparameter 所以就先把A切成 a b 拿a 训练 b 测试找寻最佳的hyperparameter 找到後再依这样的设定训练A (期待B的测试会最好) 但是OpenNMT要求在训练小写a时也必须提供val set 这就是我的问题了 ※ 引述《pipidog (如果狗狗飞上天)》之铭言： : 你有三个资料集，train, validation, test : train没啥好说的，喂给机器，让机器学，生成潜在参数用的 : 练好之後，怎麽知道表现好不好？拿validation来测试。 : 如果不好，调整超参数後重新训练一次，再验证一次。反覆这个流程 : 直到在validation的表现满意为止。但故事至此尚未结束，是的，validation : 没有被机器读过，所以确实给出的表现可以看作模型对未知资料的表现， : 但问题是我们不停在做的事情，就是找出一组超参数，使得模型对於 : validation的表现最好，换言之，这个模型是有bias的，它的一切都在 : 迎合validation，但如果你的validation取得不具代表性怎麽办？这模型 : 的泛化能力就不能透过validation来证明。 : 所以你最终的模型必须要在test上测试才算数。 : 简单说，train是拿来训练潜在参数的，validation是拿来挑选超参数的， : 这两个资料集机器都去迎合过它们，换言之，都"脏掉了"，所以我们才需要 : test set，它既与潜在参数无关，也与超参数无关，是理想上真正独立超然的 : 模型判官。这样说，你明白了吗？ : 至於cross validation，那是另一个很长的故事，我想你应该，也必须花时间 : 了解，这是机器学习里面，模型选择的重要观念。 : ----- : Sent from JPTT on my Asus P00C. --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 68.230.60.98 ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1522135917.A.895.html ※ 编辑: lucien0410 (68.230.60.98), 03/27/2018 15:36:59 ※ 编辑: lucien0410 (68.230.60.98), 03/27/2018 16:17:38

1^F：推 goldflower: 为啥要你丢validation set=不用来挑超参数啊 03/27 16:12

2^F：→ goldflower: 如果今天你用tensorflow等等他fit的时候规定你一定 03/27 16:13

3^F：→ goldflower: 要放validation set 那就会产生跟你现在一样的问题 03/27 16:13

4^F：→ goldflower: 不知道你有没有发现你卡在哪里了重点在於validation 03/27 16:14

5^F：→ goldflower: set没有混进去train R 03/27 16:14

6^F：→ goldflower: 简单说就是openNMT很好心他拜托你看一眼validation 03/27 16:15

7^F：→ goldflower: 的结果确定结果好不好这样 03/27 16:15

8^F：推 tay2510: 不用怀疑 val 就是p大讲的那样你的问题是你的认知有误 03/27 23:44

9^F：推 tay2510: 你举的例子 a就是training set, b就是val set 然後B是tes 03/27 23:49

10^F：→ tay2510: t set 03/27 23:49

11^F：推 tay2510: a,b 绑在一起喂给training 是很多deep learning framewor 03/28 00:00

12^F：→ tay2510: k都有的设计建议你尽量不要从api去回推machine learning 03/28 00:00

13^F：→ tay2510: 的本质有点本末倒置 03/28 00:00

14^F：推 EGsux: p大没错。。 03/28 00:02

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

DataScience 板

Re: [问题] Validation set 到底在做什麽?

热门看板

赞助商连结