[问题] RNN(GRU)的memory在评估模型中如何工作？

时间Wed Dec 23 17:25:25 2020

作业系统:Linux 问题类别:RNN中的GRU 使用工具:Pytorch 问题内容: 初学者学习有关RNN在Forward中的过程，对於memory在评估或是实际应用中如何工作有疑惑。首先假设我有一个Batch(6)资料，其维度分别代表( seq_len(40), batch_size(6), embedding_dim(15) )，可以理解成(句子长度, batch size, word vector向量长度)。接着假设我有一个GRU Layer，他是单向的，一层(没有堆叠)，memory的维度是7。代码如下 https://imgur.com/IJoQ9mE 在执行Forward中，我必须给一个初始化的memory，根据batch(6)、单向、memory维度(7)，我的初始化memory是一个(1, 6, 7)的Tensor。在执行完之後我会得到输出值(y)以及更新的memory。代码如下 https://imgur.com/3Sr7DId 假设我之後接了一个Fully connected layer结束，使用Log loss当作损失函数。 Train了一发之後，我想找一笔测试资料(batch=1)来输入给模型。问题是我在输入模型的初始化memory应该选哪一个？还是我根本不需要去选？但是不选的话，很奇怪。或是我完全错误理解GRU的工作模式了？请高手指教，谢谢。 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.168.199.15 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1608715527.A.872.html

1^F：推 winston82926: 如果用一开始rand出来的initial hidden vector (h_0 12/27 13:42

2^F：→ winston82926: ) train好後，就固定他不要动只要丢input (x)就好 12/27 13:42

3^F：推 patrick2dot0: pytorch document的nn.GRU有写 12/27 13:59

4^F：→ patrick2dot0: Defaults to zero if not provided 12/27 14:00

5^F：→ wheado: 好的，谢谢各位 12/27 18:16

6^F：→ wheado: 所以如果我要随机生成，我必须确保给个资料的h_0要一样。 12/27 18:17

赞助商连结

您可能会有兴趣的文章

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称，例如：Boy-Girl 或站内搜寻

TOP

WEB批踢踢(PTT)

DataScience 板

[问题] RNN(GRU)的memory在评估模型中如何工作？

热门看板

赞助商连结