作者hannxnn (hannxnn)

看板Python

标题

[问题] 如何在Python中训练好autoencoder?

时间Sun Aug 4 22:12:20 2024

大家好，我最近在做论文相关的研究，需要在Python中训练一个autoencoder（自编码器）。目前遇到了一些困难，希望能得到大家的帮助。以下是我目前的工作进展和遇到的问题：主要是想把一个21维的问题降维成2维 1. 我使用了TensorFlow和Keras来搭建autoencoder模型。模型结构如下： - 使用GlorotUniform进行初始化。 - 编码器包含多个层，每个层使用Sigmoid激活函数和L2正则化，并在每层後面加入 Dropout层。具体结构如下： - 第一层：1024个神经元，输入形状为21 - 第二层：512个神经元 - 第三层：256个神经元 - 第四层：128个神经元 - 第五层：64个神经元 - 第六层：32个神经元 - 最後一层：2个神经元 - 解码器结构对称於编码器，输入形状为2 2. 我使用了SGD优化器和均方误差（MSE）作为损失函数 3. 训练过程中，发现模型的重建误差一直无法降低，训练结果的资料点很集中，不像论文中在0-1之间 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.27.65.118 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1722780742.A.734.html

1^F：→ lycantrope: 长得不像autoencoder 可以去DataScience版问 08/04 23:15

好的感谢！

2^F：推 DaOppaiLoli: learning rate 太高吗 08/04 23:26

我设定0.01

3^F：推 chang1248w: 你为什麽要这样的一个二维表示？ 08/05 01:01

因为要把原始高维数据降维再来做後续的工作

4^F：→ chang1248w: 你的资料有几笔？有没有做过标准化？有没有长尾？ 08/05 01:02

原始资料是100*21

5^F：→ wuyiulin: 你先确定原始资料的物理意义，再正规化，最後那个0-1也 08/05 01:07

但是转换完的数据过於集中不是代表模型没有训练好吗

6^F：→ wuyiulin: 不一定是你要的，去思考一下物理意义。 08/05 01:07

7^F：→ wuyiulin: 然後这些指导教授应该meeting的时候要带，去问一下你指 08/05 01:07

他说如果我都是照着流程做的话那他也不知道问题出在哪了…

8^F：→ wuyiulin: 导。 08/05 01:07

※ 编辑: hannxnn (114.27.65.118 台湾), 08/07/2024 21:43:06 ※ 编辑: hannxnn (114.27.65.118 台湾), 08/07/2024 21:43:45 ※ 编辑: hannxnn (114.27.65.118 台湾), 08/07/2024 21:44:06 ※ 编辑: hannxnn (114.27.65.118 台湾), 08/07/2024 21:44:16 ※ 编辑: hannxnn (114.27.65.118 台湾), 08/07/2024 21:45:13 ※ 编辑: hannxnn (114.27.65.118 台湾), 08/07/2024 21:45:49

9^F：→ chang1248w: 要做什麽样的後续处理？ 08/07 21:53

训练完自编码器会再训练深度前馈网络跟高斯过程模型然後用高斯过程模型来预测均值用指标函数来做可靠度估计

10^F：→ chang1248w: 你这资料量太少了，放弃DL吧 08/07 21:57

11^F：→ chang1248w: 用pca或者umap 08/07 22:00

12^F：→ chang1248w: 如果你要硬上，那用个两层16 node就好 08/07 22:02

13^F：→ chang1248w: 然後确认有做标准化，有长尾那loss可以改用log cosh 08/07 22:05

好的我再试试看这个感谢！

14^F：→ wuyiulin: 你资料只有100笔的话，怎麽做都会这样。 08/08 12:02

我也是这样想但就原作者的范例中他是做得出来的感觉是有漏掉些什麽或是作者没有提出来的

15^F：→ wuyiulin: 不是要诋毁你老师，但是照流程做不知道问题出在哪里， 08/08 12:04

16^F：→ wuyiulin: 这老师不提供指导的话可以换一个（#。 08/08 12:04

17^F：→ wuyiulin: 技术上的问题还有几个，你资料上下限值是多少？ Decode 08/08 12:05

请问一下资料上下限值是什麽意思

18^F：→ wuyiulin: r 怎麽写的？现在 MSE 测出来多少？ 08/08 12:05

19^F：→ wuyiulin: 我会问 Decoder 是因为：如果你通道数量是 21，第一层 08/08 12:06

解码器部分是 2/32/64/128/256/512/1024 输出形状是21 这样

20^F：→ wuyiulin: 就直接打 1024 那边有点微妙。 08/08 12:06

21^F：→ dobedobedo: 直接做PCA看看变异数多少呀 08/08 12:55

好的我试试看谢谢～ ※ 编辑: hannxnn (42.77.41.104 台湾), 08/08/2024 16:07:42 ※ 编辑: hannxnn (42.77.41.104 台湾), 08/08/2024 16:09:55 ※ 编辑: hannxnn (42.77.41.104 台湾), 08/08/2024 16:10:21 ※ 编辑: hannxnn (42.77.41.104 台湾), 08/08/2024 16:11:27 ※ 编辑: hannxnn (42.77.41.104 台湾), 08/08/2024 16:13:33 ※ 编辑: hannxnn (42.77.41.104 台湾), 08/08/2024 16:15:02

22^F：→ chang1248w: 你的後续没有必要接一个ae吧，直接21维下去做也行 08/08 16:58

目前就是照教授説跟着paper的内容实作看看～ ※ 编辑: hannxnn (114.27.65.118 台湾), 08/09/2024 07:18:54

23^F：推 charliedung: paper只用100笔如果没有预训练你也没办法复现方法也 08/09 07:47

了解原来如此

24^F：→ charliedung: 都对要考虑是不是那篇paper...ry 08/09 07:47

25^F：→ chang1248w: 很明显你们教授就不是这个领域的 08/09 13:55

：（（（ ※ 编辑: hannxnn (114.27.65.118 台湾), 08/09/2024 15:09:57 ※ 编辑: hannxnn (114.27.65.118 台湾), 08/09/2024 15:19:37

26^F：推 uncouth: Paper 是哪篇可否分享一下？ 08/12 09:48

是 " Deep learning for high-dimensional reliability analysis"

27^F：→ wuyiulin: 资料的上下限我举个例子，如果一张 RGB 图片他的通道值 08/12 11:51

28^F：→ wuyiulin: 最低就是 0 最高就是 255（如果是 uint8） 08/12 11:51

了解

29^F：→ wuyiulin: 你对手上资料上下限有概念吗？这与 activate func 有关 08/12 11:53

我的资料是一组常态分布 mean是3.41 standard deviation是0.2 20维然後有100个初始样本

30^F：→ wuyiulin: 然後我在隔壁板看到你提到重建误差，推测你下游任务是 08/12 11:58

31^F：→ wuyiulin: GAI 之类的，如果是这种就自己生一个模拟21维去打， 08/12 11:58

32^F：→ wuyiulin: 看重建结果就能知道模型哪里没处理好。 08/12 11:58

感谢好的我试试看 ※ 编辑: hannxnn (36.236.209.27 台湾), 08/14/2024 00:16:35 ※ 编辑: hannxnn (36.236.209.27 台湾), 08/14/2024 00:17:18 ※ 编辑: hannxnn (36.236.209.27 台湾), 08/14/2024 00:19:53 ※ 编辑: hannxnn (36.236.209.27 台湾), 08/14/2024 00:20:26 ※ 编辑: hannxnn (36.236.209.27 台湾), 08/14/2024 00:20:43

33^F：推 charliedung: paper有提到用mcs抽样到10万笔有跟着做吗内文没提 08/14 02:00

有的但10万笔的MCS也是在训练完自编码器才会用到

34^F：→ charliedung: 到另外他神经元是用20,20,20,2 你要增加神经元的数 08/14 02:00

35^F：→ charliedung: 量训练资料就要跟着增加不是越多越好 08/14 02:00

然後我目前是在做4.1 case study I 20D那个例子感谢所以我的编码器部分是用4层20,20,20,2这样子吗谢谢 ※ 编辑: hannxnn (36.236.209.27 台湾), 08/14/2024 09:39:43 ※ 编辑: hannxnn (36.236.209.27 台湾), 08/14/2024 09:40:24 ※ 编辑: hannxnn (36.236.209.27 台湾), 08/14/2024 09:47:08

36^F：推 charliedung: 对先照他的方法设定有需要再调整 08/14 23:43

好的谢谢我目前有跟着这样做了 ※ 编辑: hannxnn (36.236.187.141 台湾), 08/16/2024 01:01:02

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Python 板

[问题] 如何在Python中训练好autoencoder?

热门看板

赞助商连结