作者zxc741qaz123 (好吃burger)
看板DataScience
标题[讨论] 结构性资料如何增强
时间Mon May 18 02:05:16 2020
如题,
最近在研究mixmatch这个半监督式学习方法,
想尝试用在结构性资料上。
但其中对於资料增强的应用有些困惑,
图像的资料增强有很多方法,
但结构性的资料增强方法除了随机杂讯以外好像就没有了。
有人可能会说SMOTE这个方法,
不过那个跟我要的不太一样,
我是想要类似增强完後还是能够视作同一样本的方法,
并非创造新样本。
想请问大家有甚麽想法qq
非常感谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 27.242.107.39 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1589738718.A.E1E.html
※ 编辑: zxc741qaz123 (27.242.107.39 台湾), 05/18/2020 02:06:14
※ 编辑: zxc741qaz123 (27.242.107.39 台湾), 05/18/2020 02:25:12
2F:→ ariainaqua: GAN 应用於 Tabular data 上,不过其实我不大确定是05/20 12:35
3F:→ ariainaqua: 不是你要的?即使图像的资料增强後,也不见得会被视作05/20 12:37
4F:→ ariainaqua: 同一样本吧?05/20 12:37
mixmatch 是需要的,他要强调输出的一致性
6F:推 bruce3557: 也可以考虑 weak supervision 的方式05/23 00:25
7F:→ bruce3557: 尝试看看 snorkel05/23 00:25
感谢上面几位大大回应,
我有新的成果会再回文更新
※ 编辑: zxc741qaz123 (27.52.104.154 台湾), 05/23/2020 16:02:06
※ 编辑: zxc741qaz123 (27.52.104.154 台湾), 05/23/2020 16:04:07
※ 编辑: zxc741qaz123 (27.52.104.154 台湾), 05/23/2020 16:05:00
8F:推 ariainaqua: 感谢 bruce 大的分享,最近刚好在研究Crowdsourcing资 05/25 13:28
9F:→ ariainaqua: 料分类的问题,感觉可用skorkel试试 05/25 13:29
10F:推 ariainaqua: 另外感谢原PO回覆,之前看Ian写的 MixMatch 论文时没 05/25 13:49
11F:→ ariainaqua: 注意到 data augmentation 的限制,期待您後续成果:-) 05/25 13:51