作者clansoda (小笨)
看板DataScience
标题[问题] 视觉辨识的几个问题
时间Fri Feb 28 05:04:30 2020
各位前辈好,我最近在练习用pytorch来实践最初的几个架构
但是遇到了一些问题
1. 我知道类别上如果太过不平衡可能会导致模型学习上会出现问题,例如
癌症筛检,假如癌症病人占1%而健康的人占99%,这样的话如果用一般方法来训练
模型应该都会分类成健康的人而检测不出癌症病人。解法通常都是用权重化的
目标函数来解决。我现在的问题是假如我的类别只有一种,比如说狗,但是狗有三种型态
分别是正面图,左面图与右面图。正面图占了80%而其他两种占了10%。这样的话会
对分类造成影响吗。他们的标签都是狗只是图片类型不一样而已。
2. 我目前用了pytorch写了alexnet与VGG系列的模型并用cifar10来做测试,想请问
训练的时候error上上下下的是属於正常的范畴吗,他都会往比较低的方向跑但不是每
次更新都是往下跑而是上上下下反反覆覆。
3.承上题,我在搭VGG的时候发现19层的架构没有办法训练而11层的可以,想请问是因为
cifar10的资料太小,用这麽深的架构没有办法训练吗。因为imagenet现在都不开放了
而我申请授权过了十几天都没有下文,不知道怎麽样才能测试这些架构。
我在这边放上我现在用的google colab希望有空的版友可以帮忙看一下我是不是
写错或者疏漏了什麽
https://reurl.cc/M7Yojp
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 73.189.185.80 (美国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1582837474.A.8C2.html
1F:→ y956403: 1标签都是狗那你要分类的是什麽 不太懂 2趋势是下降就正 02/28 08:47
2F:→ y956403: 常 3没有办法训练是指什麽 梯度爆炸吗 02/28 08:47
3F:→ clansoda: 应该说狗是其中一类label但是狗的训练图片又有三种方向 02/28 09:14
4F:→ clansoda: 但是我们的结果不需要知道是正面狗 右侧的狗或左侧的狗 02/28 09:14
5F:→ clansoda: 只需要知道是狗就好了,那这三种角度的狗的图片比例不是 02/28 09:15
6F:→ clansoda: 1:1:1的话 对於结果会有负面的影响吗 02/28 09:15
7F:→ clansoda: 感谢第二点的回答,第三点我知道为什麽了,我忘记加 02/28 09:15
8F:→ clansoda: optimizer.zero_grad了 导致前面的gradient一直累积到 02/28 09:16
9F:→ clansoda: 後面了 02/28 09:16
10F:推 tsoahans: 1.可能会影响可能不会 hard example mining或focal loss 02/28 10:31
11F:→ tsoahans: 就是用来解决这问题 正常的样本有些很好分有些很难分 02/28 10:32
12F:推 tsoahans: 你要看看你的模型在三种角度下,分类的正确率有没有差异 02/28 10:34
13F:→ tsoahans: 如果某个角度的狗分类正确率特别差,那再考虑变更权重 02/28 10:36
14F:→ clansoda: 感谢楼上的分享,我会查一下hard example mining 02/28 11:13
15F:→ clansoda: focal loss我在retinanet里面看过,我会稍微研究一下 02/28 11:14
16F:→ neil2003tw: 1要看你要应用在什麽样的data上面,model会忠实呈现你 02/28 16:05
17F:→ neil2003tw: 的训练,如果正面照比例很高的话正面的acc就会比较好 02/28 16:06
18F:→ neil2003tw: 你可以刻意用不同正面侧面背面比例的test data去验证 02/28 16:07
19F:→ clansoda: 好的,我会在接下来的实验上,特地测试稀少的类别 02/29 16:07
20F:→ clansoda: 感谢您的回答 02/29 16:07