Re: [问题] ROC worse than random

时间Mon Mar 11 21:23:46 2019

※ 引述《kaltu (ka)》之铭言： : 问题类别:(ex：ML,SVM,RL,DL,RNN,CNN,NLP,BD,Vis,etc...) : 资料科学 : 使用工具:(ex:python,Java,C++,tensorflow,keras,MATLAB,etc...) : Python sklearn : 问题内容: : 背景 : 目前试图用GAN来处理small dataset的问题 : 用的是一个大约五十个病人的直肠癌MRI影像 : 有放射科医师label的KRAS值，0和1 : 基本思路是先切成5个fold然後各用DCGAN对0和1label产生一千、共一万张slice : 然後把generated data跟着true data下去用VGG19判断label : 问题 : 产生的K-fold ROC是漂亮的worse than random : http://i.imgur.com/YhS1O0B.jpg : 查了网路文章，有人说这代表我的classifier依然建立了correlation : 只是data preparation出问题 : 简单解法就把label flip即可 : 请问真的是这样吗？总觉得不大对劲 : ----- : Sent from JPTT on my Asus ASUS_Z01KDA. 虽然你没有提供资料，但我这边先假设你 train ROC > 0.5, test ROC < 0.5 如果你的 train ROC < 0.5 表示 model 没有学好，建议检查一下 model 架构或是参数或是图片本身还是数值范围有没有什麽问题。假设现在 train ROC > 0.5， model 训练一切正常，但是 test ROC < 0.5 表示在你现在的 feature space 下，train 跟 test 的分布显然是不同的，直接 label flip 是很危险的一件事情。这边不太精确地打个比方，想像一个情况，如果今天是做猫狗分类器，在 train 的时候发现有吐舌头的都是狗，没吐舌头的都是猫。model 分得很好，所以 train ROC > 0.5。 test 的时候却发现猫都有吐舌头，所以全部分错了，导致 test ROC < 0.5 那麽直接 flip label 很显然是不合理的解法，他只对这个 test set 有用，并不是对所有的猫狗有用。在这个 case 应该是去检查为什麽 model 会只把吐舌头当作决定性的特徵然後针对他做修正。在你的 case 我建议先检查一下 DCGAN 生出来的影像是否符合预期。确认正确後可以再检查一下是因为图片的哪个区块被分错 class。还有一个题外话， small image dataset 可以先用平移旋转缩放之类的方式先做 data augmentation 前提是如果直肠癌 MRI 平移旋转缩放後不会让图片变成另一个 class。以上。 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 59.104.3.78 ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1552310628.A.2D4.html

1^F：→ jigfopsda: 承上篇推文，程式有 bug 也是不无可能 03/11 21:24

2^F：推 bboybighead2: 推讲的很清楚 03/16 10:17

3^F：推 shaform: 推推 03/20 07:54

4^F：推 myfirstjump: 推 07/22 13:20

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

DataScience 板

Re: [问题] ROC worse than random

热门看板

赞助商连结