作者kaltu (ka)
看板DataScience
标题[问题] ROC worse than random
时间Mon Mar 11 20:22:41 2019
问题类别:(ex:ML,SVM,RL,DL,RNN,CNN,NLP,BD,Vis,etc...)
资料科学
使用工具:(ex:python,Java,C++,tensorflow,keras,MATLAB,etc...)
Python sklearn
问题内容:
背景
目前试图用GAN来处理small dataset的问题
用的是一个大约五十个病人的直肠癌MRI影像
有放射科医师label的KRAS值,0和1
基本思路是先切成5个fold然後各用DCGAN对0和1label产生一千、共一万张slice
然後把generated data跟着true data下去用VGG19判断label
问题
产生的K-fold ROC是漂亮的worse than random
http://i.imgur.com/YhS1O0B.jpg
查了网路文章,有人说这代表我的classifier依然建立了correlation
只是data preparation出问题
简单解法就把label flip即可
请问真的是这样吗?总觉得不大对劲
-----
Sent from JPTT on my Asus ASUS_Z01KDA.
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 218.173.65.97
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1552306963.A.9E3.html
1F:推 andrew43: 我会建议先检查全部code,很可能只是个低级错误。 03/11 21:02
2F:推 andrew43: 於是发现翻转就是正确结果也说不定。 03/11 21:05
3F:→ erre: 无言… 你有call package吗 03/12 14:03
4F:推 phoenixlife: 我知道这招 DCGAN产图当input你要慎重 03/27 08:48
5F:→ sma1033: DCGAN产出的图你确定会跟原本的图有相同性质?打个问号.. 03/27 13:16