作者hatemath1991 (hatemath)
看板R_Language
标题[问题] 关於Logistic回归的问题
时间Thu Jun 15 01:03:50 2017
[问题类型]:
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
[软体熟悉度]:
请把以下不需要的部份删除
新手(没写过程式,R 是我的第一次)
[问题叙述]:
想要训练一个高维度资料的Logistic回归模型,但是在後面的特徵却都出现NA
就是summary之後对於个特徵如下面的图,这是因为glm没办法处理太多特徵?
https://goo.gl/aJJNca
[程式范例]:
train_sample<-sample(40,30)
train_data<-temp[train_sample,]
test_data<-temp[-train_sample,]
model<-glm(type~.,family=binomial,data=train_data)
[环境叙述]:
R version 3.4.0 (2017-04-21)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 16.04.2 LTS
Matrix products: default
BLAS: /usr/lib/libblas/libblas.so.3.6.0
LAPACK: /usr/lib/lapack/liblapack.so.3.6.0
locale:
[1] LC_CTYPE=zh_TW.UTF-8 LC_NUMERIC=C LC_TIME=zh_TW.UTF-8
[4] LC_COLLATE=zh_TW.UTF-8 LC_MONETARY=zh_TW.UTF-8 LC_MESSAGES=zh_TW.UTF-8
[7] LC_PAPER=zh_TW.UTF-8 LC_NAME=C LC_ADDRESS=C
[10] LC_TELEPHONE=C LC_MEASUREMENT=zh_TW.UTF-8 LC_IDENTIFICATION=C
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] ROCR_1.0-7 gplots_3.0.1
loaded via a namespace (and not attached):
[1] compiler_3.4.0 class_7.3-14 tools_3.4.0 KernSmooth_2.23-15 gdata_2.18.0
[6] caTools_1.17.1 bitops_1.0-6 gtools_3.5.0
[关键字]:
选择性,也许未来有用
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.125.96.131
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1497459832.A.098.html
1F:推 Edster: 状况描述不清, 请问样本树跟变数分别的数量? 06/15 09:07
2F:→ hatemath1991: 样本数158。总共198个特徵 06/15 09:52
3F:推 Edster: 那答案很明显了吧. 06/15 10:34
4F:推 Edster: 请用两个点在三维空间画立体图看看. 06/15 10:36
5F:→ hatemath1991: 我现在用一百个变数还是一样大概在三十个後面都是NA 06/15 11:22
6F:→ hatemath1991: ?? 06/15 11:22
8F:→ f496328mm: 简单来讲就是 变数比方程式多 那一定解不出来 06/19 00:26
9F:推 f496328mm: 用 forward selection 试试看? 06/19 00:29
10F:→ f496328mm: 反正最後不好的变数还是要丢掉 06/19 00:29
11F:推 say29217074: 先降维 07/13 18:58