作者a3236852 (serena)
看板R_Language
标题[问题] 关联式规则有空集合
时间Tue Mar 6 11:40:12 2018
[问题类型]:
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
[软体熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
我要用R做关联式规则,
使用arules套件,分析出来不知道为什麽会有空集合?(不知道怎麽描述XD)
我想可能是我最小信赖度(min confidence)调太低?
想知道为什麽调太低会出现空集合?
还有想知道要怎麽提高分析出来的结果数量,
本来以为是增加资料,但因为原始样本就只有这些,
所以用随机的方式增加原本的样本,
结果不知道是不是因为关联式规则算法是
在全部东西里占几分之几,还有在a东西里b也存在的几分之几,
所以整体就跟着增加,并没有比较多的分析结果
後来把资料删减到50笔反而比较多
有没有什麽方法可以将结果增加呢?除了得到更多原始资料,
谢谢~
[程式范例]:
张贴能够重现错误的程式码,可以帮助版友更快的帮你解决问题
建立重现错误的方法可以参考:
install.packages("readxl")
library(readxl)
path <- "random.csv"
data <- read.csv(path, header=T, sep=",")
data1=as.matrix(data)
require(arules)
rule <- apriori(data1,parameter=list( supp=0.1, conf=0.1))
inspect(rule)
https://imgur.com/kH9IvlP
资料大概是长这样 有49个项目A1~A49
原始资料笔数是大约是五百笔,
结果是这样
https://imgur.com/PCEz9We
[环境叙述]:
R version 3.4.1
[关键字]:
关联式规则
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.44.147.236
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1520307614.A.96C.html
※ 编辑: a3236852 (114.44.147.236), 03/06/2018 11:42:29
1F:推 sw52099: Supp太高 我的经验是6000笔资料都会把supp调到0.003之类03/06 21:49
2F:→ sw52099: 的才会有结果03/06 21:49
3F:推 sw52099: 你的supp是0.1,资料是500笔,代表同一个规则要出现500*003/06 21:52
4F:→ sw52099: .1=50次(就是结果里的count)才会算进来。而500笔资料要03/06 21:52
5F:→ sw52099: 出现相同的规则50次,感觉上是有点困难啦,有错请各位指03/06 21:52
6F:→ sw52099: 正。03/06 21:52
7F:推 sw52099: 呃...不好意思,图没跑出来,看来我回答错了,请忽略上03/06 21:55
8F:→ sw52099: 面一大段(潜水)03/06 21:55
9F:→ clansoda: 我的经验是 不管你门槛怎麽调那个空白的规则都会存在03/06 22:17
10F:→ clansoda: 可能要问作者,不过那个package应该是已经没有再维护了03/06 22:17
想请问所以是套件的问题罗,如果用pythonn做空集合可能就会消失对吧?
11F:推 a78998042a: 基本上关联规则是你筛选出给定support, confidence 的03/06 22:23
12F:→ a78998042a: 结果,只是根据条件可以用apriori 演算法加速筛选,而03/06 22:23
13F:→ a78998042a: 资料中的每种组合都有一组supp, con,演算法只是选出03/06 22:23
14F:→ a78998042a: 来给你看,所以如果你想增加规则的结果,你可以考虑先03/06 22:23
15F:→ a78998042a: 列出所有的规则组合,再看看你要多少结果,反着切sup03/06 22:23
16F:→ a78998042a: 跟con。03/06 22:23
17F:→ a78998042a: 如果有新资料,再用你上一个切的结果做样本参数,然後03/06 22:25
18F:→ a78998042a: 就看你想怎样做了。03/06 22:25
19F:推 Luluemiko: 先射箭,再画靶,去测支持度跟信心度的参数组合03/07 10:28
※ 编辑: a3236852 (42.73.115.104), 03/07/2018 11:06:25
谢谢大家的意见,我有想法了,谢谢!!!!
※ 编辑: a3236852 (42.73.115.104), 03/07/2018 12:55:04