作者axalto (亚斯拓)
看板Python
标题Re: [问题] 资料探勘
时间Sun Dec 14 21:42:05 2008
※ 引述《axalto (亚斯拓)》之铭言:
: 请问,python这工具能否做资料探勘之用
: 例如计算confidence,support,关联规则等等
: 如果可以请问有哪些函数可以用
: 谢谢
推文有人建议用weka来做,我试着使用weka
我是先使用Explorer=>Preprocess打开arff档案
再点选Associate分页点start开始执行
不过我发现一个问题,arff档案内的资料型态必须是类举的形式
不能用string,numeric等,且栏位内的资料必须都有值,不能是空的
可是我有些资料并非栏位内都由值
例有三笔资料
a,b,c,d
a,c,e,f,h,l
b,c,d,e,f
要做关联规则就无法使用了(会出现错误)
另外万一我有100多项资料,难道要一一列举出来吗
由於没有weka板,只好来此问问罗
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 59.112.242.40
1F:推 superGA:你要先弄成weka可以吃的格式 12/14 23:38
2F:→ axalto:我有用成WEKA的格式(arff),但我问题在於关联规则需所有栏位 12/15 16:56
3F:→ axalto:都要有资料,不然会错误,另外也无法用string,必须要列举的 12/15 16:56
4F:→ axalto:方式 12/15 16:56