作者jimkukky (kukky)
看板Master_D
标题[请益] 研究方法-资料探勘问题
时间Mon Feb 1 16:08:11 2016
假设我有1000笔资料,品项为10种
我是以人工方式根据品项的次数高低去分组,
分为A、B、C、D四个资料组,
suppport为0.1,
把四组分别下去跑关联规则,
类似多重支持度的概念。
而目前问题是想利用自动化方式去跑关联规则,
重点是不需要以人去根据次数高低去分组,
不知道有何方法?可以自动化跑多重支持度的方式或者是以次数频率分析的方法之类的?
麻烦大大谢谢!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.42.47.219
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Master_D/M.1454314093.A.9F8.html
1F:→ hsnuyi: 看不太懂你想做啥 是要把1000笔资料自动分成四组? 02/02 01:03
2F:→ hsnuyi: 然後这四组分别要有高度相关性是吗? 02/02 01:06
对就是希望能够自动分组,每组具有高相关性的意思,只是不知道有什麽方法之类的
3F:→ mosenay: 单纯分组的话可以参考一下cluster analysis 02/03 23:29
4F:→ mosenay: 不过不清楚你说的每组具有相关是指组内还是组间 02/03 23:31
指的是组内,不知道还有没其他方法之类的?
5F:→ hsnuyi: clustering有很多种方法啊 你try过哪些了呢? 02/05 01:07
那你可以举一下用什麽工具或方法直接将资料拆开来吗?
※ 编辑: jimkukky (36.229.24.205), 02/05/2016 22:22:03
6F:→ hsnuyi: google clustering algorithm, wiki里就一大堆 02/06 02:19
7F:→ hsnuyi: python也有ML的package可以用 应该几行code就可实作了 02/06 02:23
ok谢谢!
※ 编辑: jimkukky (114.45.112.134), 02/06/2016 18:32:21