作者danail (呼嘎~)
看板Statistics
标题[问题] 求帮助,如果计算共同参加社团数
时间Tue Dec 26 10:25:25 2017
某学校有100个社团,每间社团皆有纪录团员名单并使用Excel纪录起来。
又该学校有1000名学生,且每位学生可能依照自己的喜好参加0~3个社团,
目前学校希望了解哪几对社团(希望找出前5对社团)有最多共同参加的学生,
以了解同学们选择复数社团的喜好及未来整合社团资源的方向。
备注:若社团22一组为一对,100个社团可以有4950种组合
目前自己的想法如下:
步骤1:先给予社团独立的代码後,利用社团纪录的团员名单将100个社团的团员名单整合如下:
┌──────┬──────┐
│社团ID │学生ID │
├──────┼──────│
│AAA11 │E11XX │
├──────┼──────│
│AAA11 │E12XX │
├──────┼──────│
│AAA11 │F11XX │
├──────┼──────│
:
:
步骤2:挑出参加2个以上社团的学生。利用excel的设定格式化条件将学生ID「重复的値」变色,然後使用筛选的依色彩筛选挑出参加2个以上社团的学生後建立新表格。
┌──────┬──────┐
│社团ID │学生ID │
├──────┼──────│
│AAA11 │E11XX │
├──────┼──────│
│AAA11 │F11XX │
├──────┼──────│
:
:
步骤3:计算哪几对社团(希望找出前5对社团)有最多共同参加的学生这个我就不会了T︿T,我只想到用土法炼钢的方式,做一张矩阵表(4950种组合…)画正字记号来算… 有没有大大可以给我一点灵感或是教我怎麽用excel或是SAS来挑呢?感激不尽T︿T
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 42.77.190.173
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1514255127.A.BA1.html
※ 编辑: danail (42.77.190.173), 12/26/2017 10:30:12
※ danail:转录至看板 Math 12/26 10:37
1F:→ tan800630: 虽不知道明确做法 但这问题应该算是标准的购物篮分析 12/26 10:51
2F:→ tan800630: 也许可以用这个关键字去找找看网路教学?(或是关联法则) 12/26 10:51
3F:→ recorriendo: 做一个社团X学生的矩阵 有参加记1 没参加记0 12/27 01:04
4F:→ recorriendo: 两社共同人数即对应两行内积 故全部配对矩阵乘法而已 12/27 01:08
5F:推 tan800630: 尴尬 刚刚才看到因为网路问题重复推文 抱歉 12/27 11:07