作者danail (呼嘎~)
看板Statistics
標題[問題] 求幫助,如果計算共同參加社團數
時間Tue Dec 26 10:25:25 2017
某學校有100個社團,每間社團皆有紀錄團員名單並使用Excel紀錄起來。
又該學校有1000名學生,且每位學生可能依照自己的喜好參加0~3個社團,
目前學校希望了解哪幾對社團(希望找出前5對社團)有最多共同參加的學生,
以了解同學們選擇複數社團的喜好及未來整合社團資源的方向。
備註:若社團22一組為一對,100個社團可以有4950種組合
目前自己的想法如下:
步驟1:先給予社團獨立的代碼後,利用社團紀錄的團員名單將100個社團的團員名單整合如下:
┌──────┬──────┐
│社團ID │學生ID │
├──────┼──────│
│AAA11 │E11XX │
├──────┼──────│
│AAA11 │E12XX │
├──────┼──────│
│AAA11 │F11XX │
├──────┼──────│
:
:
步驟2:挑出參加2個以上社團的學生。利用excel的設定格式化條件將學生ID「重複的値」變色,然後使用篩選的依色彩篩選挑出參加2個以上社團的學生後建立新表格。
┌──────┬──────┐
│社團ID │學生ID │
├──────┼──────│
│AAA11 │E11XX │
├──────┼──────│
│AAA11 │F11XX │
├──────┼──────│
:
:
步驟3:計算哪幾對社團(希望找出前5對社團)有最多共同參加的學生這個我就不會了T︿T,我只想到用土法煉鋼的方式,做一張矩陣表(4950種組合…)畫正字記號來算… 有沒有大大可以給我一點靈感或是教我怎麼用excel或是SAS來挑呢?感激不盡T︿T
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.77.190.173
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1514255127.A.BA1.html
※ 編輯: danail (42.77.190.173), 12/26/2017 10:30:12
※ danail:轉錄至看板 Math 12/26 10:37
1F:→ tan800630: 雖不知道明確做法 但這問題應該算是標準的購物籃分析 12/26 10:51
2F:→ tan800630: 也許可以用這個關鍵字去找找看網路教學?(或是關聯法則) 12/26 10:51
3F:→ recorriendo: 做一個社團X學生的矩陣 有參加記1 沒參加記0 12/27 01:04
4F:→ recorriendo: 兩社共同人數即對應兩行內積 故全部配對矩陣乘法而已 12/27 01:08
5F:推 tan800630: 尷尬 剛剛才看到因為網路問題重複推文 抱歉 12/27 11:07