看板Statistics
標 題Re: 請問 每個維度都是定性的資料,可以作哪些統計上的分析呢?
發信站無名小站 (Wed Apr 19 22:03:16 2006)
轉信站ptt!Group.NCTU!grouppost!Group.NCTU!wretch
※ 引述《yhliu (老怪物)》之銘言:
> ※ 引述《[email protected] (花貓whamow)》之銘言:
> > 就和標題說的一樣 我想請問一下
> > 例如如果我有一萬筆資料
> > 會員編號(流水號) 居住地(北、中、南、東) 購買商品編號(1到1000號)
> > 那麼"居住地" 和 "購買商品編號" 都是定性的資料吧
> > 那請問有哪些統計方法可以對這些資料作分析呢?
> > =====================我自已想的===========================
> > 我想到的是 可以作樣本比例的變異數分析
> > 例如求出北、中、南、東 四地各自 第100號商品 所占的購買百分比
> > 再用ANOVA來求母體比例是否相等
> > =========================================
> > 請問我的想法可行嗎 還有其他的統計方法可以作嗎?
> > 想把統計學通的資管生
> 如果你要看不同居住地區是否購買商品比例有差異, 列聯
> 相關分析可以做. 統計學 "交叉表分析", "列聯表分析",
> "獨立性之卡方檢定" 談的是這主題. 更進階的分析方法,
> 則需看 categorical data analysis 的專書。
雖然資料有 10000筆, 但 4x1000=4000 cells, 是一個稀
殊列聯表. 而此列聯表太大, 即使有做 exact inference
的軟體, 計算恐怕也很耗時. 因此不建議採用 1000 種商
品分類; 根據商品特性歸併分類較佳.
以上 "歸併分類" 建議除基本列聯相關分析外, 其他適用
此資料之進階模型應也同樣適用. 即使不從大樣本近似理
論來看, 只看計算上的穩定度, 稀疏列聯表將使許多統計
量之計算很不穩定 (想一想一個 cell 有一個觀測值的變
動造成的影響就清楚了!)
--
◢ 川◣ │││││ 您在找統計版嗎? 竭誠邀請您加入 Statistics!
▃▅▃▅▆ ◣
││││ 無名小站 telnet://wretch.twbbs.org
(cat▍_/ ▲ 、 ││ 成大計中站 telnet://bbs.ncku.edu.tw
▊ ▊Moon◤▍▍▄▂ │ 交大次世代 telnet://bs2.twbbs.org
▃─ _▍_ ◣▌▎▃▅
盈月與繁星 telnet://ms.twbbs.org
▲ ◤  ̄ ◢▂
▃ *Mooncat~ ★未經本人同意請勿轉載; 回覆請勿全文引用!
--
夫兵者不祥之器物或惡之故有道者不處君子居則貴左用兵則貴右兵者不祥之器非君子
之器不得已而用之恬淡為上勝而不美而美之者是樂殺人夫樂殺人者則不可得志於天下
矣吉事尚左凶事尚右偏將軍居左上將軍居右言以喪禮處之殺人之眾以哀悲泣之戰勝以
喪禮處之道常無名樸雖小天下莫能臣侯王若能守之萬物將自賓天地相合以降甘露民莫
之令而自均始制有名名亦既有夫亦將知止知止可以不殆譬道之在天 163.15.188.87海