看板Statistics
标 题Re: 请问 每个维度都是定性的资料,可以作哪些统计上的分析呢?
发信站无名小站 (Wed Apr 19 22:03:16 2006)
转信站ptt!Group.NCTU!grouppost!Group.NCTU!wretch
※ 引述《yhliu (老怪物)》之铭言:
> ※ 引述《[email protected] (花猫whamow)》之铭言:
> > 就和标题说的一样 我想请问一下
> > 例如如果我有一万笔资料
> > 会员编号(流水号) 居住地(北、中、南、东) 购买商品编号(1到1000号)
> > 那麽"居住地" 和 "购买商品编号" 都是定性的资料吧
> > 那请问有哪些统计方法可以对这些资料作分析呢?
> > =====================我自已想的===========================
> > 我想到的是 可以作样本比例的变异数分析
> > 例如求出北、中、南、东 四地各自 第100号商品 所占的购买百分比
> > 再用ANOVA来求母体比例是否相等
> > =========================================
> > 请问我的想法可行吗 还有其他的统计方法可以作吗?
> > 想把统计学通的资管生
> 如果你要看不同居住地区是否购买商品比例有差异, 列联
> 相关分析可以做. 统计学 "交叉表分析", "列联表分析",
> "独立性之卡方检定" 谈的是这主题. 更进阶的分析方法,
> 则需看 categorical data analysis 的专书。
虽然资料有 10000笔, 但 4x1000=4000 cells, 是一个稀
殊列联表. 而此列联表太大, 即使有做 exact inference
的软体, 计算恐怕也很耗时. 因此不建议采用 1000 种商
品分类; 根据商品特性归并分类较佳.
以上 "归并分类" 建议除基本列联相关分析外, 其他适用
此资料之进阶模型应也同样适用. 即使不从大样本近似理
论来看, 只看计算上的稳定度, 稀疏列联表将使许多统计
量之计算很不稳定 (想一想一个 cell 有一个观测值的变
动造成的影响就清楚了!)
--
◢ 川◣ │││││ 您在找统计版吗? 竭诚邀请您加入 Statistics!
▃▅▃▅▆ ◣
││││ 无名小站 telnet://wretch.twbbs.org
(cat▍_/ ▲ 、 ││ 成大计中站 telnet://bbs.ncku.edu.tw
▊ ▊Moon◤▍▍▄▂ │ 交大次世代 telnet://bs2.twbbs.org
▃─ _▍_ ◣▌▎▃▅
盈月与繁星 telnet://ms.twbbs.org
▲ ◤  ̄ ◢▂
▃ *Mooncat~ ★未经本人同意请勿转载; 回覆请勿全文引用!
--
夫兵者不祥之器物或恶之故有道者不处君子居则贵左用兵则贵右兵者不祥之器非君子
之器不得已而用之恬淡为上胜而不美而美之者是乐杀人夫乐杀人者则不可得志於天下
矣吉事尚左凶事尚右偏将军居左上将军居右言以丧礼处之杀人之众以哀悲泣之战胜以
丧礼处之道常无名朴虽小天下莫能臣侯王若能守之万物将自宾天地相合以降甘露民莫
之令而自均始制有名名亦既有夫亦将知止知止可以不殆譬道之在天 163.15.188.87海