看板Statistics
标 题Re: 工作遇到的一个统计问题
发信站无名小站 (Mon May 22 23:58:31 2006)
转信站ptt!Group.NCTU!grouppost!Group.NCTU!wretch
※ 引述《yhliu (老怪物)》之铭言:
> > ※ 引述《[email protected] ()》之铭言:
> > : 方程式:cost=a*A + b*B + c*C + d*D + e*E + f*F
> > : 其中cost代表产品每个月的总维修成本(已知)
> > : A,B,C,D,E,F代表每类产品每个月的产量(已知)
> > : a,b,c,d,e,f代表每种产品每个月维修的单位成本(未知)
> > : 今手边有的资料为每个月的cost及A,B,C,D,E,F(有15个月的资料..故有15组方程式)
> > : 而 a,b,c,d,e,f是我想要求的
> > : 我用回归去fit这个model结果做出来有两个参数是"负数"(单位成本不可能是负数的)
> > : 且全部参数的p值都大於0.05
> > : 最後我去掉几个outlier再重新跑回归,结果还是有些参数是"负数"且p值大於0.05
> > : 想请问大家有没其他idea可以提供呢?Thx....
> 才15笔资料, 解释变数一堆, 忽略常数项...
首先, 你的资料是月资料, 资料只有 15 笔 (15个月份),
却有 6 个解释变数 (6类产品). 很可能这 6 类维修数量
有高度多元共线性问题. 这是系数不显着但符号方向错误
的可能原因之一.
其次,虽然直觉上似乎 "如果没有维修就没有花费"; 但事
实上如果资料是那麽整齐, 就没甚麽好做统计分析的了!
回归模型或甚至任何统计模型, 都只是现实情况的一个近
似描述. 因此, 很少在用无常数项的回归模型. 不过, 这
可能不是系数变负号的原因? 但也非绝不可能! 毕竟单位
维修成本并不是常数.
由於解释变数是 "产量", 和维修成本间的关系是假设的,
而不是自然的或固有的, 因此模型隐含假设的 "单位维修
成本是常数" 并不符合事实. 产量与维修成本间的关系也
可能不是直线关系.
所谓 outlier 当然可能造成何计结果失真,但没有任何一
位统计学者会不经思索地建议 "去掉!" 才15笔资料, 所
谓 "去掉几个 outlier" 究竟剩下的是甚麽? 说得不客气
点: 统计不是这麽搞的! 何况如你所说, "去掉 outlier"
後问题仍在! 显然不是所谓 outlier 造成系数符号不对.
资料是按月统计, 时间数列难免有序列相关. 序列相关本
身是个问题; 另方面它也是前述 6类产品产量可能存在高
度多元共线性问题的成因之一.
事实上这问题背後麻烦一堆, 也不是在这里说说就能解决
的. 带着资料就近找人帮忙、讨论较实在!
--
H E L P !!! 统 计 专 业 版 需 要 你 !!! 来 贴 文 吧 !!!
无名小站 telnet://wretch.twbbs.org Statistics (统计方法讨论区)
成大计中站 telnet://bbs.ncku.edu.tw Statistics (统计方法及学理讨论区)
盈月与繁星 telnet://ms.twbbs.org Statistics (统计:让数字说话)
交大资讯次世代 telnet://bs2.twbbs.org Statistics (统计与机率)
★本文未经本人同意请勿转载; 回覆请勿全文引用, 请仅留下直接涉及部分。
--
夫兵者不祥之器物或恶之故有道者不处君子居则贵左用兵则贵右兵者不祥之器非君子
之器不得已而用之恬淡为上胜而不美而美之者是乐杀人夫乐杀人者则不可得志於天下
矣吉事尚左凶事尚右偏将军居左上将军居右言以丧礼处之杀人之众以哀悲泣之战胜以
丧礼处之道常无名朴虽小天下莫能臣侯王若能守之万物将自宾天地相合以降甘露民莫
之令而自均始制有名名亦既有夫亦将知止知止可以不殆譬道之在天 163.15.188.87海
1F:推 mmarty:果然是老师,精辟的解答........ 05/23 09:00