看板Statistics
標 題Re: 工作遇到的一個統計問題
發信站無名小站 (Mon May 22 23:58:31 2006)
轉信站ptt!Group.NCTU!grouppost!Group.NCTU!wretch
※ 引述《yhliu (老怪物)》之銘言:
> > ※ 引述《[email protected] ()》之銘言:
> > : 方程式:cost=a*A + b*B + c*C + d*D + e*E + f*F
> > : 其中cost代表產品每個月的總維修成本(已知)
> > : A,B,C,D,E,F代表每類產品每個月的產量(已知)
> > : a,b,c,d,e,f代表每種產品每個月維修的單位成本(未知)
> > : 今手邊有的資料為每個月的cost及A,B,C,D,E,F(有15個月的資料..故有15組方程式)
> > : 而 a,b,c,d,e,f是我想要求的
> > : 我用迴歸去fit這個model結果做出來有兩個參數是"負數"(單位成本不可能是負數的)
> > : 且全部參數的p值都大於0.05
> > : 最後我去掉幾個outlier再重新跑迴歸,結果還是有些參數是"負數"且p值大於0.05
> > : 想請問大家有沒其他idea可以提供呢?Thx....
> 才15筆資料, 解釋變數一堆, 忽略常數項...
首先, 你的資料是月資料, 資料只有 15 筆 (15個月份),
卻有 6 個解釋變數 (6類產品). 很可能這 6 類維修數量
有高度多元共線性問題. 這是係數不顯著但符號方向錯誤
的可能原因之一.
其次,雖然直覺上似乎 "如果沒有維修就沒有花費"; 但事
實上如果資料是那麼整齊, 就沒甚麼好做統計分析的了!
迴歸模型或甚至任何統計模型, 都只是現實情況的一個近
似描述. 因此, 很少在用無常數項的迴歸模型. 不過, 這
可能不是係數變負號的原因? 但也非絕不可能! 畢竟單位
維修成本並不是常數.
由於解釋變數是 "產量", 和維修成本間的關係是假設的,
而不是自然的或固有的, 因此模型隱含假設的 "單位維修
成本是常數" 並不符合事實. 產量與維修成本間的關係也
可能不是直線關係.
所謂 outlier 當然可能造成何計結果失真,但沒有任何一
位統計學者會不經思索地建議 "去掉!" 才15筆資料, 所
謂 "去掉幾個 outlier" 究竟剩下的是甚麼? 說得不客氣
點: 統計不是這麼搞的! 何況如你所說, "去掉 outlier"
後問題仍在! 顯然不是所謂 outlier 造成係數符號不對.
資料是按月統計, 時間數列難免有序列相關. 序列相關本
身是個問題; 另方面它也是前述 6類產品產量可能存在高
度多元共線性問題的成因之一.
事實上這問題背後麻煩一堆, 也不是在這裡說說就能解決
的. 帶著資料就近找人幫忙、討論較實在!
--
H E L P !!! 統 計 專 業 版 需 要 你 !!! 來 貼 文 吧 !!!
無名小站 telnet://wretch.twbbs.org Statistics (統計方法討論區)
成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區)
盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話)
交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率)
★本文未經本人同意請勿轉載; 回覆請勿全文引用, 請僅留下直接涉及部分。
--
夫兵者不祥之器物或惡之故有道者不處君子居則貴左用兵則貴右兵者不祥之器非君子
之器不得已而用之恬淡為上勝而不美而美之者是樂殺人夫樂殺人者則不可得志於天下
矣吉事尚左凶事尚右偏將軍居左上將軍居右言以喪禮處之殺人之眾以哀悲泣之戰勝以
喪禮處之道常無名樸雖小天下莫能臣侯王若能守之萬物將自賓天地相合以降甘露民莫
之令而自均始制有名名亦既有夫亦將知止知止可以不殆譬道之在天 163.15.188.87海
1F:推 mmarty:果然是老師,精闢的解答........ 05/23 09:00