作者myjstyle (陳思毛)
看板Statistics
標題[問題] 關於stata,multinomial logit,找PredictP
時間Fri Mar 14 14:12:42 2014
又來請教板上的大家了QQ
想問當我利用stata進行mlogit後
想要得到Predict Probability的問題
第一個是outcome A的整理
. tab A
A | Freq. Percent Cum.
------------+-----------------------------------
1 | 501 62.78 62.78
2 | 245 30.70 93.48
3 | 52 6.52 100.00
------------+-----------------------------------
Total | 798 100.00
而當我跑完molgit之後
依照stata手冊上所說想得到估計的機率
. predict P1 P2 P3
(option pr assumed; predicted probabilities)
. summarize P1 P2 P3
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
P1 | 798 .6278195 .0961358 .2042496 .8797781
P2 | 798 .3070176 .1041065 .0910776 .7751256
P3 | 798 .0651629 .017927 .0193713 .1271836
得到的各個比例卻跟實際樣本的比例(tab中)一樣
62.78 vs 0.6278195
30.70 vs 0.3070176
6.52 vs 0.0651629
想問說這個predict是代表說把樣本再放到跑完mlogit之後的估計式中得到的嗎?
而當我計算margin effects時也會得到一個predict possibility感覺比較像要求的
. mfx, predict (outcome(1))
Marginal effects after mlogit
y = Pr(A==1) (predict, outcome(1))
= .63693578
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
CE | .005055 .00159 3.18 0.001 .001939 .008171 49.4875
CG | .0121339 .00584 2.08 0.038 .000685 .023583 12.896
CJ | .0004675 .00027 1.73 0.083 -.000062 .000997 95.5702
------------------------------------------------------------------------------
表裡面的 y = Pr(A==1) (predict, outcome(1)) 感覺比較像我得到的
= .63693578
不知道用margin effect所做的是否正確
然後如果想得到估計的機率要怎麼求得呢
想確定一下兩種方式估計出來的機率是代表甚麼意思
再次感謝大家QQ
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.86.49
※ 編輯: myjstyle 來自: 140.112.86.49 (03/14 14:13)
1F:推 Yukirin:第一個不是基本要求嗎..... 03/14 14:31
2F:→ myjstyle:想問就是predict P1 P2 P3的指令的部分和mfx, predict 03/14 14:33
3F:→ myjstyle:第一個表格是想說可以讓大家對照 03/14 14:33
4F:→ myjstyle:因為用predict P1 P2 P3跑出來的結我跟實際樣本比例一樣 03/14 14:34
5F:→ myjstyle:覺得好像怪怪的 03/14 14:34
※ 編輯: myjstyle 來自: 140.112.86.49 (03/14 14:34)
6F:推 Yukirin:為什麼怪怪的? 03/14 14:38
7F:→ myjstyle:覺得估計出來的東西跟實際的比例完全一樣 03/14 14:39
8F:→ myjstyle:感覺有哪裡出錯 03/14 14:39
9F:→ myjstyle:或是他算的東西是計算別的 03/14 14:39
10F:→ myjstyle:就是我想利用mlogit得到不同樣本得到某種類別(outcome) 03/14 14:40
11F:→ myjstyle:估計的機率 03/14 14:41
12F:→ myjstyle:想說如果預測的機率跟實際的機率一樣 03/14 14:41
13F:→ myjstyle:那這樣的話不是就直接算那個類別的比例就好了? 03/14 14:42
14F:推 Yukirin:predict指令就是作這件事情啊。 難道跑一個回歸模型的時候 03/14 14:42
15F:→ Yukirin:你會期待mean(hat(y))跟mean(y)不一樣嗎? 03/14 14:42
16F:→ Yukirin:跑迴歸就是要用到X的資訊,直接算類別比例只有Y的。 03/14 14:43
17F:→ Yukirin:預測出來的比例要跟實際比例相同是基本要求,但不保證在模 03/14 14:44
18F:→ Yukirin:模型下分到A的樣本跟在實際資料中分到A的樣本一模一樣。 03/14 14:44
19F:→ myjstyle:這部分懂了>< 感謝YukirinQQ 03/14 14:49
20F:→ myjstyle:想問mfx, predicte (outcome(1)) 03/14 14:49
21F:推 Yukirin:mfx主要的用處是你可以試算說給定x1=??? x2=???時候的機率 03/14 14:50
22F:→ myjstyle:算出來的機率的話代表的是甚麼,換這邊不太懂了 03/14 14:51
23F:→ Yukirin:所以我猜你在沒有指定那些值的情況下,他給了你一個 03/14 14:51
24F:→ Yukirin:given x1=mean(x1) x2=mean(x2)下outcome==1的機率 03/14 14:51
25F:→ myjstyle:喔喔我想一下!!! 感謝你>< 03/14 14:51
26F:→ myjstyle:好像瞭解了!!所以如果我想了解其中一個樣本的機率 03/14 14:52
27F:→ myjstyle:就是把變數帶進去得到的就是了 03/14 14:53
28F:推 Yukirin:不用,其中一個樣本的機率你已經用predict得到了 03/14 14:54
29F:→ myjstyle:了解了!!!非常感謝Yukirin QQ 謝謝你><!!! 03/14 15:00