作者purpleboy01 (紫喵)
看板Statistics
標題[問題] ARIMA的參數估計
時間Thu Mar 2 11:41:16 2017
大家好
最近有研究上的需要被交代要了解ARIMA的運算過程
前面的ACF/PACF跟後面的AIC/BIC公式稍微了解了
但參數估計的部分一直沒有很理解內容
(手邊有楊奕農及余桂霖的時間序列書)
因為自己對統計以及迴歸分析本身不是挺熟悉
雖然了解流程及式子本身但對於要代什麼進去還是挺茫然
老師是希望雖然有像是R可以直接下指令得到結果
但還是要先手算過才確定了解透徹
假設說我透過ACF跟PACF假定模型是ARIMA(1,0,1):
Yt = α + ψYt-1 + εt + θεt-1
那接下來參數估計的流程步驟應該是如何呢??
謝謝大家
--
╭─────────────────────────────────────╮
│ 這篇文章讓你覺得?
▲▲▲ *╮ ╭* ◣▲◢ ╭● │
│
╯╰┤ >_< 崮rz─┼─ 莔rz╯╰┤ 益rz﹀▲﹀ 卣rz◢██◣ │
│
囧rz □ │▲XDrz╰╯│▲ □ ▲ □ │▲ ◥皿 ◤▲ ╱╲ █ │
│
◤ ◤ ◤ ◤ ◤ ◤ ◤◤ ◤ ◤ ◥██◤▲ │
╰────────────────by cAshoNly─────────
◤ ◤ ─╯
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.64.92.33
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1488426088.A.F1B.html
1F:→ f496328mm: 有確定你的 lag length 是 1 嗎? 03/02 12:11
2F:→ f496328mm: 喔喔 你假設是1 03/02 12:12
我想應該是要藉由訓練資料
然後透過某些式子來求得α、ψ跟θ對吧? 就是這個步驟不理解OTL
※ 編輯: purpleboy01 (203.64.92.33), 03/02/2017 13:44:05
3F:→ f496328mm: 訓練資料這些 有很多現成套件讓你跑 03/02 15:41
4F:→ f496328mm: 都會附上PAPER 加減看看 03/02 15:41
5F:→ f496328mm: 至於lag length部分 有很多檢定可以做 03/02 15:41
6F:→ f496328mm: 你有DATA就不用假設了 直接做個table 多個檢定比較 03/02 15:42
7F:→ f496328mm: 我之前做system equation的參數估計 用 mle+sur model 03/02 15:42
8F:→ f496328mm: 最簡單你用迴歸就可以做了 只是結果很爛而已 03/02 15:43
9F:→ f496328mm: ML的方法 找不太到參數 03/02 15:43
10F:→ f496328mm: 我之前做過比較簡單的lag length部分 03/02 15:47
11F:→ f496328mm: 你就 Yt-k 做很多期 看前面參數顯不顯著 03/02 15:47
謝謝回答!!
雖然我還是不太理解:P
我現在是先學習OLS跟MLE在多元回歸的部分
想說跟ARIMA模型某些程度上有點類似(嗎)
※ 編輯: purpleboy01 (203.64.92.33), 03/03/2017 16:31:35
12F:→ f496328mm: 我目前擔任經濟系教授的研究助理 03/03 20:38
13F:→ f496328mm: 所以有做一些這方面的東西 03/03 20:38
14F:→ f496328mm: 我們是參考一些paper 經濟系很擅長找equation 03/03 20:39
15F:→ f496328mm: 之後就是參數估計的事了 看用什麼方法 03/03 20:40
16F:→ f496328mm: system equation就是 你一次有兩條以上的equation 03/03 20:40
17F:→ f496328mm: 彼此有關係 不能只用OLS去單獨估計其中一條 03/03 20:41
18F:→ f496328mm: AR模型 除非你有已知equation 不然要找lag length 03/03 20:42
19F:→ f496328mm: 這樣才知道 你OLS估計的式子要放幾個Yt-k 03/03 20:43
20F:→ f496328mm: 不知道你是不是經濟系的哈哈 03/03 20:43
我是電子所的XD'
主要是做機器學習或生物資訊方面
之前是用SVR做旅遊人數的序列
因為比較的對象包含ARIMA
老師要我去把它搞懂 之後也許往ARIMA+機器學習的方向應用在序列預測上
所以對於一些估計檢定等等並不熟
像是步驟前面的ACF/PACF跟後面的AIC/BIC因為知道要帶什麼進去算還行
解迴歸係數就無法了TT
※ 編輯: purpleboy01 (101.9.199.244), 03/03/2017 23:06:34
21F:→ celestialgod: 解係數就MLE去解而已,找本時序書應該都有推吧 03/04 00:14
謝謝! 我來研究看看
手邊的書跟資料多少都有提到MLE 但是大部分就是提到OTL
※ 編輯: purpleboy01 (101.9.199.244), 03/04/2017 00:18:57
23F:→ celestialgod: 其中|ψ|<1是保證Yt是stationary 03/04 00:19
24F:→ celestialgod: OTL?? 可以給我全名嗎 03/04 00:20
抱歉他只是比較大的Orz XD'
※ 編輯: purpleboy01 (101.9.199.244), 03/04/2017 00:22:50
25F:推 f496328mm: 我好像有印象你在R問過? 03/04 00:26
沒有耶我沒有去R語言板
26F:→ f496328mm: 機器學習就不用作時間序列拉 03/04 00:26
27F:→ f496328mm: 我之前是作 銷售量預測 銷售量也是時間序列 03/04 00:27
28F:→ celestialgod: 為什麼樓上那麼斷定 機器學習不用做 時間序列= = 03/04 00:27
29F:→ f496328mm: 一樣直接用ML 不用傳統的AR MODEL 03/04 00:27
30F:→ f496328mm: 阿 不是不用做 是直接用ML就好 ar比較難 03/04 00:28
31F:→ celestialgod: ARIMA的估計最後還是回到OLS,OLS也是ML的方法阿= = 03/04 00:29
32F:→ celestialgod: 廣義上來講,ARIMA也在ML的範圍... 03/04 00:29
我用SVR也是直接輸入整理好餵進去
只是因為比較對象有ARIMA(SARIMA)所以老師要我了解清楚
了解清楚就是要用手動算過他的每個步驟這樣~
※ 編輯: purpleboy01 (101.9.199.244), 03/04/2017 00:31:58
33F:→ f496328mm: 但是ML 不是比較沒辦法處理時間序列嗎? 03/04 00:31
34F:→ celestialgod: 基本上ARIMA也是從資料去learn規律~~ 03/04 00:31
35F:→ celestialgod: 你把機器學習這個名詞定義的太狹隘了QQ 03/04 00:31
36F:→ celestialgod: ML也不是比較沒辦法處理時間序列... 03/04 00:32
37F:→ f496328mm: 我知道ML 裡面也是很多回歸拉 03/04 00:32
38F:→ celestialgod: 只是有時候忽略掉時間因素去做learning,不過還是要 03/04 00:33
39F:→ celestialgod: 看使用的模型 03/04 00:33
40F:→ f496328mm: ML做時間序列 是不是要先把資料調整 讓它平行化? 03/04 00:34
41F:→ f496328mm: 我之前有去問過一些講師 03/04 00:35
42F:→ celestialgod: 平行化?? 我不太知道你在講什麼Orz 03/04 00:35
43F:→ f496328mm: 有些長期資料 畫起來會有越來越高/低 的傾向 03/04 00:36
44F:→ celestialgod: 跑題了,原PO基本上手算係數是有點困難的... 03/04 00:36
45F:→ celestialgod: 我自己統計系所修的時間序列分析,都沒有手算過XD 03/04 00:36
46F:→ f496328mm: 就是讓減少時間的影響 03/04 00:36
47F:→ celestialgod: 那跟時間序列有什麼關係= =? 03/04 00:37
48F:→ celestialgod: ARIMA就是要把時間因素考慮進去阿 03/04 00:37
49F:→ f496328mm: ar可以幫你判斷lag length 不過也可以用其他檢定去找 03/04 00:37
50F:→ celestialgod: AR不能幫你判斷lag length Orz 03/04 00:38
51F:→ celestialgod: 基本上ARIMA的 p,d,q通常都用ACF跟PACF去看 03/04 00:39
52F:→ celestialgod: 然後搭配一些適當的檢定做為輔助 03/04 00:40
53F:→ celestialgod: 最差的做法就是fit多個ARIMA,去檢驗fitness 03/04 00:40
54F:→ f496328mm: ADF test? 03/04 00:40
55F:→ f496328mm: unit root test? 不過這很多種 03/04 00:41
56F:→ purpleboy01: 我看參數估計的部分也是覺得手算好像不是個實際做法w 03/04 00:41
57F:→ celestialgod: 原PO,基本上手算是不太實際的 03/04 00:42
58F:→ purpleboy01: 我打算先跟老師說這個部分用軟體帶過 03/04 00:42
59F:→ purpleboy01: 不過他其實也不太清楚 所以應不是個問題XD 03/04 00:42
60F:→ celestialgod: 能夠理解PACF跟係數之間的關係就OK了 03/04 00:44
61F:→ celestialgod: 真要手算可以試試看自己用三筆資料去疊帶看看AR(1) 03/04 00:46
62F:→ celestialgod: AR(1)要解的參數就三個 mean, noise標準差跟 03/04 00:47
63F:→ celestialgod: yt與y_{t-1}的係數 03/04 00:47
64F:→ purpleboy01: 如果單純只靠ACF和PACF判斷 是不是就是看圖然後把可 03/04 00:50
65F:→ purpleboy01: 能的p d q列出來然後看係數的估計值跟標準差 03/04 00:51
66F:→ purpleboy01: 再決定後續 03/04 00:51