作者NoodlesFSA (Noodles)
看板CFAiafeFSA
標題[心得] SOA-PA考試心得
時間Sun Jun 16 04:01:27 2019
剛考完Jun, 2019的Predictive Analytics (PA) (預測分析),
趁著記憶猶新來分享一些考試心得。
1. 考試介紹:
PA是SOA 2018年改革後完全新增的科目,
考試時間5小時15分鐘,
考試要求使用R進行商業個案的資料分析,
並同時撰寫一份報告。
在考PA之前,需要先通過SRM、或者舊有VEE-Applied Statistics才能報名。
報名後,SOA會開通線上學習模組 (e-Learning Module),
並且開通後11個月內可以報名PA的考試。
也就是說,可以選擇報名未來一年內兩次考試的其中一次 (6月或12月),
但只能報名一次!!! (劃重點) 考第二次PA的話是原價!!!
等於Module是送的,只要考一次就要付一次完整的價錢。
2. 準備資料:(依主觀認為的重要程度排序)
- e-Learning Module
- May, 2019公佈的Hospital Readmissions Sample
- Dec, 2018考古題
- An Introduction to Statistical Learning, with Applications in R (2013)
- R for Everyone (2017)
- 其它Syllabus提及的資料
簡單來說,e-Learning Module給了一個全盤概覽,
明確SOA希望考生掌握的知識點,
並以類似投影片一張一張的方式詳述整個PA的來龍去脈。
不過如果各位像我一樣不容易在投影片中抓重點的話,
那就可以搭配An Introduction to Statistical Learning, with Applications in R以及R for Everyone兩本原文書相對應的章節一起看。
此外,An Introduction to Statistical Learning, with Applications in R每個章節後面的Code寫的很棒,
如果時間充裕也建議一起看。
考題部分,Module以及Syllabus中提供共約4、5份的Sample,
其中我優先看May, 2019 Hospital與Dec, 2018真題。
因為May, 2019 Hospital跟真實考試的框架最像 (逐個Task問答模式)、
Dec, 2018則是唯一一份的考古題,答案中寫了很多SOA希望考生回答到的點。
整體準備時間花了8週 (四月中才把PA打開),
但事後來看,對沒基礎的人,將時間拉長到16週會比較適當。
3. e-Learning Module介紹:
開通後共會出現9個Modules,分述如下:
(註:以下的重要性是 ”對於備考PA” 的重要性)
Module 1: 預測分析會用到的工具 (重要性:中)
- 如何安裝R與RStudio
- 基本的R指令
- 寫R代碼的風格
Module 2: 定義商業問題 (重要性:低)
- 如何將模糊、敘述性的商業問題轉換為可以用統計、預測分析來解決的問題
Module 3: 數據視覺化 (重要性:中)
- 如何用ggplot2畫圖
Module 4: 數據型態與數據探勘 (重要性:中)
- 數據的各種型態
- 如何處理missing value
- univariate, bivariate的數據探勘
Module 5: 數據清洗 (重要性:中)
- 識別outlier
- 如何處理數據的非線性關係
- 數據使用的規範
Module 6: 廣義線性模型 (重要性:高)
- 線性模型與廣義線性模型
- 解釋結果與選擇最適合的模型
- 正規化法 (Ridge, Lasso, Elastic Net) 控制回歸
- 偏差和變異之權衡 (Bias-Variance Tradeoff)
Module 7: 決策樹 (重要性:高)
- 回歸樹與分類樹
- bagging, random forest, boosting增加精確度
- 調整參數 (Hyperparameter tuning)
Module 8: 集群分析與主成份分析 (重要性:高)
- 主成份分析
- k-means集群分析
- 階層集群分析 (hierarchical clustering)
Module 9: 報告的溝通與傳達 (重要性:高)
- 如何以有效率且適當的組織架構來撰寫報告
4. 考場實戰:
這次PA的主題是預測交通工具事故的分值高低 (高分代表該事故嚴重、頻率高)。
題目給了大概十多個變量,包含一天的時段、天氣、路的特徵 (十字路口、高速公路)、路面材質…等。
跟Dec, 2018最大的不同是以前不給太多指引,過去整份報告是由考生自己發揮。
但我猜SOA評卷者因為看到了太多種答題形式、且很不容易抓到給分的點,
因此這次改用一個一個Task問答的方式,
明確告訴考生Step 1該做什麼、Step 2該做什麼……。
整體而言對於考生是相對容易的。
前面10個task每一步都有關連,一個步驟一個步驟做下來,
畫了很多圖找relationship,
用到了GLM、PCA、Ridge Lasso Regularized Regression,
並於最後一個task寫Executive Summary。
相似度部分,我覺得跟Hospital Readmission框架算蠻像的,
R Code量給的也很充足,只要根據自己選擇的變量狀況改寫一些部分。
最大的難點我認為有兩個:整體時間掌握與寫到SOA要的點。
5小時15分鐘寫11道題,相當於每30分鐘就要做完一題,
亦即,30分鐘內要讀該題 + 寫該題的Code + 寫該題的Report,重複這件事情11次。
(考試期間可以去洗手間,但是時間不會因此而暫停)
另外對於母語非英文的考生,在限制的時間內寫出精煉扼要的報告也是一大挑戰!
考試環境方面,鍵盤會鎖住使用Alt + Tab來切換視窗,
因此如果跟我一樣是個快捷鍵重度使用者,建議先看Syllabus上SOA把哪些快捷鍵禁止掉。
此外,聽過一些考友反映考場的鍵盤不是很好打、電腦跑R非常卡 ,
這些問題我自己沒有遇到,但建議如果可以,還是盡量選大城市的考場,
機器設備上會比較沒有疑慮。
畢竟這科金額那麼高、總不會希望出現非預期的狀況。
最後,向每一位連續考5個多小時考試的戰友致敬,
也感激主管讓我請很長的考試假、
感謝同事兼戰友們在群組無私的分享、週末約唸書督促進度,
希望大家都能一次通過!
-----
Sent from JPTT on my iPhone
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 202.175.174.98 (澳門)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/CFAiafeFSA/M.1560628889.A.549.html
1F:推 etshcoav: 推用心分享 06/16 12:08
2F:推 lonlyman0813: 推 06/16 21:43
3F:推 fday: 感謝分享 06/17 22:14
4F:推 c10121: 推 06/21 10:12
5F:推 callTM: 所以硬嗎? 06/21 23:52
難度中上,不過還是等成績出來比較好判斷
※ 編輯: NoodlesFSA (37.139.1.68 荷蘭), 06/22/2019 00:14:45
6F:推 love113w: 謝謝心得 06/22 09:51