作者SangoDragon (SANGO)
看板R_Language
標題[問題] R語言在Data mining 的應用
時間Fri Mar 4 10:02:03 2016
本人之前都是用 SQL + Mining tools (例如MS-SQL Analysis service , SPSS Modeler)
之前大部分是用 SQL 整理資料
之後再用 mining Tools run mining (包含調參數等等)
例如我們做一個羅吉斯回歸,去預測信用卡客戶是否會變呆卡
或用 CART 去做回應率分析
現在關於 R 我有一些問題:
1. R的mining 函數支援到那些演算法?
例如:分群,類神經網路,CART 等等?
2. R有辦法調參數嗎?
例如分群時分幾群,CART的切點,等等 (這部分在mining tools 都有很強的支援)
3. R怎樣做Mining前的資料處理?
SQL 強的地方在於下語法可以做很多資料預處理
例如:資料中只有生日要轉換成年齡,還有一些更複雜要套公式轉換的部份等等
SQL 的資料可以存很多資料
R 在預處理部分的強度如何?
總不能一直讀EXCEL的資料吧?
我要表達的是,在資料面SQL 資料庫有很強大的SQL語法,跟儲存面
R 的方式?
4. 這張圖
http://i.imgur.com/iMTOAoG.jpg
是否過譽?
以MS-SQL mining 而言,建構好一個預測模型,可以利用MDX等等
去對這個Model 做一些處理,例如輸入資料做預測等等
而且也有很多圖形介面的輸出
以上幾點問題
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.214.99.52
※ 文章網址: https://webptt.com/m.aspx?n=bbs/R_Language/M.1457056925.A.0B5.html
※ 編輯: SangoDragon (49.214.99.52), 03/04/2016 10:03:16
1F:推 JackBaska: R絕對可以,但前提是有coding 的 sense 03/04 15:02
2F:→ JackBaska: R是很強物件導向的weak type語言 03/04 15:06
3F:→ obarisk: r的物件導向真心不推... 03/04 18:59
4F:推 JX660: 個人用過R SAS SPSS 比較圖中六項 R毫無疑問是完勝 03/04 23:34
5F:→ JX660: 阿不是六項 是八項 不過SAS SPSS有其他方面的好處就是了 03/04 23:39
6F:推 JackBaska: o大 雖然R寫物件很麻煩,但他基礎型態是以物件式管理的 03/04 23:51
7F:→ JackBaska: 所以相對很多問題變很好解 03/04 23:52
8F:→ celestialgod: 我覺得R6用物件導向就還可以 03/05 00:34
9F:→ clickhere: 2/29 R 剛剛滿 8000 個 packages...這圖要更新了 03/05 09:43
10F:→ clickhere: 這還不含 BioC 和 archived 的 packages. 03/05 09:44
11F:→ clickhere: R的基礎型態不是以物件式管理的... 03/05 09:47
12F:推 JackBaska: ???我之前看原文網站有強調所有資料都是一個物件 ??? 03/05 09:52
13F:→ JackBaska: 我一開始用的時候覺得他資料有些部分默認的方式很像 03/05 09:52
14F:→ JackBaska: 物件 , 後來看到網站寫那段 03/05 09:52
15F:推 JackBaska: 原網站我要再找一下,不過當時是主要查詢class用法,然後 03/05 09:55
16F:→ JackBaska: 系列文章有從物件切入,然後有一段直接寫,實質上所有 03/05 09:55
17F:→ JackBaska: 元素都是物件,然後再開始介紹怎麼去自己另外寫一個物件 03/05 09:56
18F:推 JackBaska: 會需要另外寫主要是我有需求開發特殊物件 03/05 09:58
19F:→ andrew43: 物件式管理和它是不是物件應該不是同義的。 03/05 18:31
20F:推 JackBaska: 感謝A大,能否多分享一點相關資訊?我最近還在研究,想問 03/05 21:50
21F:→ JackBaska: 有經驗的人的人一些比較詳細的知識 03/05 21:51
22F:→ andrew43: 我不是專家。R確實讓所有的型態都是物件,但它和主流的 03/05 22:45
23F:→ andrew43: 物件導向語言的特色還是差距不少。 03/05 22:47
24F:→ andrew43: 在主流的S3和S4,繼承、多型、封裝都有點半調子。 03/05 22:48
25F:→ celestialgod: reference也是,可以考慮R6吧 03/05 22:50
26F:→ andrew43: 前面c大提到的R6有很大的進展,它至少把最基本物件導向 03/05 22:50
27F:→ andrew43: 該有的特徵都有了。很物件導向的朋友可以研究R6下去。 03/05 22:52
28F:→ andrew43: 又例如S3或S4連私有成員都沒有,實在很不「物件導向」。 03/05 22:55
29F:→ clickhere: 繼承、多型、封裝都是在S3/S4之後才逐漸成形的. 03/06 09:17
30F:→ clickhere: 光能用在函數和變數中用"."就夠C++和java使用者頭痛了 03/06 09:19
31F:→ clickhere: 就甭說管理或導向了...S3/4當年可是很先進的咧. 03/06 09:21
32F:→ andrew43: 謝謝補充這段歷史先後順序。 03/06 12:05
33F:→ obarisk: 學完s4,換rc,現在是r6 03/07 19:21