NCTU-STAT99G 板


LINE

恭喜開版成功, 為慶祝順利開版, 第一次作業的繳交時間延長3天. 改為7月18日中午12:00以前繳交完成. Homework#1: Due: July 18, 2010 (Thursday) 12:00以前 (逾時三日內可補交,但會扣分;逾時超過 三日將不再接受繳交) Note: 於截止時間前將寫好之程式(H1P1代表第一次作業第一題,依述類推) 以及程式使 用說明的文字檔,以電子檔傳至闕棟鴻信箱[email protected], E-mail標題為 統計計算語言作業一(u9126802闕棟鴻),也要求讀取回條,以確定老師有收到信件。 1). 試利用R語言,撰寫一個程式,在給予一個資料庫檔案以及一個目標檔案後, 可以將在資料庫檔案中有在目標檔案出現過的變數篩選出來,並將該列的數據輸出, 對於在資料庫檔案中有重覆出現的變數,請再使用一個參數p,讓p=All, 代表將有在資料庫檔案中重覆的變數直接顯現,p=Mean,代表以平均數來代表重覆的 變數,p=Median,代表以中位數來代表重覆的變數,並計算該程式執行所需之時間。 請參考下列例子。(40%) [Hint: Possible used function: is.element, data.matrix, read.table] (資料庫檔案) Exp1 Exp2 Gene1 1 3 Gene3 3 6 Gene5 8 8 Gene3 4 2 Gene8 2 1 Gene3 2 1 Gene4 7 5 (目標檔案) Gene1 Gene3 Gene4 P=All則輸出 Exp1 Exp2 Gene1 1 3 Gene3 3 6 Gene3 4 2 Gene3 2 1 Gene4 7 5 P=Mean則輸出 Exp1 Exp2 Gene1 1 3 Gene3 3 3 Gene4 7 5 P=Median則輸出 Exp1 Exp2 Gene1 1 3 Gene3 3 2 Gene4 7 5 2) 在Machine Learning中,我們常會遇到的資料型態是一群Attributes(在統計常稱 為independent variables),以及一個有興趣分類的class level(在統計中常稱為 dependent variable),如在iris的資料中,Species即為class level而Sepal.Length, Sepal.Width, Petal.Length及Petal.Width即為attributes。試撰寫一程式,在給予此 類型的資料時(最後一行變數為class level,其它行的變數皆為attributes),我們可 以畫出一個2×2的圖表,其每個細圖包含了Scatter plot(different color with different class levels), Boxplot, plot density, histogram(display the number experiments for different class levels)。 同時讓不同的class levels在圖型中用不同的顏色表示。(20%) [Hint: Possible used function: Par(mfrow=c(m,n)), plot, boxplot, density, hist] 3) 給予一個上述的資料格式,試撰寫一個程式,同時利用RWeka裡的classification 方法,包含J48 classifiers (J48), naive Bayesian classifiers (NB), k-nearest neighbors classifiers (IBk), classifiers, Support vector clssifiers (SMO), Logistic regression classifiers (Logistic)等分類法去進行 分類,並輸出包含Accuracy, Precision, Recall and F-measure等資料。同時整理 成一個表格。分別以Training data set 以及Leave one out cross validation 的方法去分析。(40%) [Hint: Possible used function: factor, J48, NB, IBk, SMO, Logistic, Weka_control] (Package: RWeka) Useful link: http://cran.r-project.org/web/packages/RWeka/RWeka.pdf http://www-users.cs.umn.edu/~kumar/dmbook/index.php#item4 (注意:作業請務必繳交,否則將以0分計算,如無法順利完成,可先針對固定資料進行 分析。例如在題目一中的資料庫檔案(excel中5000筆資料)或是上述例子(7筆資料) 分析,以及在題目二及題目三可以只針對iris的資料進行分析。) ps.對了,最後祝大家暑假修課愉快喔~~~ -- --



※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.114.208 ※ 編輯: micropath 來自: 140.113.114.208 (07/09 11:36)
1F:推 ww770829:這是老師嗎QQ 07/09 21:09







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:BabyMother站內搜尋

TOP