Statistics 板


LINE

感謝之前板友的幫助,讓我可以順利解讀與建立多項式迴歸模型! 但我又遇到新問題了,想再諮詢一下各位的專業意見>"< 目的:篩選變數尋找表現較好的模型 前提背景:建立full model後,以顯著與否、加入變數前後R^2的變化來做變數篩選標準 以此標準建立模型之後,在解讀時發現問題 1. 其中有個連續型變數,係數=0.00040673,p<0.05,OR=1 (實際為1.000406812) google得知 OR=1 表示此變數對疾病的發生不起作用 套用在我的模型情境中,推測是表示此變數對選擇購買哪種商品沒有影響 我不太懂的地方是,OR=1 但卻顯著,這是在"統計上",此變數真的沒有影響的意思? 連續型變數解釋成【若變數增加一單位,相較於reference group,選擇此商品的可能 性會增加或減少xxx倍】 OR這麼接近1,依舊可以這樣解釋嗎?還是會直接解釋成此變數無影響? 2. 透過estimate coefficient,手動計算了每個變數的relative importance 發現有一個變數,雖然不顯著,但relative importance卻是所有變數中第一高 (56%) 這應該如何解釋呢? 不知道是否該把此變數拿掉,才能較好了解剩下的變數的相對重要性? 3. 發生上述兩種情況,這兩個變數通常會怎麼處理呢?會拿掉還是繼續保留? 若有需要其他資訊,提醒後我會盡速補上!先感謝各位的幫助:) 備註:relative importance的計算參考 https://goo.gl/rJqBkY 第四頁的Exhibit9.1 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.240.104.195
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1498305524.A.009.html
1F:推 andrew43: 顯著性與效果量不是同一件事。有信心說嫌犯是有罪與罪 06/24 21:21
2F:→ andrew43: 有多重是不同的。 06/24 21:21
3F:推 imaltar: 你看一下OR的信賴區間有沒有包含1 06/24 21:21
4F:推 andrew43: 注意到例子之中計算的相對貢獻僅適用於因子,且沒有權 06/24 21:30
5F:→ andrew43: 衡因子內的水準數。 06/24 21:30
感謝回覆! to andrew43 你說的效果量effect size指的是OR嗎?對你舉的犯罪的例子好像有點感覺! 試著對應過來,意思是雖然有信心說此變數對購買哪種商品有影響,但影響程度不大? ...糟糕,解讀完覺得哪裡怪怪的,為什麼可以說有影響,又說影響不大啊? 這樣有信心的影響是什麼@@ 權衡水準數的意思是?沒有權衡的話會造成問題嗎? 你這樣一提醒我才發現,我這個重要性很高的變數是連續變數! 沒有找到有計算連續變數的例子,不知道是否也可以這樣計算? 如果不行的話,這樣撇除掉連續變數,只算其他的是不是會有點問題呢 因為連續變數也在這個模型中,多少會影響到其他變數的係數吧 to imaltar OR的信賴區間雖然很小[1.00006, 1.000767],但沒有包含1 我注意到另一個不顯著的變數,雖然OR=1,但信賴區間有橫跨1 所以這樣是指,這個變數(顯著的那個)還是有影響力,只是影響力超級小 增加一單位,機率只會增加0.006倍的意思嗎? ※ 編輯: shirley7483 (111.240.104.195), 06/24/2017 22:13:31
6F:→ andrew43: 「信心」是指推翻H0而言,但這不僅包括效果量的關係。 06/24 22:55
7F:→ andrew43: 例如,當樣本數極大時,你仍有信心推翻一個效果很小的 06/24 22:56
8F:→ andrew43: 偽H0。 06/24 22:56
9F:→ andrew43: 例如 binom.test(table(rbinom(100000,1,0.49))) 的情況 06/24 22:57
10F:→ andrew43: 一個因子之內有幾類就是我說的水準數。 06/24 22:59
11F:→ andrew43: 例如,一個因子叫身高,分成二類(高、低)和分成二十類 06/24 22:59
12F:→ andrew43: 自然有不同的解釋力。 06/24 23:00
13F:→ andrew43: 我覺得你需要找更適合你情況的相對重要性算法。 06/24 23:02
14F:→ andrew43: 我只知道一般線模很多算法也容易算,但廣線模就不了解了 06/24 23:03
15F:推 Rhomboid: OR接近1是因為單位 比方說薪資增加1元 滿意度增加0.0001 06/24 23:47
16F:→ Rhomboid: 但如果用萬元當單位 薪資每增加1萬元 滿意度可能增加1.2 06/24 23:47
17F:推 andrew43: 我漏看是連續變數,確實單位也是重點。 06/25 01:37
18F:→ andrew43: 腦子自動帶入更早之前討論的案例了… 06/25 01:39
能夠理解水準數不同會造成的影響! 在水準數多、各個係數最大值與最小值差距大的情況下,照此算法,重要性會被膨脹很多 查詢其他的相對重要性算法,發現同時衡量連續與類別變數的資料好少..... 找到一個方法是計算各個變數的卡方值,再加總計算百分比 (理解為做單一變數的迴歸,使用LRT的卡方值計算,不確定有無理解錯誤) 除了andrew43提到的水準數的問題之外,若是採用這個方法還會有其他疑慮嗎? 若有人知道其他算法,再拜託分享一下關鍵字讓我可以進一步查詢>"< 參考來源:https://goo.gl/jcQKq9 感謝Rhomboid提醒,之前都沒有注意到單位! 另外發現此連續變數中間有一大段間隔,想請問這個是否也是造成OR接近1的原因呢? ex.價錢ranage從10~1000,但分布是10~100、500~1000,沒有100~500的樣本 ※ 編輯: shirley7483 (111.240.93.111), 06/25/2017 12:59:56
19F:推 Rhomboid: 如果該變數分佈的很不均 考慮把他變成binary variable 06/25 13:53
20F:→ Rhomboid: 嗎? 06/25 13:53







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Gossiping站內搜尋

TOP