Re: [統計] 相關係數的問題

時間Sun Oct 23 13:05:38 2005

根據yhliu版友的建議我嘗試了下面三種方式來定義"取樣方式的好壞" 假設母體是以某種f分佈所產生的數值，可用 random generator 產生一組例子為： 1.5, 3.5, 4.5, 5.5, 5.7, 6.5, 6.8, 7.3, 7.9, 9.1 (共10組) 現在假設有某種取樣方法A：取得的樣本為： 1.5, 5.7, 6.8, 7.3, 9.1 (共五組) 則下面我使用三種方式來定義"取樣方式A的好壞" (1) 卡方檢定 2 n(q_i-p_i)^2 X = Σ --------------- 其中q_i, p_i 表示取樣或母體落在[i,1+1]的次數 p_i 2 X = n { [(0-1)^2/(1)] + [(0-1)^2/(1)] + [(1-1)^2/(1)] + [(1-2)^2/(2)] + [(1-2)^2/(2)] + [(1-2)^2/(2)] + [(1-1)^2/(1)] } 缺點： 1. 沒有辦法定義出一個適合的區間, 也就是沒辦法說明為何要定義區間為[i,1+1] 2. X^2 不是介於 0~1的數值，沒有一個絕對的上下界 (2) dissimillarity index = Σ|q_i - p_i|/2 其中q_i, p_i 表示取樣或母體落在[i,1+1]的機率 index = |0-1/10|/2 + |0-1/10|/2 + |1/5-1/10|/2 + |1/5-2/10|/2 + |1/5-2/10|/2 + |1/5-2/10|/2 + |1/5-1/10|/2 where 0 <= index <= 1 缺點： 1. 根據定義，dissimillarity index是比較兩筆相同數量的data之間的相異性，所以此處，母體數量=10, 取樣數量=5，實在是不合適用此index (3) K-S 檢定 D = sup|ai-bi|*n^(1/2) 其中 ai是樣本的 empircial distribution function bi是母體的 cdf n 是取樣的數目 sup { |0/5-0/10|, |0/5-0/10|, |0/5-0/10|, |0/5-2/10|, |1/5-3/10|, |2/5-5/10|, |3/5-7/10|, |4/5-9/10|, |4/5-9/10|, |5/5-10/10| } = 1/5 D = (1/5) * \sqrt(5) = 0.4472 查表可以得知右尾機率 = 0.98 = Prob(取樣的分佈是f|H0 is true) (H0:母體跟取樣的分佈相似) 藉由此機率，可以定義出"取樣方式A的好壞" 且此值P 有特性 0 <= P <= 1 以上，是我最近這幾天翻了一些書所得到的結果，所以應該只有KS可以符合我的需求但是 "取樣方式A的好壞" 應該是用 Prob(取樣的近似是f) 來表達比較合理因此我必須另外計算 P(取樣的分佈是f|H0 is false) 的情況. 但是，我該如何計算 Prob(取樣的分佈是f|H0 is false) 的情況呢？ -- Ｅ＝ＭＣ^2 Ｅ：Empathy E：Economic E： ?? Ｍ：Mind　　　　　　　　 M：Multitude　　　　　 M：Multimedia Ｃ：Courtesy　　　　 C：Communication C： ?? --

※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.236.43 ※ 編輯: thomson 來自: 140.113.236.43 (10/23 13:56)

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

Statistics 板

Re: [統計] 相關係數的問題

熱門看板

贊助商連結