WEB批踢踢

看板Statistics

標題[整理] 對於統計量與充份性

發信站無名小站 (Wed Aug 9 13:43:20 2006)

轉信站ptt!Group.NCTU!grouppost!Group.NCTU!wretch

[最後整理如下]希望不僅能幫到我也能幫到正在學習的人首先我們先假設資料集是一組來自機率空間中的未知母體P, 記做X(隨機向量).T(X)為X的可測函數,稱之為統計量, 當X的值已知則就可以知道T(X)的值,也就是說T為一個已知的函數,統計分析是對於不同的目的建立不同的統計量, 顯而易見的X本身就是一個統計量,而統計量T(X)的值域通常比X的值域簡單, 舉例來說,X為一個n維的隨機向量,T(X)可能為一p維的隨機向量,且p<n.這是因為希望透過T(X)來簡化原始資料.這只是一個例子, 一般而言統計量並不一定有維度濃縮的現象. 雖然,確實我們希望能儘量濃縮. 從機率的觀點來看,在T(X)中關於X的未知分布的"資訊"被包含在σ(T(X))中.為了了解這點,假設S為其他的統計量,且 σ(S(X))=σ(T(X)),由上述假設可證明出S為T的可測函數, 而T也為S的可測函數.也就是在 σ(S(X))=σ(T(X)),統計量 S 與 T 是等價的 (equivalent).當已知S或T任一個統計量的值,則另一個的值就可以知道. 因此,包含群體訊息的是統計量決定的 σ-field 而非統計量的值;但統計量的值在其他理由上可能是重要的(如點估計). 也就是說: 如果目的在分辨群體特性 (如檢定、辨別、分類), 所需耍的不是統計量的值,而是它所決定的σ-field. 例如在群體標準差已知情況下, 做常態群體平均數檢定, X-bar, Z 與 p-value 都是一樣的回過來看, 注意到σ(T(X))被包含於σ(X),且σ(T(X))=σ(X) 若且為若 T為1-1. 討論使用統計量T(X)來縮短σ(X),我們會要求這樣的縮短結果對於未知母體不失去任何資訊.假如統計量T(X)所包含的所有資訊與原始資料相同的話則統計分析可以使用較X簡單的T(X)上. 接下來描述什麼叫做包含"所有資訊"與原始資料相同假設X為來自分布族P={P_θ:θ屬於Θ}中的某個分布,統計量 T(X)稱之為θ或P的充份統計量,若且為若X給定T=t的條件分布與θ或P無關. T(X)是θ的充份統計量可視為:"在某種意義下T(X)包括了X所含有關θ的全部訊息",以下則明確地說明上述這件事: 假設研究者執行一隨機實驗的到資料X,但研究者卻只報告了T(X) 的結果而把原始資料X丟掉了.研究者可以透過隨機生成的方式, 產生一組觀測值X'(在T(X)=t給定的情況之下)其分布於X給定t的分布相同,可以證明對所有的A, P_θ(X'屬於A)=P_θ(X屬於A), 也就是說只需要透過T的了解,經由這樣的方式所得到的X'和X具有相同的分布,並且所包括對於θ的訊息也相同. 因此在這樣的意義下T(X)包括了X所含有關θ的全部訊息. 在建構X'中,我們需要透過一個獨立的(與θ無關)的隨機生成的方式產生,因此一個決策δ(X')不僅與T有關也與隨機生成的方式有關.所以可以知道δ(X')並非一個非隨機的決策規則,而是隨機決策規則.對於任何建立在X上的決策規則,是可以建構一個建立在X'上的決策規則(為一隨機決策規則僅與T有關),且兩個決策規則的風險是一樣的(對於所有的θ屬於Θ下).因此倘若隨機決策規則是可接受的,則可不失一般性的限制考慮在充分統計量上. 關於 randomized decision rule (decision function). 大概書上用的符號意義是 δ(X)(‧). δ(‧) 將每一個樣本點 X=x 映至行動空間上的一個機率分布 δ(x)(‧) 即:對每一 x, δ(x) 是行動空間上的一個機率分布. 因此,δ1(t)(A) = E[δ0(X)(A) | T=t] 是 δ0(x)(A), x in T(x)=t 上的平均. δ0(x)(A) 是 X=x 時 δ0 選擇 action 在 A 的機率, δ1(t)(A) 是 T(X)=t 時 δ1 的 action 在 A 的機率. 注意因 δ0 即使非隨機, T=t 時的不同 x, δ0(x) 對應不同 action,因此 δ1 仍是隨機的; 除非 δ0 本身是 T 的函數, 這意謂 T=t 之下 δ0 是 constant (與 t 有關), 故 δ1(T(X))=δ0(X) with probability one. 令 Z 表示 δ0 額外的隨機化程序, 以 δ*(X,Z) 表示其 outcome. 則 R(θ,δ0) = E[E[L(δ*(X,Z),θ)|X]] = E{E[E[L(δ*(X,Z),θ)|X]|T]} 因 T 被假設是充分的. 給定 T 時 δ0 的條件平均損失, 依定義是實際損失 L(δ*(X,Z),θ) 先固定 X 之下,對做成不同 action 的機率做平均, 然後再對固定 T(x)=t 之下不同 x 的相對 likelihood 做平均. 這應等於 T=t 之下不同 x 對應之 Z 的分布做成一個 "平均" 的機率分布, 而實際損失則對這個 "平均的分布" 求平均. 即 E[E[L(δ*(X,Z),θ)|X]|T] = E[L(δ"(T,Z*),θ)|T] 其中 δ"(t,Z*) 是 T=t 時 δ1(t)(．) 的 outcome. (這一段解釋起來有點費事,需細心體會.) 又依定義 R(θ,δ1) = E[E[L(δ"(T,Z*),θ)|T]] 故 R(θ,δ0) = R(θ,δ1). 這也相當於說: 任何基於 X 的決策函數, 可視為 randomized decison function based on a sufficient statistic T. 但這樣所得到的隨機決策是可要被決策者接受的若不被接受的話, 則只有在非隨機決策函數δ0(X)=h(T(X)) 才有可能得到一個 nonrandomized decison function based on a sufficient statistic T, 且兩者風險等價. (有做跟沒做一樣) 而Bao-Blackwell的結果告訴我們,在convex loss下我們僅需要考慮非隨機決策規則,且在strictly convex下,決策規則若非T的函數,則為inadmissible. -- 夫兵者不祥之器物或惡之故有道者不處君子居則貴左用兵則貴右兵者不祥之器非君子之器不得已而用之恬淡為上勝而不美而美之者是樂殺人夫樂殺人者則不可得志於天下矣吉事尚左凶事尚右偏將軍居左上將軍居右言以喪禮處之殺人之眾以哀悲泣之戰勝以喪禮處之道常無名樸雖小天下莫能臣侯王若能守之萬物將自賓天地相合以降甘露民莫之令而自均始制有名名亦既有夫亦將知止知 220-133-64-250.HINET-IP.hinet.net海

1^F：推 wwwwwww:這不是肯德基 08/12 12:26

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

Statistics 板

熱門看板

贊助商連結

熱門看板

贊助商連結