看板Statistics
標 題[整理] 對於統計量與充份性
發信站無名小站 (Wed Aug 9 13:43:20 2006)
轉信站ptt!Group.NCTU!grouppost!Group.NCTU!wretch
[最後整理如下]希望不僅能幫到我也能幫到正在學習的人
首先我們先假設資料集是一組來自機率空間中的未知母體P,
記做X(隨機向量).T(X)為X的可測函數,稱之為統計量,
當X的值已知則就可以知道T(X)的值,也就是說T為一個
已知的函數,統計分析是對於不同的目的建立不同的統計量,
顯而易見的X本身就是一個統計量,而統計量T(X)的值域通常
比X的值域簡單,
舉例來說,X為一個n維的隨機向量,T(X)可能為一p維的隨機
向量,且p<n.這是因為希望透過T(X)來簡化原始資料.這只是
一個例子, 一般而言統計量並不一定有維度濃縮的現象.
雖然,確實我們希望能儘量濃縮.
從機率的觀點來看,在T(X)中關於X的未知分布的"資訊"被
包含在σ(T(X))中.為了了解這點,假設S為其他的統計量,且
σ(S(X))=σ(T(X)),由上述假設可證明出S為T的可測函數,
而T也為S的可測函數.也就是在 σ(S(X))=σ(T(X)),統計量
S 與 T 是等價的 (equivalent).當已知S或T任一個統計量
的值,則另一個的值就可以知道.
因此,包含群體訊息的是統計量決定的 σ-field 而非統計
量的值;但統計量的值在其他理由上可能是重要的(如點估計).
也就是說: 如果目的在分辨群體特性 (如檢定、辨別、分類),
所需耍的不是統計量的值,而是它所決定的σ-field.
例如在群體標準差已知情況下, 做常態群體平均數檢定,
X-bar, Z 與 p-value 都是一樣的
回過來看, 注意到σ(T(X))被包含於σ(X),且σ(T(X))=σ(X)
若且為若 T為1-1.
討論使用統計量T(X)來縮短σ(X),我們會要求這樣的縮短結果
對於未知母體不失去任何資訊.假如統計量T(X)所包含的所有
資訊與原始資料相同的話則統計分析可以使用較X簡單的T(X)上.
接下來描述什麼叫做包含"所有資訊"與原始資料相同
假設X為來自分布族P={P_θ:θ屬於Θ}中的某個分布,統計量
T(X)稱之為θ或P的充份統計量,若且為若X給定T=t的條件分布
與θ或P無關.
T(X)是θ的充份統計量可視為:"在某種意義下T(X)包括了X所含
有關θ的全部訊息",以下則明確地說明上述這件事:
假設研究者執行一隨機實驗的到資料X,但研究者卻只報告了T(X)
的結果而把原始資料X丟掉了.研究者可以透過隨機生成的方式,
產生一組觀測值X'(在T(X)=t給定的情況之下)其分布於X給定t的
分布相同,可以證明對所有的A, P_θ(X'屬於A)=P_θ(X屬於A),
也就是說只需要透過T的了解,經由這樣的方式所得到的X'和X具有
相同的分布,並且所包括對於θ的訊息也相同.
因此在這樣的意義下T(X)包括了X所含有關θ的全部訊息.
在建構X'中,我們需要透過一個獨立的(與θ無關)的隨機生成的
方式產生,因此一個決策δ(X')不僅與T有關也與隨機生成的方式
有關.所以可以知道δ(X')並非一個非隨機的決策規則,而是隨機
決策規則.對於任何建立在X上的決策規則,是可以建構一個建立
在X'上的決策規則(為一隨機決策規則僅與T有關),且兩個決策規
則的風險是一樣的(對於所有的θ屬於Θ下).因此倘若隨機決策
規則是可接受的,則可不失一般性的限制考慮在充分統計量上.
關於 randomized decision rule (decision function).
大概書上用的符號意義是 δ(X)(‧).
δ(‧) 將每一個樣本點 X=x 映至行動空間上的
一個機率分布 δ(x)(‧)
即:對每一 x, δ(x) 是行動空間上的一個機率分布.
因此,δ1(t)(A) = E[δ0(X)(A) | T=t]
是 δ0(x)(A), x in T(x)=t 上的平均.
δ0(x)(A) 是 X=x 時 δ0 選擇 action 在 A 的機率,
δ1(t)(A) 是 T(X)=t 時 δ1 的 action 在 A 的機率.
注意因 δ0 即使非隨機, T=t 時的不同 x, δ0(x) 對應
不同 action,因此 δ1 仍是隨機的; 除非 δ0 本身是 T
的函數, 這意謂 T=t 之下 δ0 是 constant (與 t 有關),
故 δ1(T(X))=δ0(X) with probability one.
令 Z 表示 δ0 額外的隨機化程序, 以 δ*(X,Z) 表示其
outcome. 則
R(θ,δ0) = E[E[L(δ*(X,Z),θ)|X]]
= E{E[E[L(δ*(X,Z),θ)|X]|T]}
因 T 被假設是充分的. 給定 T 時 δ0 的條件平均損失,
依定義是實際損失 L(δ*(X,Z),θ) 先固定 X 之下,對做
成不同 action 的機率做平均, 然後再對固定 T(x)=t 之
下不同 x 的相對 likelihood 做平均. 這應等於 T=t 之
下不同 x 對應之 Z 的分布做成一個 "平均" 的機率分布,
而實際損失則對這個 "平均的分布" 求平均. 即
E[E[L(δ*(X,Z),θ)|X]|T] = E[L(δ"(T,Z*),θ)|T]
其中 δ"(t,Z*) 是 T=t 時 δ1(t)(.) 的 outcome.
(這一段解釋起來有點費事,需細心體會.)
又依定義 R(θ,δ1) = E[E[L(δ"(T,Z*),θ)|T]]
故 R(θ,δ0) = R(θ,δ1).
這也相當於說: 任何基於 X 的決策函數, 可視為 randomized
decison function based on a sufficient statistic T.
但這樣所得到的隨機決策是可要被決策者接受的
若不被接受的話, 則只有在非隨機決策函數δ0(X)=h(T(X))
才有可能得到一個 nonrandomized decison function based
on a sufficient statistic T, 且兩者風險等價. (有做跟沒做一樣)
而Bao-Blackwell的結果告訴我們,在convex loss下我們僅需
要考慮非隨機決策規則,且在strictly convex下,決策規則若
非T的函數,則為inadmissible.
--
夫兵者不祥之器物或惡之故有道者不處君子居則貴左用兵則貴右兵者不祥之器非君子
之器不得已而用之恬淡為上勝而不美而美之者是樂殺人夫樂殺人者則不可得志於天下
矣吉事尚左凶事尚右偏將軍居左上將軍居右言以喪禮處之殺人之眾以哀悲泣之戰勝以
喪禮處之道常無名樸雖小天下莫能臣侯王若能守之萬物將自賓天地相合以降甘露民莫
之令而自均始制有名名亦既有夫亦將知止知 220-133-64-250.HINET-IP.hinet.net海
1F:推 wwwwwww:這不是肯德基 08/12 12:26