作者yhliu (老怪物)
看板Math
标题Re: [分析] (实变)连续随机变数定义
时间Sun Jan 19 18:04:33 2020
※ 引述《annboy (BlueGun)》之铭言:
: 为了避免混淆,先定义一些符号:
: (Ω,B,P) : probability space
: Q : the set of all rational numbers
: X:Ω→Q : a random variable
: F:Q→[0,1] : CDF of X
藉这个例子, 我想说的是: 这分布函数是:
在所有有理数点不逢续, 在所有无理数点它是连续的.
要讲清楚这点, 我们把定义写得更清楚些:
X 的值域是 Q, 并且在 Q 上有一个排序
q_1,...,q_n,...
使得我们很清楚 P[X=q_n] = p_n, 并且 Σp_n = 1.
假设所有 p_n 都是正数. 如若不然, 我们改考虑
Q' = {q_n in Q; p_n > 0}
当然, Σp_n 是个收敛的级数.
而 X 的分布函数是 F(x) = Σ_{q_n≦x} p_n.
若 x = q_n, 则 F(x) - F(x-) = p_n.
所以, 对任意 δ>0, F(x)-F(x-δ) ≧ p_n > 0.
所以 F 在此点不连续.
若 x not in Q. 由於 F 必是右连续, 我们要证明 F
在 x 连续, 只需证明它左连续. 也就是说, 对任意
ε>0, 私我们要找到一个 δ>0,使得
F(x) - F(y) < ε, 只要 x-δ < y < x
由於 F 是单调递增, 事实上我们只要证明存在这麽个
δ>0 满足 F(x)-F(x-δ) < ε 即可.
由於 Σp_n 收敛, 存在 N, 使得 Σ_{n>N} p_n < ε.
令 δ>0 且 δ < min{x-q_n; q_n < x, n≦N}
则若 x-δ < q_n < x, 必然 n>N.
故
F(x) - F(x-δ) = Σ_{q_n≦x; q_n>x-δ} p_n
≦ Σ_{n>N} p_n < ε
故 F 在此 x 连续.
这就是离散型随机变数的基本性质:
(1) 其有效值域(具正机率值的点的集合)是可数的.
(2) 其分布函数在此随机变数之有效值域各点不连续;
在有效值域之外各点都连续.
至於连续型随机变数, 单以 "值域含不可数点" 是不够的.
除了以分布函数处处连续为定义之外, 另一等价的定义是:
R 上(假设只考虑实数值随机变数)各点之单点机率皆为 0.
而就一般实数值随机变数而言, 还有混合型——这并不是
只在纯数学上讨论, 而是实际应用上就有, 例如观测资料
时小於 a 的以 a 记, 或大於 b 的以 b 记. 若原本是连
续型的, 如此修整过变成在 a 或 b 有正机率, 所以已不
是连续型了, 而是混合型随机变数.
在实务应用上连续型随机变数常伴随 "机率密度",其分布
函数及一些量(如期望值变异数等)常涉及积分, 这是所谓
绝对连续型. 在比较纯数学讨论上, 则还有一种连续型随
机变数不能用机率密度来表现其机率分布, 称为奇异连续
型. 在有些机率论教本上就会描绘出这样的例子: Cantor
distribution 是一个典型的例子.
※ 引述《znmkhxrw (QQ)》之铭言:
: 总结来说, 给一个随机变数, 其(1) 离散与连续的定义
: (2) 值域可数与否
: (3) 累积分布函数连续与否
: 以上这三个的关系是??
要给予明确定义, 除了用 "值域" 的概念外, 应加上 "机率".
Def.:
一随机变数称离散的(离散型)条件是: 存在 R 的一可数子集
Q = { r_1, r_2, ... } 使 P{Q} = 1;
或等价的: 使 ΣP{r_n} = 1.
所有使 P{r_n} > 0 的点所形成的集合又称为此随机变数之
有效值域, 或称为其 support.
一随机变数为连续的(连续型)其条件是: 对 R 上任一点,
其单点机率 P{x} 均为 0.
连续型随机变数之 support 可定义为 R 上使机率值为 1
之最小闭集合. 另一等价定义是 R 上所有使
P[x-δ < X ≦ x+δ] > 0 for any δ>0
之所有 x 所形成的集合.
依以上定义, 离散型随机变数之有效值域是可数的; 而连续型
随机变数之值域显然不可数(可数集之机率值都是0).
又, 前面已证明了离散型随机变数的分布函数在其有效值域各
点都是不连续, 而在其他处则处处连续.
事实上对任意随机变数 X 而言, P[X=x] = 0 是其分布函数在
x 点连续的充要条件:
P[X=] > 0 则 F(x)-F(x-) = P[X=x] > 0
即代表 F 在 x 左边不连续; 反之, 取 δ_n↓0, 则
P[X=x] = P{∩_n[x-δ_n<x<x]) = lim_n (F(x)-F(x-δ_n))
= F(x) - F(x-)
因此 P[X=x] = 0 表示分布函数 F 在 x 左边连续, 也就是 F
在 x 连续.
又: 连续型随机变数之 support 两种定义等价. 因若 A 是机
率 1 之最小闭集, 则 A 中一点 x 必有
P[x-δ<X<x+δ] > 0 for all δ>0,
否则 A 可排除 x 的一个 δ-邻域仍是机率 1 之闭集, 那就
与 A 的定义矛盾了. 反之, 若 x 不在 A 中, 则 x 的一个
δ-邻域完全在 A 之外, 当然有 P[x-δ<X<x+δ] = 0.
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.41.121.39 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Math/M.1579428282.A.654.html
※ 编辑: yhliu (114.41.121.39 台湾), 01/19/2020 19:25:06
※ 编辑: yhliu (114.41.121.39 台湾), 01/19/2020 20:41:44
1F:→ znmkhxrw : y大的意思是说, 如果X:Ω→R with range(X) = Q 01/19 22:33
2F:→ znmkhxrw : 则F:R→[0,1]cdf 在所有无理点连续, 有理点不连续? 01/19 22:35
3F:→ znmkhxrw : 後半段好多我消化一下 感恩^^ 01/19 22:35
4F:→ yhliu : 在所有具单点正机率值的点不连续. 如果 X 的值域 01/20 00:16
5F:→ yhliu : 具可数个点, 则 X 必是离散的. 而把那些机率 0 的点 01/20 00:18
6F:→ yhliu : 除外, 则在真正有效的(具单点正机率)值域上每一点, 01/20 00:20
7F:→ yhliu : 分布函数都是不连续的; 邢在其他处, 分布函数都是 01/20 00:22
8F:→ yhliu : 连续的. 其实对任意随栈变数而言, 分布函数是否不 01/20 00:24
9F:→ yhliu : 连续就看它是否具有正值的单点机率. 01/20 00:25