其实都是照着抄的
Chapter 1 样本空间与概率
1.3 条件模型
条件概率:P(A∣B)=P(B)P(A∩B)
乘法定律:P(AB...)=P(A)P(B∣A)...
1.4 全概率定理与贝叶斯准则
A1...An 为样本空间的一个分割,则:
全概率定理:P(B)=∑iP(Ai∩B)=∑iP(Ai)P(B∣Ai)
贝叶斯准则:P(Ai∣B)=P(B)P(Ai)P(B∣Ai)=P(A1)P(B∣A1)+...+P(An)P(B∣An)P(Ai)P(B∣Ai)
1.5 独立性
事件 A,B 独立:P(A∩B)=P(A)P(B)
条件独立:P(A∩B∣C)=P(A∣C)P(B∣C)
Chapter 2 离散随机变量
2.2 分布列
分布列:pX(x)=P({X=x})
两点分布(伯努利):B(1,p),E=p,var=p(1−p)
二项分布:X∼B(n,p),P(X=k)=(kn)pk(1−p)n−k,E=np,var=np(1−p)
几何分布:X∼G(p),P(X=k)=(1−p)k−1p,E=p1,var=p21−p
泊松分布:X∼P(λ),P(X=k)=e−λk!λk,E=var=λ,当 n>>p 时可以取 λ=np 逼近二项分布
2.4 期望、均值和方差
期望:E[X]=∑xpX(x)
方差:var(X)=E[(X−E[x])2]=E[X2]−(E[X])2
标准差:σX=var(X)
取 Y=aX+b,E[Y]=aE[X]+b,var(Y)=a2var(X)
2.5 多个随机变量的联合分布列
pX,Y(x,y)=P(X=x,Y=y)
边缘分布列:pX(x)=∑P(X=x,Y)
E[aX+bY+c]=aE[X]+bE[Y]+c
E[X]=∑iP(Ai)E[X∣Ai](样本空间分割)
2.7 独立性
变量 X 相对事件 A 独立:pX∣A(x)=pX(x)
变量 X,Y 独立:pX,Y(x,y)=pX(x)pY(y)
这时有 E[XY]=E[X]E[Y],var(X+Y)=var(X)+var(Y)
Chapter 3 一般随机变量
3.1 连续随机变量和概率密度函数
将求和改为积分,P(X∈A)=∫AfX(x)dx,fX(x) 为概率密度函数(PDF)
E[X]=∫−∞+∞xfX(x)dx
var(X)=∫−∞+∞(x−E[X])2fX(x)dx
IA(x)=[x∈A]
均匀分布:
-
X∼U(a,b)
-
fX(x)=b−a1(x∈(a,b))
-
E[X]=2a+b
-
var(X)=12(b−a)2
指数分布:
-
X∼ε(λ)
-
fX(x)=λe−λx(x>0)
-
E[X]=λ1
-
var(X)=λ21
3.2 分布函数
概率分布函数(CDF):FX(x)=P(X≤x)
3.3 正态随机变量
X∼N(μ,σ2)
fX(x)=2πσ1exp(−2σ2(x−μ)2)
E[X]=μ,var(X)=σ2
图像上 μ 为对称轴,σ 与宽度相关
当 μ=0,σ=1 时记为标准正态随机变量,PDF 记为 ϕ(x) 或 φ(x),CDF 记为 Φ(x)
二元正态分布:
-
(X,Y)∼N(μ1,μ2,σ12,σ22,ρ)
-
f(x,y)=2πσ1σ21−ρ21exp(−2(1−ρ2)1[σ12(x−μ1)2−σ1σ22ρ(x−μ1)(y−μ2)+σ22(y−μ2)2])
-
X,Y 独立的充要条件:ρ=0
3.4 多个随机变量的联合概率密度
P((X,Y)∈A)=∫∫(x,y)∈AfX,Y(x,y)dxdy
fX(x)=∫fX,Y(x,y)dy
fX,Y(x,y)=∂x∂y∂2FX,Y(x,y)
E[g(X,Y)]=∫∫g(x,y)fX,Y(x,y)dxdy
E[aX+bY+c]=aE[X]+bE[Y]+c
3.5 条件
P(X∈B∣A)=∫BfX∣A(x)dx
fX∣A(x)=P(X∈A)fX(x)(x∈A)
E[X∣A]=P(A)E[XIA]
fX(x)=∑P(Ai)fX∣Ai(x)
fX,Y(x,y)=fY(y)fX∣Y(x∣y)
fX(x)=∫fY(y)fX∣Y(x∣y)dy
P(X∈A∣Y=y)=∫AfX∣Y(x∣y)dx
E[X∣A]=∫xfX∣A(x)dx
E[X]=∑P(Ai)E[X∣Ai]
E[X]=∫fY(y)E[X∣Y=y]dy
X,Y 独立:fX,Y(x,y)=fX(x)fY(y),此时 E[XY]=E[X]E[Y],var(X+Y)=var(X)+var(Y)
3.6 连续贝叶斯准则
对连续随机变量 X,Y,fX∣Y(x∣y)fY(y)=fY∣X(y∣x)fX(x)
fX∣Y(x∣y)=fY(y)fX(x)fY∣X(y∣x)=∫fX(t)fY∣X(y∣t)dtfX(x)fY∣X(y∣x)
对于一个随机变量和一个离散变量的情况同理
Chapter 4 随机变量的深入内容
4.1 随机变量函数的分布密度函数
Y=g(X),则 CDF FY(y)=∫g(x)≤yfX(x)dx
求导得 PDF:fY(y)=dydFY(y)
Y=aX+b⇒fY(y)=∣a∣1fX(ay−b)
对严格单调函数 y=g(x),x=h(y),fY(y)=fX(h(y))∣h′(y)∣
对一般 Y=g(X),设值域 D,如果有:
则 fY(y)=∑fX(hi(y))∣h′(y)∣(y∈D)
同理,对二维情形 U=u(X,Y),V=v(X,Y)
fU,V(u,v)=∑fX,Y(xi(u,v),yi(u,v))∂(u,v)∂(xi,yi)
卷积:设 X,Y 独立,Z=X+Y,fZ(z)=∫fX(x)fY(z−x)dx
X∼N(μx,σx2),Y∼N(μy,σy2),Z=X+Y∼N(μx+μy,σx2+σy2)
f−X(x)=fX(−x)
4.2 协方差和相关
协方差 cov(X,Y)=E[(X−E[X])(Y−E[Y])]=E[XY]−E[X]E[Y]
X 和 Y 不相关:cov(X,Y)=0
-
cov(X,a)=0
-
cov(X,X)=var(X)
-
cov(X,aY+b)=a⋅cov(X,Y)
-
cov(X,Y+Z)=cov(X,Y)+cov(X,Z)
相关系数:ρ(X,Y)=ρXY=corr(X,Y)=var(X)var(Y)cov(X,Y),ρXY∈[−1,1]
X 的标准化:Y=var(X)(X−E[X])
将 X,Y 标准化为 X′,Y′,则 corr(X,Y)=cov(X′,Y′)
对二元正态分布有 ρXY=ρ
∣ρXY∣=1 则 X,Y 线性相关(aX+bY=c)
var(i=1∑nXi)=i=1∑nj=1∑ncov(Xi,Xj)=i=1∑nvar(Xi)+i=1∑nj=1∑n[i=j]cov(Xi,Xj)
随机向量 X 的协方差矩阵:σij=cov(Xi,Xj)
4.3 条件期望和条件方差
重期望法则:E[E[X∣Y]]=E[X]
全方差法则:var(X)=E[var(X∣Y)]+var(E[X∣Y])
E[X∣Y]−X 与 E[X∣Y] 不相关
4.4 矩母函数
MX(s)=E[esX]
MX(−∞)=P(X=0)
若存在正数 a,MX(s) 在 [−a,a] 中有限,则 MX(s) 唯一决定 X 的分布函数
E[Xn]=MX(n)(0)
若 Y=aX+b,则 MY(s)=esbMX(as)
若 X,Y 独立,则 MX+Y(s)=MX(s)MY(s)
X∼N(μ,σ2),MX(s)=exp(2σ2s2+μs)
联合分布的矩母函数:MX1X2(s1,s2)=E[es1X1+s2X2]
X 的特征函数:ϕ(t)=E(eitX)
4.5 随机数量个独立变量之和
Y=X1+⋯+Xn,其中 Xi 同分布且独立,N 为随机正整数,则:
-
E[Y]=E[X]E[N]
-
var(Y)=var(X)E[N]+(E[X])2var(N)
-
若 MN(s)=f(es),则 MY(s)=f(MX(s))
Chapter 5 极限理论
5.1 马尔可夫和切比雪夫不等式
马尔可夫不等式:设随机变量 X 取非负值,则对 a>0 有 P(X≥a)≤aE[X]
切比雪夫不等式:设随机变量 X 均值 μ,方差 σ2,则对 a>0 有 P(∣X−μ∣≥a)≤a2σ2
5.2 弱大数定律
设 X1∼Xn 同分布,E[Xi]=μ,则 ∀ϵ>0,n→∞limP(∣nX1+⋯+Xn−μ∣≥ϵ)=0
5.3 依概率收敛
依分布收敛:n→∞limFn(x)=F(x),则 Xn 依分布收敛到 X,记作 XndX,或 Fn 弱收敛到 F,记作 FnwF。充要条件:n→∞limϕn(t)=ϕ(t)
依概率收敛:∀ϵ>0,n→∞limP(∣Xn−X∣≥ϵ)=0,记作 XnpX
XnpX 则 XndX
几乎处处收敛:P(n→∞limXn=X)=1,记作 Xna.s.X
5.4 中心极限定理
设 X1∼Xn 同分布,E[Xi]=μ,设 Zn=nσX1+⋯+Xn−nμ
则 Zn 的极限分布为标准正态分布函数
二项分布的棣莫弗-拉普拉斯近似:设 Sn∼B(n,p),n 足够大,a,b 为非负整数,则:
P(a≤Sn≤b)≈Φ(np(1−p)b+21−np)−Φ(np(1−p)a−21−np)
5.5 强大数定律
设 X1∼Xn 同分布,E[Xi]=μ,则
P(n→∞limnX1+⋯+Xn=μ)=1
Ex
次序统计量
对同分布的 X1∼Xn 排序得到 X(1)≤X(2)≤⋯,称为次序统计量
设有公共的 PDF f(x),CDF F(x),则:
-
∫a<x1<⋯<xk<bf(x1)⋯f(xk)dx1⋯dxk=k!(F(b)−F(a))k
-
(X(1),⋯,X(n)) 联合密度 g(x1,⋯,xn)=n!∏i=1nf(xi)(x1<⋯<xn)
-
X(k) 密度 gk(x)=(k−1)!(n−k)!n!(F(x))k−1(1−F(x))n−kf(x)
-
同理,对 k1<k2,(X(k1),X(k2)) 联合密度:
g(xk1,xk2)=(k1−1)!(k2−k1−1)!(n−k2)!n!×(F(xk1))k1−1(F(xk2)−F(xk1))k2−k1−1(1−F(xk2))n−k2×f(xk1)f(xk2)
记忆的话可以考虑组合意义,总方案数 n!,然后第 1 个到第 k1−1 个随意分布就除以 (k1−1)!,并乘上贡献 (F(xk1))k1−1,其他部分同理。
杂项
var(x)≤E(X−a)2
标准差 σX=var(X)
内积不等式:∣E(XY)∣≤E(X2)E(Y2),当存在不全为零的 a,b 使 aX+bY=0 时取等
卡方分布:Xi∼N(0,1),Y=X12+⋯+Xn2,fY(y)=22nΓ(2n)1y2n−1e−2y