数学期望
数学期望(expectation)简称期望,又称均值,是概率统计学科中最常用的一个随机变量的指标量,反映的是一组数据或一个随机变量取值的集中趋势,它是一阶原点矩。常见分布的数学期望详见概率分布。
目录
1 概念
1.1 有限情形
1.2 可列情形
1.3 连续情形
1.4 一般情形
2 基本性质
3 随机变量函数的数学期望
4 条件数学期望
5 随机向量的数学期望
6 Cauchy-Schwarz 不等式
7 和分布函数的关系
8 上下节
9 参考资料
概念[]
有限情形[]
设有有限个数
{
x
k
}
k
=
1
n
{\displaystyle \{ x_k \}_{k=1}^n}
,下述和式的值
x
¯
=
1
n
∑
k
=
1
n
x
k
{\displaystyle \bar{x} = \dfrac{1}{n} \sum_{k=1}^n x_k}
就称为这组数据的(算术)平均值,简称均值。算术平均值中每个数据的地位是平权的,如果每个数据的权重不同,即存在一列
ω
k
∈
[
0
,
1
]
,
k
=
1
,
2
,
⋯
,
n
{\displaystyle \omega_k \in [0, 1], k = 1,2,\cdots,n}
满足
∑
k
=
1
n
ω
k
=
1
{\displaystyle \sum_{k=1}^n \omega_k = 1}
,我们把下式
x
^
=
∑
k
=
1
n
ω
k
x
k
{\displaystyle \widehat{x} = \sum_{k=1}^n \omega_k x_k}
称作这组数据的加权平均值,数字
ω
k
{\displaystyle \omega_k}
称作对应的
x
k
{\displaystyle x_k}
的权重。算术平均值就是加权平均的特例。
如果将上述权重理解为随机变量取对应值的概率,那么上述加权平均值就是有限概率空间情形下随机变量的数学期望。
可列情形[]
设有离散型随机变量
X
{\displaystyle X}
的分布列
X
x
1
x
2
⋯
x
i
⋯
P
{
X
=
x
i
}
p
(
x
1
)
p
(
x
2
)
⋯
p
(
x
i
)
⋯
{\displaystyle \begin{array}{c|ccccc}
\hline
X & x_1 & x_2 & \cdots & x_i & \cdots \\
\hline
P\{X = x_i\} & p(x_1) & p(x_2) & \cdots & p(x_i) & \cdots \\
\hline
\end{array}}
当下述级数
∑
n
=
1
∞
x
i
p
(
x
i
)
{\displaystyle \sum_{n=1}^\infty x_i p(x_i)}
绝对收敛时,我们就称该级数的收敛值为这个随机变量的数学期望,记为
E
(
X
)
{\displaystyle E(X)}
。要求该级数绝对收敛是因为我们必须要保证衡量这个随机变量取值集中趋势的指标量是唯一的,它不能因为求和顺序发生改变而有不同值。
连续情形[]
设有连续型随机变量
X
{\displaystyle X}
,设它的概率密度函数为
f
(
x
)
{\displaystyle f(x)}
,如果下述反常积分绝对收敛
∫
−
∞
+
∞
x
f
(
x
)
d
x
{\displaystyle \int_{-\infty}^{+\infty} xf(x) \mathrm{d}x}
我们就称该积分的收敛值为这个随机变量的数学期望,也记为
E
(
X
)
{\displaystyle E(X)}
,同样要求绝对收敛的原因同上。
一般情形[]
我们来叙述一般场合下的定义,该定义不仅可以适用于离散和连续情形,也适用于奇异的情形。
设随机变量
X
{\displaystyle X}
的分布函数为
F
(
x
)
{\displaystyle F(x)}
,如果下述 Stieltjes 积分
∫
−
∞
+
∞
x
d
F
(
x
)
{\displaystyle \int_{-\infty}^{+\infty} x \mathrm{d}F(x)}
绝对收敛,那么我们就称该积分的收敛值为这个随机变量的数学期望,记为
E
(
X
)
{\displaystyle E(X)}
。
基本性质[]
常数的数学期望:
E
(
c
)
=
c
,
c
{\displaystyle E(c) = c, c}
为实常数;
线性性:
E
(
a
X
+
b
Y
)
=
a
E
(
X
)
+
b
E
(
Y
)
{\displaystyle E(aX+bY) = aE(X) + bE(Y)}
,
a
,
b
{\displaystyle a, b}
是实常数;
保序性:若
a
⩽
X
⩽
b
{\displaystyle a \leqslant X \leqslant b}
,则
a
⩽
E
(
X
)
⩽
b
{\displaystyle a \leqslant E(X) \leqslant b}
;
独立可乘性:若
X
,
Y
{\displaystyle X, Y}
相互独立,则
E
(
X
Y
)
=
E
(
X
)
E
(
Y
)
{\displaystyle E(XY) = E(X) E(Y)}
。
随机变量函数的数学期望[]
设有随机变量
X
{\displaystyle X}
,它的分布函数为
F
(
x
)
{\displaystyle F(x)}
,而
g
(
x
)
{\displaystyle g(x)}
为一元 Borel 函数,那么
Y
=
g
(
X
)
{\displaystyle Y = g(X)}
的数学期望是
E
(
Y
)
=
∫
−
∞
+
∞
y
d
F
Y
(
y
)
=
∫
−
∞
+
∞
g
(
x
)
d
F
(
x
)
.
{\displaystyle E(Y) = \int_{-\infty}^{+\infty} y \mathrm{d} F_Y (y) = \int_{-\infty}^{+\infty} g(x) \mathrm{d} F(x).}
这两个积分中,一个收敛可以推出另一个收敛,且收敛的值一致,因此我们可以免去计算
Y
{\displaystyle Y}
的分布函数之麻烦而直接计算和
x
{\displaystyle x}
有关的积分。
当
X
{\displaystyle X}
是连续型随机变量时,上述积分表现为
E
(
Y
)
=
∫
−
∞
+
∞
g
(
x
)
f
(
x
)
d
x
.
{\displaystyle E(Y) = \int_{-\infty}^{+\infty} g(x)f(x) \mathrm{d}x.}
条件数学期望[]
设有两个随机变量
X
,
Y
{\displaystyle X, Y}
,它们有联合密度函数
g
(
x
,
y
)
{\displaystyle g(x,y)}
,且有条件分布
f
(
x
|
y
)
{\displaystyle f(x|y)}
,我们可以定义这个分布的数学期望,即在
Y
=
y
{\displaystyle Y=y}
的条件下
X
{\displaystyle X}
的条件数学期望为
E
(
X
|
Y
=
y
)
=
∫
−
∞
+
∞
x
f
(
x
|
y
)
d
x
.
{\displaystyle E(X|Y = y) = \int_{-\infty}^{+\infty} x f(x|y) \mathrm{d}x.}
显然它是
y
{\displaystyle y}
的函数,条件数学期望在预测问题中经常使用。
对它关于
Y
{\displaystyle Y}
求数学期望,就是重期望。与其相关的一个公式是重期望公式
E
(
X
)
=
E
(
E
(
X
|
Y
=
y
)
)
.
{\displaystyle E(X) = E(E(X|Y = y)).}
随机向量的数学期望[]
设随机向量
X
=
(
X
1
,
X
2
,
⋯
,
X
n
)
{\displaystyle \boldsymbol{X} = (X_1, X_2, \cdots, X_n)}
的联合分布函数为
F
(
x
1
,
x
2
,
⋯
,
x
n
)
{\displaystyle F(x_1, x_2, \cdots, x_n)}
,关于分量
X
i
{\displaystyle X_i}
的边际分布函数是
F
i
(
x
i
)
{\displaystyle F_i (x_i)}
,则定义随机向量
X
{\displaystyle \boldsymbol{X}}
的数学期望为
E
(
X
)
=
(
E
(
X
1
)
,
E
(
X
2
)
,
⋯
,
E
(
X
n
)
)
{\displaystyle E(\boldsymbol{X}) = (E(X_1), E(X_2), \cdots, E(X_n))}
它是一个确定的
n
{\displaystyle n}
维向量,其中
E
(
X
i
)
=
∫
−
∞
+
∞
x
i
d
F
i
(
x
i
)
=
∫
−
∞
+
∞
x
i
f
i
(
x
i
)
d
x
i
,
{\displaystyle E(X_i) = \int_{-\infty}^{+\infty} x_i \mathrm{d}F_i (x_i) = \int_{-\infty}^{+\infty} x_i f_i (x_i) \mathrm{d}x_i,}
其中后一个等号需要
X
i
{\displaystyle X_i}
具有概率密度函数
f
i
(
x
i
)
{\displaystyle f_i (x_i)}
时得到。
可以给出随机向量函数的数学期望,它是一个常数,设
g
(
x
1
,
x
2
,
⋯
,
x
n
)
{\displaystyle g(x_1, x_2, \cdots, x_n)}
是一个
n
{\displaystyle n}
元 Borel 可测函数,那么
E
(
g
(
x
1
,
x
2
,
⋯
,
x
n
)
)
=
∫
−
∞
+
∞
⋯
∫
−
∞
+
∞
g
(
x
1
,
x
2
,
⋯
,
x
n
)
d
F
(
x
1
,
x
2
,
⋯
,
x
n
)
.
{\displaystyle E(g(x_1, x_2, \cdots, x_n)) = \int_{-\infty}^{+\infty} \cdots \int_{-\infty}^{+\infty} g(x_1, x_2, \cdots, x_n) \mathrm{d}F(x_1, x_2, \cdots, x_n).}
Cauchy-Schwarz 不等式[]
概率论中的这一不等式表现为
设
X
,
Y
{\displaystyle X, Y}
是随机变量,则有如下不等式成立
|
E
(
X
Y
)
|
2
⩽
E
(
X
2
)
E
(
Y
2
)
.
{\displaystyle |E(XY)|^2 \leqslant E(X^2) E(Y^2).}
等式成立当且仅当存在某一常数
c
{\displaystyle c}
,使得
P
{
Y
=
c
X
}
=
1.
{\displaystyle P\{Y = cX\} = 1.}
和分布函数的关系[]
设随机变量
X
{\displaystyle X}
的分布函数为
F
(
x
)
{\displaystyle F(x)}
,在它的数学期望存在时有
E
(
X
)
=
∫
0
+
∞
[
1
−
F
(
x
)
]
d
x
−
∫
−
∞
0
F
(
x
)
d
x
.
{\displaystyle E(X) = \int_0^{+\infty} [1 - F(x)] \mathrm{d}x - \int_{-\infty}^0 F(x) \mathrm{d}x.}
特别地,若
X
{\displaystyle X}
是非负随机变量,则有
E
(
X
)
=
∫
0
+
∞
[
1
−
F
(
x
)
]
d
x
.
{\displaystyle E(X) = \int_0^{+\infty} [1 - F(x)] \mathrm{d}x.}
当
X
{\displaystyle X}
是取非负整数值的离散型随机变量,则有
E
(
X
)
=
∑
k
=
1
∞
P
{
X
⩾
k
}
.
{\displaystyle E(X) = \sum_{k=1}^\infty P\{X \geqslant k\}.}
这些公式可以在某些情况下更简洁地算出某个随机变量的数学期望。
上下节[]
下一节:方差
参考资料李贤平, 《概率论基础(第3版)》, 高等教育出版社, 北京, 2010-04, ISBN 978-7-0402-8890-2.
概率分布(学科代码:1106420,GB/T 13745—2009)
概率公理化
随机事件 ▪ 样本空间 ▪ De Morgan 定理 ▪ 概率空间 ▪ 古典概型 ▪ 几何概型 ▪ 条件概率 ▪ 事件独立性 ▪ 独立重复试验 ▪ Bernoulli 概型
随机变量
离散型随机变量 ▪ 连续型随机变量 ▪ 随机变量的函数 ▪ 随机向量 ▪ 边缘分布 ▪ 条件分布 ▪ 随机变量的独立性 ▪ 随机向量的函数 ▪ 极差分布
随机变量的特征
数学期望 ▪ 方差 ▪ 协方差 ▪ 相关系数 ▪ 矩 ▪ 母函数 ▪ 矩量母函数 ▪ 特征函数 ▪ 示性函数 ▪ 中位数 ▪ 众数 ▪ 峰度 ▪ 偏度
离散概率分布
二项分布 ▪ 几何分布 ▪ Pascal 分布 ▪ Poisson 分布 ▪ 超几何分布 ▪ 对数分布 ▪ 负二项分布 ▪ 多项分布 ▪ 多元超几何分布
连续概率分布
正态分布 ▪ 均匀分布 ▪ 指数分布 ▪ 对数正态分布 ▪ Γ 分布 ▪ χ 分布 ▪ β 分布 ▪ Rayleigh 分布 ▪ Cauchy 分布 ▪ Pareto 分布 ▪ Laplace 分布 ▪ Weibull 分布 ▪ Maxwell 分布律 ▪ 二元正态分布 ▪ 多元正态分布
统计三大分布
χ² 分布 ▪ F 分布 ▪ t 分布 ▪ 非中心 χ² 分布 ▪ 非中心 F 分布 ▪ 非中心 t 分布
所在位置:数学(110)→ 概率论(11064)→ 概率分布(1106420)