概率分布(摘自维基百科未排版)

现在的位置: 首页 > 综合 > 正文

概率分布(摘自维基百科未排版)

2013年03月19日 ⁄ 综合 ⁄ 共 3614字 ⁄ 字号小中大 ⁄ 评论关闭

概率分布（英语：probability distribution）或简称分布（distribution），是概率论的一个概念。使用时可以有以下两种含义：

广义地，它指称随机变量的概率性质－－当我们说概率空间 $(/Omega, /mathcal{F}, /mathbb{P})$ 中的两个随机变量 X 和 Y 具有同样的分布（或 同分布）时，我们是无法用概率 $/mathbb{P}$ 来区别他们的。换言之：

称 X 和 Y 为同分布的随机变量，当且仅当对任意事件 $A /in /mathcal{F}$ ，有 $/mathbb{P}(X/in A) = /mathbb{P}(Y/in A)$ 成立。

但是，不能认为同分布的随机变量是相同的随机变量。事实上即使 X 与 Y 同分布，也可以没有任何点ω使得 X(ω)=Y(ω) 。在这个意义下，可以把随机变量分类，每一类称作一个分布，其中的所有随机变量都同分布。用更简要的语言来说，同分布是一种等价关系，每一个等价类就是一个分布。需注意的是，通常谈到的离散分布、均匀分布、伯努利分布、正态分布、泊松分布等，都是指各种类型的分布，而不能视作一个分布。

狭义地，它是指随机变量的概率分布函数。设 X 是样本空间 $(/Omega, /mathcal{F})$ 上的随机变量， $/mathbb{P}$ 为概率测度，则称如下定义的函数是 X 的分布函数（distribution function），或称累积分布函数（cumulative distribution function，简称CDF）：

$F_X (a) := /mathbb{P}(X /leq a)$ ，对任意实数 a 定义。

具有相同分布函数的随机变量一定是同分布的，因此可以用分布函数来描述一个分布，但更常用的描述手段是概率密度函数（probability density function, pdf）。

在常用的文献中，“分布”一词可指其广义和狭义，而“累计分布函数”或“分布函数”一词只能指称后者。为了不致混淆，下文中谈及上述的广义时使用“分布”一词；狭义时使用“分布函数”一词。

[编辑]分布函数的性质刻划

对于特定的随机变量 $X$ ，其分布函数 $F X$ 是单调不减及右连续，而且 $F_X(-/infty)=0$ ， $F_X(/infty)=1$ 。这些性质反过来也描述了所有可能成为分布函数的函数：

设 $F:[-/infty,/infty] /to [0,1], F(-/infty)=0, F(/infty)=1$ 且单调不减、右连续，则存在概率空间 $(/Omega, /mathcal{F}, /mathbb{P})$ 及其上的随机变量 X ，使得 F 是 X 的分布函数，即 $F X = F$

[编辑]随机变量的分布

设 $P$ 为概率测度， $X$ 为随机变量则函数 $F(x) = P(X /le x)$ ( $x/in/R$ ) 称为 $X$ 的概率分布函数.如果将 $X$ 看成是数轴上的随机点的坐标，那么，分布函数 $F (x)$ 在 $x$ 处的函数值就表示 $X$ 落在区间 $(-/infty,x]$ 上的概率。

例如，设随机变量 $X$ 为掷两次骰子所得的点数差，而整个样本空间由36个元素组成。

数量	( i , j )∈ S	$x$	$P (X = x)$	$F (x)$
6	( 1,1 )，( 2,2 )，( 3,3 ) ( 4,4 )，( 5,5 )，( 6,6 )	0	6/36	6/36
10	( 1,2 )，( 2,3 ) ( 3,4 )，( 4,5 )，( 5,6 ) ( 2,1 )，( 3,2 )，( 4,3 ) ( 5,4 )，( 6,5 )	1	10/36	16/36
8	( 1,3 )，( 2,4 )，( 3,5 ) ( 4,6 )，( 3,1 )，( 4,2 ) ( 5,3 )，( 6,4 )	2	8/36	24/36
6	( 1,4 )，( 2,5 )，( 3,6 ) ( 4,1 )，( 5,2 )，( 6,3 )	3	6/36	30/36
4	( 1,5 )，( 2,6 ) ( 5,1 )，( 6,2 )	4	4/36	34/36
2	( 1,6 )，( 6,1 )	5	2/36	36/36

其分布函数是：

$F(x) = /begin{cases} 0 /longrightarrow x <0 //6/36 /longrightarrow 0 /le x < 1//16/36 /longrightarrow 1 /le x < 2//24/36 /longrightarrow 2 /le x <3//30/36 /longrightarrow 3 /le x < 4//34/36 /longrightarrow 4 /le x < 5//1 /longrightarrow 5 /le x /end{cases}$

[编辑]离散分布

上面所列举的例子都属于离散分布，即分布函数的值域是离散的，比如只取整数值的随机变量就是属于离散分布的。 $F (x)$ 表示随机变量 $X /leq x$ 的概率值。如果 X的取值只有 $x 1 < x 2 < ... < x n$ ，则：

$F_X (x_i)=/sum_{j=1}^i P (x_j)$
$/sum_{k=1}^n P (x_i)=1$

[编辑]均匀分布

主条目：离散型均匀分布

[编辑]二项分布

主条目：二项分布

二项分布是最重要的离散概率分布之一，由瑞士数学家雅各布·伯努利（Jakob Bernoulli）所发展，一般用二项分布来计算概率的前提是，每次抽出样品后再放回去，并且只能有两种试验结果，比如黑球或红球，正品或次品等。二项分布指出，随机一次试验出现的概率如果为 $p$ ，那么在 $n$ 次试验中出现 $k$ 次的概率为：

$f ( n, k, p )= {n/choose k}p^{k}(1-p)^{n-k}$

例如，在掷3次骰子中，不出现6点的概率是： $f ( 3, 0, /frac{1}{6} )= {3/choose 0}/left(/frac{1}{6}/right)^{0}/left(/frac{5}{6}/right)^{3}= 0.579$
在连续两次的轮盘游戏中，至少出现一次红色的概率为： $f ( 2, 1, /frac{18}{37} )+f ( 2, 2, /frac{18}{37} )=0.736$

二项分布在 $p = 0.5$ 时的对称性 ( 自变量为 $k$ )

二项分布在 $p = 0.5$ 时表现出图像的对称性，而在 $p$ 取其它值时是非对称的。另外二项分布的期望值 $/operatorname{E}(X)=np$ ，以及方差 $/operatorname{var}(X) = n/,p/,(1-p)/!$

作为离散概率分布的超几何分布尤其指在抽样试验时抽出的样品不再放回去的分布情况。在一个容器中一共有 $N$ 个球，其中 $M$ 个黑球， $(N - M)$ 个红球，通过下面的超几何分布公式可以计算出，从容器中抽出的 $n$ 个球中（抽出的球不放回去）有 $k$ 个黑球的概率是多少：

$f(k,n;M;N):= /frac{/displaystyle{M /choose k}{N-M /choose n-k}}{/displaystyle{N /choose n}}$

例如，容器中一共10个球，其中6个黑色，4个白色，一共抽5次（抽出的球不放回去），在这5个球中有3个黑球的概率是： $f(k=3) = /frac{/displaystyle{6 /choose 3}{10-6 /choose 5-3}}{/displaystyle{10 /choose 5}} =0.476$

[编辑]超几何分布和二项分布的关系

和二项分布不同的是，在超几何分布中，特别强调的是抽出的样品在下一次抽取前不再放回去，但是如果抽取的次数 $n$ 和总共样品数 $N$ 相比很小 ( 大约 $n / N < 0,05$ )，这时在计算上二项分布和超几何分布相互间则没有主要的区别，此时人们更愿意采用二项分布的方法，因为在数学计算上二项分布要简单一些。

[编辑]泊松近似

主条目：泊松分布

泊松近似是二项分布的一种极限形式。其强调如下的试验前提：一次抽样的概率值 $p$ 相对很小，而抽取次数 $n$ 值又相对很大。因此泊松分布又被称之为罕有事件分布。泊松分布指出，如果随机一次试验出现的概率为 $p$ ，那么在 $n$ 次试验中出现 $k$ 次的概率按照泊松分布应该为：

$f ( n, k, p )= /frac{(n/cdot p)^k}{e^{n/cdot p}/cdot k!}$

其中数学常数 $e = 2.71828...$ ( 自然对数的底数)
例如，某工厂在生产零件时，每200个成品中会有1个次品，那么在100个零件中最多出现2个次品的概率按照泊松分布应该是： $f ( 100, 0, /frac{1}{200} )+ f ( 100, 1, /frac{1}{200} )+ f ( 100, 2, /frac{1}{200} )=0.986$

在实践中如果遇到 $n$ 值很大导致二项分布难于计算时，可以考虑使用泊松分布，但前提是 $n/cdot p$ 必须趋于一个有限极限。采用泊松分布的一个不太严格的规则^{[来源请求]}是：

$n/ge 100$
$p/le 0.1$

[编辑]连续分布

设 $X$ 是具有分布函数 $F$ 的连续随机变量，且 F 的一阶导数处处存在，则其导函数

$f(x) =/frac{/operatorname{d}F(x)}{/operatorname{d}x}$

称为 $X$ 的机率密度函数。
每个机率密度函数都有如下性质：

$/int_{-/infty}^/infty f(x) /, {/rm d}x = 1$
$/int_a^b f(x) /, {/rm d}x = /operatorname{P}(a/le X/le b) = F ( b )-F ( a )$

第一个性质表明，机率密度函数与 $x$ 轴形成的区域的面积等于1，第二个性质表明，连续随机变量在区间 $[a, b]$ 的概率值等于密度函数在区间 $[a, b]$ 上的积分，也即是与 $X$ 轴在 $[a, b]$ 内形成的区域的面积。因为 $0 /le F( x ) /le 1$ ，且 $f (x)$ 是 $F (x)$ 的导数，因此按照积分原理不难推出上面两个公式。

正态分布、指数分布、 $t$ -分布， $F$ -分布以及 $Ξ 2$ -分布都是连续分布。

[编辑]均匀分布

主条目：连续型均匀分布

[编辑]指数分布

主条目：指数分布

[编辑]伽马分布

主条目：Γ函数

[编辑]正态分布

主条目：正态分布

连续随机变量的机率密度函数如果是如下形式，

$f(x) = /frac {1}{/sigma/sqrt{2/pi}}e^/left(-/frac {1}{2} /left(/frac{x-/mu}{/sigma}/right)^2/right)$

那么这个连续分布被称之为正态分布，或者高斯分布。其密度函数的曲线呈对称钟形，因此又被称之为钟形曲线，其中 $μ$ 是平均值， $σ$ 是标准差。正态分布是一种理想分布，许多典型的分布，比如成年人的身高，汽车轮胎的运转状态，人类的智商值（IQ），都属于或者说至少接近正态分布。同样按照连续分布的定义，正态机率密度函数具有和普通机率密度函数类似的性质：

$/int_{-/infty}^/infty f(t) /, {/rm d}t = 1$
$F(x) =/frac {1}{/sigma/sqrt{2/pi}} /int_{-/infty}^x e^/left(-/frac {1}{2} /left(/frac{t-/mu}{/sigma}/right)^2/right) /, {/rm d}t$

如果给出一个正态分布的平均值 $μ$ 以及标准差 $σ$ ，可以根据上面的第二个公式计算出任一区间的概率分布情况。但是如上的计算量是相当庞大的，没有计算机的辅助基本是不可能的，解决这一问题的方法是借助 $z$ -变换以及标准正态分布表格 ( $z$ -表格)。

中间值 $μ = 0$ 以及标准差 $σ = 1$ 的正态分布被称之为标准正态分布，其累积分布函数是

File:Z-transformation.png

z

-变换示意图

$/Phi(z)=/frac 1{/sqrt{2/pi}} /cdot /int_{-/infty}^z e^{-/frac 12 t^2} /mathrm{d}t$

将普通形式的正态分布变换到标准正态分布的方法是

$z=/frac{x-/mu}{/sigma}$

例如，已知一正态分布的 $μ = 5$ ， $σ = 3$ ，求区间概率值 $P (4<X/le 7) ?$ 计算过程如下，

$/frac{4-5}{3} < Z /le /frac{7-5}{3}$

$-1/3 < Z /le 2/3$

$P (4< X/le 7) =P (-1/3 < Z /le 2/3)= /Phi(2/3)-/Phi(-1/3)=0.7475-0.3694=0.3781$

其中 $Φ(z)$ 值通过查 $z$ -表格获得。

[编辑]正态分布和二项分布

在离散分布中如果试验次数 $n$ 值非常大，而且单次试验的概率 $p$ 值又不是很小的情况下，正态分布可以用来近似的代替二项分布。一个粗略的使用正态分布的近似规则是： $n/cdot p/cdot (1-p)/geq 9$ 。
从二项分布中获得 $μ$ 和 $σ$ 值的方法是

期望值 $/mu=n/cdot p$
标准差 $/sigma=/sqrt{n/cdot p /cdot (1-p) }$

如果 $σ > 3$ ，则必须采用下面的近似修正方法：

$P(x_1 /leq X /leq x_2) = /underbrace{/sum_{k=x_1}^{x_2} {n /choose k} /cdot p^k/cdot (q)^{n-k}}_{/mathrm{EF}} /approx /underbrace{/Phi/left(/frac{x_2+0,5-/mu}{/sigma}/right) -/Phi/left(/frac{x_1-0,5-/mu}{/sigma}/right)}_{/mathrm{ZF}}$