现在的位置: 首页 > 综合 > 正文

鱼的概率思考

2013年12月20日 ⁄ 综合 ⁄ 共 3519字 ⁄ 字号 评论关闭

研究随机现象, 什么是随机现象呢?在某种特定情况下,或者某个环境中,不总是出现同一个结果的现象就是随机现象。研究某个随机现象的时候,随机现象所有可能结果组成的集合称为样本空间。 随机现象的每种基本结果被定义为样本点。我们可以理解这种隶属关系,随机现象拥有样本空间和样本点这两个属性。 某些样本点组成的集合称为事件。事件本质是集合,我们可以研究事件间的关系、事件间的运算。在事件上定义一个叫做概率的函数,这就给我们 研究某些随机现象结果的可能性 提供了数学基础。给出概率的定义,通过事件的相互关系、运算性质,我们可以得到一些事件间的概率性质,或者事件本身的概率性质。 

研究随机现象,首先应该明确我们研究的是什么现象!样本空间是什么!我们对哪些事件感兴趣!如何确定这些事件的概率!

在研究过程中,大家会不自然的用到一些符号来表示随机现象的结果,这就是我们内心对随机变量的诉求。随机变量已经深入我们的内心,很难去分离理解他了。 如果能区分他,明确的理解他,我们有理由相信这会帮助我们解决实际问题。 所以我们设法理解或者说重新理解随机变量。 我们把随机现象结果用数量表示,这种数量表示就是随机变量。更理论一点理解就是,随机变量是定义在样本空间上的一个函数!我没有见过函数值是复数的,很多书中也是这样定义的,就是这个函数是实值函数!

随机变量一般用大写字母来表示,X,Y,Z等, 每一个样本点对应唯一一个随机变量值,那么就可以用随机变量的条件限制出样本点的集合,那么这就是事件了。 例如,我们研究投掷硬币这个随机现象,出现的结果有两种,一种是正面,一种是反面,这两种结果组成样本空间,每一个结果是一个样本点,定义一个随机变量X,当随机现象的结果为正面时,X=1,当结果为反面时,X=0,这些定义都满足 随机变量的定义,那么X=0就是一个基本事件了,概率是定义在事件上的,那么P(X=0)便是一个概率,它表示了“投掷硬币这种随机现象出现反面这种结果组成的事件的概率”。
这里我们考虑的是离散的情况,所谓离散,指的是 随机变量的值是有限的或者可列的,注意可列是无限的特殊形式。还有一种情况,例如生小孩现象,这种现象的结果又很多种情况,比如新生儿的性别,新生儿的体重,新生儿的身高,新生儿的眼睛间距都可以用来表示这个现象的结果,比如,某某生了一个小孩,往往我们会说某某生了一个女孩,或者某某生了一个8斤的小家伙,我们已经潜移默化的说出了我们关心的是某个指标。生小孩这种随机现象的结果有无穷多个,尽管我们无法确定,但是在我们有生之年,也许人类会永远活在地球上,所以新生儿一直会出现,这种现象的样本点就是每个新生儿,样本空间就是所有新生儿的全体,新生儿有无限多个。
我们在这个样本空间上定义随机变量,新生儿性别为男孩时X=0,新生儿性别为女孩时,X=1,这里不考虑其它情况,尽管还有其它可能;在同一个样本空间上,在继续定义另一个随机变量Y,它表示新生儿的体重;随机变量Z表示新生儿的身高。如果我们认为概率反应的是事物内部本质的话,X=0或者=1应该可以用某个稳定值来表示他的可能性,我们就说这个是他们的概率了。如何确定这个概率呢?用古典方法,我们认为男女有相同的可能;又可以用统计的方法,在某一段时间内,统计某个地区的新生儿性别,可以用相应性别出生的频率来估计为某个性别的概率。对于Y和Z,这显然是连续的随机变量,我们很难用古典概率方法研究每个值出现的可能性,依然可以使用频率来表示,在保留误差的条件下,比如,我们搞一些区间,(0,1]
(1,2] ....等等,如果观测值(得到的某个样本点的相应随机变量值)比较少,我们可以把区间划的大一点,如果比较多,相应划多一点,这种划分没有严格的规则,至少我现在没有想到,只是根据实际情况设置就可以了。统计能获得的样本点的相应观测值落在对应区间的个数,这样就会得到一个区域的频率分布了,如果观测值增多,我们就减小区间的宽度,当观测值得个数趋近无穷了,我们区间的长度相应也趋近于无穷了,这样我们就但是每个观测值还保留着某个值,这个值不再是概率了,我们可以用密度来理解他。很多情况下,我们研究的随机现象的样本空间上定义的随机变量连续的时候,我们会有一些相应的分布来研究它,比如正态分布!什么是分布呢?
离散随机变量场合,随机变量的取值概率都知道,这就是分布了。 连续场合,随机变量的概率密度知道,他的分布就晓得了。 

问题想多了,我们会发现,实际上,很容易知道随机变量后面的问题,不好去拿出我们研究的到底是什么现象,这个现象是随机现象,他的样本点是什么!!

知道了这些之后,我们还会研究相同样本空间上不同随机变量的关系问题! 将问题再提升一个等级了。 就是我们前面描述过的问题,新生儿的性别,体重,身高等随机变量是同一个样本空间上的不同随机变量啊。 

回到鱼的问题上来先,我们逮了好多鱼,很凑巧,这些鱼只有两种,假设为鲈鱼和鲑鱼,我们考虑任意在这些鱼里面拿出一条,它是什么鱼。 显然样本空间有限,某种鱼也是有限的,如果我拿到每一条鱼的条件相等,拿出一条鱼,他是鲈鱼的概率就是鲈鱼的数量除以所有鱼的数量。用随机变量X=0,表示鲈鱼,X=1表示鲑鱼。我们再引入一个随机变量Y表示鱼的长度。研究有限的鱼,Y这个随机变量我们只能用落在某个区间的鱼的频率来表示Y的分布列。如果我们把研究对象扩大,自然界中我们认为两种鱼的数量是稳定的,如果我们捕到的鱼作为自然界中鱼的一个随机样本,我们完全可以认为Y是连续分布的,而且与自然界中这两种鱼的长度分布一致,事实上我们补到的鱼很难作为自然界的一个随机样本。也就是说这个样本不一定能很好的反应自然界的真是情况。但是很多情况下,我们认为自然界中的某些随机变量符合正太分布,尽管某个样本不一定服从这个分布,我们还是估计他的期望和方差,并把它作为正太分布研究。

 我们不考虑扩大的情况继续思考这个问题,在我们捕到鱼中继续考虑呀,假设我们捕到的鱼足够多,我们暂且用连续的密度函数来描述Y的分布情况。p(X,y)表示的是什么意思呢?先假设有限样本点,那么每个样本点对应X和Y都有一个值,这两个值为在二维欧式空间中是一个点,我们在Y上用区间划分,这样出现在X=x,Y属于某个区间的鱼的个数除以所补到鱼的总数就是这个区间的频率,如果鱼足够多,那么我们就认为p(X,y)是关于y的连续函数了。p(X,y)就是X,Y的联合密度函数了。 再加个条件的问题来思考下,p(y|X),这个是X某个值时,Y的概率密度,条件概率也是概率呀,不要跟联合概率密度弄混了。例如,p(y|X=0)表示所捕的鱼中所有鲈鱼构成的集合中,Y的分布情况。实际上条件概率是缩小了研究的范围。

思考了这么多,我们在提出一个问题。当拿到了一个鱼,我们不能计算它的种类,我们可以计算它的长度,那么长度一定,这条鱼它属于鲈鱼或者鲑鱼的概率有多大呢? P(X|y)就可以来解决这个问题了。我们可以使用贝叶斯公式来求解这个问题,P(X|y) = p(X,y) /p(y) = p(y|X)P(X) / p(y), p(y) = P(X=0)p(y|X=0) + P(X=1)p(y|X=1) 。

我们想找一个比较好的t值,使得我们误判的概率最小化,所以要考虑误判的情况。 假设我们将Y<t判断成了X=0,Y>=t判成X=1 。分析这样导致的结果是

p(X=1, Y<t) + p(X=0, Y>=t) 就构成了这种判别的错误概率密度,错误概率就是:

我们想要这个错误概率最小化,那么我们会得到一个优化问题,顺便求出目标函数的导数。

令导数等于0,便可以求出最佳的t的位置了。 

接下来,再继续考虑几个问题,首先即使给出一个最优的t,目标函数的值仍然很大,比如0.5,这个值可以理解为,我们的分类错误率是50%,确实有些大了。我们可以怎么改进呢? 我们可以引入更多的特征,从概率上就是说我们再继续寻找同一些样本空间上的函数,使得总体上误差函数的最优值尽量的小。 

另外一个问题就是,我们如何确定针对某一中鱼的某个特征的分布情况,一般情况下,我们会用统计的方法进行估计,这个需要分布已知,往往我们会假设他为某个分布,然后再根据有限样本容量的样本进行参数估计,这样会带来两部分误差,1、他是否真的满足我们给定的分布,这一步的错误直接导致所有错误。2、我们的样本是否可以很好的描述总体分布情况,这部分表示的参数估计的误差。 这两个问题带来的是,如何明确某个随机变量的分布,以及如何找到一个可以估计总体分布的样本。

 

这篇文章我没有严格的分章节叙述,只是在顺序,基于我自己的思考逻辑慢慢展开的,不管怎样,我相信,并不会有很多人会认真读完这篇文章,所以我也就不用不好意思了。哈哈。

抱歉!评论已关闭.