中心极限定理的内涵和应用.docx
- 文档编号:13990801
- 上传时间:2023-06-19
- 格式:DOCX
- 页数:23
- 大小:161.55KB
中心极限定理的内涵和应用.docx
《中心极限定理的内涵和应用.docx》由会员分享,可在线阅读,更多相关《中心极限定理的内涵和应用.docx(23页珍藏版)》请在冰点文库上搜索。
中心极限定理的内涵和应用
中心极限定理的内涵和应用
在概率论与数理统计中,中心极限定理是非常重要的一节内容,而且是概率论与数理统计之间承前启后的一个重要纽带。
中心极限定理是概率论中讨论随机变量和的分布以正态分布为极限的一组定理。
这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从于正态分布的条件。
故为了深化同学们的理解并掌握其重要性,本组组员共同努力,课外深入学习,详细地介绍
了中心极限定理的内涵及其在生活实践中的应用。
、独立同分布下的中心极限定理及其应用
在对中心极限定理的研究中,我们不妨由浅入深地来学习,为此我们先来
研究一下在独立同分布条件下的中心极限定理,即如下的定理1:
定理I(林德伯格-勒维中心极限定理)设〈Xn}是独立同分布的随机变量序
列,且E(XJf,Var(XJ「0存在,若记
n
、Xi_rP
Yn=
-*n
则对任意实数y,有
证明:
为证明
(1)式,只须证{Yn}的分布函数列弱收敛于标准正态分布。
由定理可知:
只须证{Yn}的特征函数列收敛于标准正态分布的特征函数。
为此,设Xn-•1的特征函数为「⑴,则Yn的特征函数为
又因为E(Xn」)=O,Var(Xn」)=「2所以有,0=0,「(0^-'2。
于是,特征函数(t)有展开式
t21
^(t)=<^0)+<^(0)+<^(0)=+o(t2)=1__ 22 从而有 n丄2 -t2t21丄 呱%⑴=nm1-亦+。 (〒)=e2 t 而e2正是N(0,1)分布的特征函数,定理得证 这个中心极限定理是由林德贝格和勒维分别独立的在1920年获得的,定理 告诉我们,对于独立同分布的随机变量序列,其共同分布可以是离散分布,也可以是连续分布,可以是正态分布,也可以是非正态分布,只要其共同分布的方差存在,且不为零,就可以使用该定理的结论。 定理1的结论告诉我们: 只有当n充分大时,Yn才近似服从标准正态分布N(0,1),而当n较小时,此种近似不能保证。 也就是说,在n充分大时,可用N(0,1)近似计算与Yn有关事件的概率,而n较小时,此种计算的近似程度是得不到保障 n2 的。 当Yn~N(0,1)时,则有7Xi~N(n^nc2),X~N(\) \=in 经过多方面的理论研究,我们可知定理1主要适用于以下两个方面;应用一: 求随机变量之和Sn落在某区间的概率(例如例2.)。 应用二: 已知随机变量之和Sn取值的概率,求随机变量的个数n。 在日常生活中,我们会发现其实有很多的例子均可用林德伯格-勒维中心极限定理来解决。 在此我们从中选择了几个典型而又带有新意的例子,仅供大家参考。 例1.用中心极限定理说明在正常的射击条件下,炮弹的射程服从或近似服从正态分布。 吐 解: 设a为理论射程,为实际射程,则=-a为实际射程对理论射程的偏差,显然=+a,故只需证〜,匚2)。 由于在实际射击中,有很多不可控制的随机因素在不断变化,所以造成了实际射程对理论射程的偏差,若设1: 射击时炮身振动引起的偏差,2: 炮弹外形差异引起的偏差,;: 炮弹内火药的成分引起的偏差,4: 射击时气流的差异引起 的偏差……,n: ……,显然有 n nyt =-i i=1 •••影响实际射程的因素是大量的, •••这里的n—定很大, 又•••炮身的振动、炮弹的外形、火药的成分、气流的变化…….这些因素之 间没有什么关系(或有微弱关系)。 •••由它们引起的1,2,……n可看做是相互独立的。 而正常的射击条件也就是对射程有显著影响的因素已被控制,所以1, 2,……n所起的作用可看做是同样微小。 •••由中心极限定理可知〜N(」,匚2)。 •••可正,可负且相会均等二p=0二〜N(0,二2) 则二a~N(a,二2) 从这个例子来看,虽然看上去有点复杂,但是我们还是很清晰地可以看到如果一个随机变量能表示成大量独立随机变量的和,并且其中每一个随机变量所起的作用都很微小,则这个随机变量服从或近似服从正态分布,这给我们的计算带来很大方便。 现在的旅游、汽车等行业越来越受欢迎,为了体现中心极限定理的重要性,我们不妨从现实生活中的热门行业说起,看看它到底起到怎样的重要性。 例2.某汽车销售点每天出售的汽车服从参数为■=2的泊松分布,若一年365天都经营汽车销售,且每天出售的汽车数是相互独立的,求一年中售出700 辆以上汽车的概率。 ⑴ 解: 设i为第i天出售的汽车的数量,贝U•二1■;-……「365为一年的总销量,由E(i)=Var(J=2,知E()=365X2=730 利用中心极限定理得 血700—730、 P(>700)=1-P(<700戶1—'(.730=1-: : 」(一1.11)=0.8665 从此例可以看出,中心极限定理揭示了离散型随机变量与连续型随机变量的内在关系,即离散型随机变量的极限分布是正态分布。 事实上,在现实生活中的很多方面,我们都能清晰地看到中心极限定理的存在。 那么在理论中,我们也可用它来解决一些比较抽象的问题,比如下面的极限求解问题。 ■■="a"--- 例3.利用中心极限定理证明: [1] k! n lim nIk=0 证明: 设{k}独立同分布且k〜P (1),k=1,2则a=Ek=l,-2=Vark=1 n •••由泊松分布的可加性知k〜P(n) kzi fn\nfn\nnk •-pH札兰n=送P送©r=瓦J"lk&yk=0li#yk=0k! 又•••由中心极限定理知: 1 =2n>: : •「屛nk …lim、—= 如果在林德伯格-勒维中心极限定理中,Xn服从二项分布,就可以得到以下的定理: 定理2(棣莫弗-拉普拉斯中心极限定理)设n重伯努利试验中,事件A在每次试验中出现的概率为p(0 2 且记丫;=Sn^£p,则对任意实数y,有||mP(Yn*兰y)=©(y)=丄re_2dtJnpq2兀皿 该定理是林德伯格-莱维中心极限定理的特殊情况,是最早的中心极限定理。 大约在1733年,棣莫弗对p=l证明了上述定理,后来拉普拉斯把它推广至p是 2 任意一个小于l的正数上去。 它表明,n充分大时,Y;='二np分布近似服从与标准正态分布,常称为Jnpq “二项分布收敛于正态分布”,正态分布是二项分布的极限分布,当n充分大时,我们可以利用该定理的结论来计算二项分布的概率。 由于此定理有更广泛的实际应用,我们将在下面的部分具体地分析棣莫弗-拉普拉斯中心极限定理在实际生活中的应用。 二、独立不同分布下的中心极限定理及其应用 前面我们已经在独立同分布的条件下,解决了随机变量和的极限分布问题。 在实际问题中说诸Xi具有独立性是常见的,但是很难说诸Xi是“同分布”的随机变量。 比如在我们的生活中所遇到的某些加工过程中的测量误差Yn,由于其 n 是由大量的“微小的”相互独立的随机因素Xi叠加而成的,即YnXi,诸Xi i3 间具有独立性,但不一定同分布。 在此,我们还要深入地研究在独立不同分布的前提下,各随机变量和的极限分布问题,目的是给出极限分布为正态分布的条件。 n 为使极限分布是正态分布,必须对£=7Xi的各项有一定的要求。 譬如若 i4 允许从第二项开始都等于0,则极限分布显然由Xi的分布完全确定,这时就很难得到什么有意思的结果。 这就告诉我们,要使中心极限定理成立,在和的各项中不应有起突出作用的项,或者说,要求各项在概率意义下“均匀地小”。 下面我们来分析如何用数学式子来明确表达这个要求。 设{Xn}是一个相互独立的随机变量序列,它们具有有限的数学期望和方差: E(XJ=叫,Var(XJ=「2,i=1,2,: n 要讨论随机变量的和YnXj,我们先将其标准化,即将它减去均值、除 id 以标准差,由于 E(Yn)二S匚(Yn)=.Var(Yn)=.7i2=2V, 且记二(Yn)=Bn,则Yn的标准化为Yn二1涪 Ani={XiBJ门={Xi-比|>^Bn}发生的可能性小,或直接要求其概 Bn 因为 就可保证Y;中各加项“均匀地小”。 上述条件 (2)称为林德伯格条件⑵o林德伯格证明了满足 (2)条件的和Yn的极限分布是正态分布,这就是下面给出林德伯格中心极限定理。 定理3(林德伯格中心极限定理)设独立的随机变量序列设{Xn}满足 (2) 林德伯格条件,则对任意的x,有 假如独立随机变量序列{Xn}具有同分布和方差有限的条件,则必定满足以 设{Xn}是独立同分布的随机变量序列,为确定起见,设诸Xi是连续随机变 量,其共同的密度函数为p(x),叫==;: .-.这时Bn-;「_n,由此得 ■: : 2一 因为方差存在,即Var(Xi)二(X」)p(x)dx, 所以其尾部积分一定有limf_(x-比)2p(x)dx=0,故林德伯格条 件满足。 林德伯格条件虽然比较一般,但该条件较难验证,因此在实际的应用中,我们都不怎么使用林德伯格中心极限定理。 在此情况下,为了使独立不同分布的中 心极限定理便于运用,我们深入研究了下面的李雅普诺夫(Lyapunov)中心极限定理。 我们之所以讲李雅普诺夫中心极限定理便于运用,是因为李雅普诺夫条件 比较验证,而且它只对矩提出要求,为我们的求解带来了极大的方便之处。 为此我们特地分一节内容来研究它,希望它的出现能引起我们的极大重视。 三、李雅普诺夫中心极限定理的特殊应用 定理4(李雅普诺夫中心极限定理)设{Xn}为独立随机变量序列,并且 EXk,Var(XQ二二20,(k=1,2,,n), 2*21n 记B;=送时,若存在6>0,满足lim沪E(Xk-柿2心)=0,则随机k-1n八「Bnk_1 n 变量之和'Xk的标准化变量Zn k二 函数Fn(x),对于任意的x满足 nn 2 时, BnZ「Jk近似地服从正态分布N(二「k,Bn)。 也就是说,无 kJkJ 论各个随机变量XJk=1,2,n)服从什么分布,只要满足定理条件,那么它们 n 的和7Xk,当n很大时,就近似地服从正态分布,这就是为什么正态随机变量 kd 在概率论中占有重要地位的一个基本原因。 在实际生活的很多问题中,所考虑的随机变量往往可以表示成很多个独立的随机变量之和。 例如: 在任一指定时刻,一个城市的耗电量是大量用户的耗电量的总和;一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往近似地服从正态分布。 在现实生活中,人们往往比较在意钱的花费,那么在器件价格预算方面,李雅普诺夫中心极限定理又有着怎样的神奇之处呢? 请看下面这例题。 例4•某种器件使用寿命(单位: 小时)服从指数分布,其平均使用寿命为20小时,具体使用时是一器件损坏后立即更换另一个新器件,如此继续,已知每个器件进价为a元。 试求在年计划中应为此器件作多少预算才可能有95%勺把握一年够用(假定一年有2000个工作小时)? ⑻ 解: 设第k个器件使用寿命为Xk,由于Xk服从参数为•的指数分布,且 111 E(Xi)=20,所以E(Xi),,那么,Var(XJ2=400。 九20九 假定一年至少准备n件才能有95%勺把握够用,k=1,2,…,n,X! X2,…,Xn, n 相互独立,记Yn-為Xi,由李雅普诺夫中心极限定理知P{Yn—200Q=0.95 n-4 所以.严0-20\=.(H-100),0.95。 查表得: nT°°十4』,伍。 20nUndn 所以,在年计划中应为此器件作118件预算才可能有95%勺把握一年够用 四、中心极限定理在二项分布中的特殊应用 由于二项分布在实际问题中有着大量的应用,因此在这些中心极限定理中,棣一拉中心 极限定理有着更重要的地位,它可以解决的问题类型也特别多。 如果在棣莫弗-拉普拉斯中心极限定理中,我们将二项分布看成是n个独立同分布的0—1分布的和,于是我们能得到下面的棣莫弗-拉普拉斯中心极限定理,即如下的两个定理: 设X~B(n,p),则 (1)局部极限定理 fn\1J5)2 当n较大时,P(X=k)=「pkqn」=e2npq ik丿J2兀npq (2) 积分极限定理 其中q=1一p,k二0,1,2,...n 该定理的具体应用主要有以下几个方面: 应用一: 导出贝努利大数定理。 应用二: 近似计算服从二项分布的随机变量在某范围内取值的概率。 应用三: 已知服从二项分布的随机变量在某范围内取值的概率,估计该范围(或 该范围的最大值)。 应用四: 与用频率估计概率有关的二项分布的近似计算。 这里主要阐述棣莫弗-拉普拉斯中心极限定理在现实生活中有关二项分布的应用问题。 在前面的学习中,我们已经知道了“二项分布的泊松近似”,即用泊松分布来作为相应的二项分布的近似。 在二项分布b(n,p)中,当n较大,而p又较小的情况下时,我们有以下的泊松定理。 定理5(泊松定理)在n重伯努利试验中,记事件A在一次试验中发生的概率为Pn(与试验次数n有关),如果当nT时,有nPnt人,则 而在二项分布b(n,p)中,当n较大,p又不小时,且当p处在np5和n(1-p)时,则用正态分布近似比较好,这就用到了棣莫弗-拉普拉斯中心极限定理。 棣莫弗-拉普拉斯中心极限定理在各个方面都有着广泛的应用,尤其是在管理中也有着不小的应用,请看下面的这例题: 例5.水房拥挤问题: 假设绍兴文理学院要建新校区,里面有学生5000人, 只有一个开水房。 由于每天傍晚打开水的人较多,经常出现同学排长队的现象,为此校学生会特向后勤集团提议增设水龙头。 假设后勤集团经过调查,发现每个学生在傍晚一般有1%的时间要占用一个水龙头,现有水龙头45个,现在总务 处遇到的问题是: (1)未新装水龙头前,拥挤的概率是多少? (2)至少要装多少个水龙头,才能以95%以上的概率保证不拥挤? 旦 分析: 首先,我们先设5000个学生中占有水龙头的人数为随机变量X,未新装水龙头前,拥挤的概率为p。 因为题中占有水龙头的人和人之间是独立的,而且占用水龙头的概率都一样为0.01。 因此比较容易看出,此题中的X是服从 二项分布的,所以我们可用二项分布的方法将p的具体值求出来,即有了下面的解法一: 解法一: (1).因为X~B(5000,0.01),所以有 PX二k二: 0000.01k(0.99)5000上,其中k=0,1,2,...5000, 于是有 KK£「5000、k5000A p=p(©>45)=1—P(0E©兰45)=1丄0.010.99 心Ik丿 (2).欲求m,使得P(0一_m)_0.95,贝U m'‘5000]k5000A'‘5000]05000 工0.01k0.99-0.0100.99X0.95 k£Ik丿10丿 这种方法可以把p和m的具体值求出来。 但是,用这种方法做这道题的时候,在求X等于某一个值的时候都比较困难,更何况求上千个呢,所以这种方法理论上可以,但是实际上是行不通的。 当二项分布不好求时,我们还学过用泊松分布来近似,因为泊松分布是有表可查的,那么这道题可不可以用泊松分布来近似呢? 应该说是不可以的,因为二 项分布去近似泊松分布的时候,要求二项分布中的n要比较大,p要比较小,而 且np也要不大,而本题中,np=50,显然是太大了,所以用泊松分布近似是行不通的。 那么现在再让我们看看中心极限定理,它是可以用来近似二项分布b(n,p) 的,只要该二项分布中的n较大,p又不小时,且当p处在叩5和n(1-p)•5时,就可以用正态分布来近似。 而这里,叩=50,n(1-p)=4950,均满足中心极限定理的条件,故有了下面的解法二: 解法二: (1).设同一时刻,5000个学生中占用水龙头的人数为X,贝U X〜B(5000,0.01) 拥挤的概率是 ;5〔5000]k5000上 P=P(©a45)=1—P(0兰©兰45)=1正0.010.99 kdlk丿 由棣莫弗一拉普拉斯中心极限定理,n=5000,p=0.01,q=0.99, np=50,npq=7.04 故 ▲45—50丄0—50ii P(0__45)=()-()=(-0.71)-(-7.1)=0.2389 7.047.04 即拥挤的概率为 P(.45)=1-0.2389=0.7611 (2).欲求m使得P(0__m)_0.95,贝U由棣莫弗一拉普拉斯中心极限定理 可知,(心°)_(0如)_0.95 7.047.04 由于(0吗=(一7.09): 0 7.04 即(m凹)_0.95 7.04 查表得匹旦_1.645 7.04 即m_61.6 故需装62个水龙头,才能以95%以上的概率保证不拥挤。 从这一题中,我们可明显地看出中心极限定理在实际应用中起到很重要的作用,尤其是棣莫弗-拉普拉斯中心极限定理能很好地处理好二项分布中的近似计算问题。 正所谓“人有旦夕祸福,月有阴晴圆缺”,我们生活在这世上并总不是那么一帆风顺的,因此很多人都想去买保险,为的只是以防万一。 而很多年长的人,也会选择去买养老保险。 那么我们是不是很想知道中心极限定理在保险方面的应用呢? 请看以下这道例题: 例6.某保险公司有2500个人参加保险,每人每年付1200元保险费,在一 年内一个人死亡的概率为0.002,死亡时其家属可向保险公司领得20万元。 问: (1)保险公司亏本的概率有多大? (2)保险公司一年的利润不少于1010万元,200万元的概率各为多大? [3] 分析: 首先,我们先设一年内死亡的人数为随机变量X,保险公司亏本的概 率为P。 因为题中人和人之间是独立的,而且死亡的概率都一样为0.002,因此 比较容易看出,此题中的X是服从二项分布的,我们也可用二项分布的方法把p 具体地求出来,但要想求出P(X=k)=丨25000.OO2k(O.998)2500」绝非易事,更何lk丿 况还要算上几千个呢? 为此我们不妨用中心极限定理来求解它。 解: 设X为一年内死亡的人数,则X~B(2500,0.002),np=5,np(1一p^1.99 (1)由棣莫弗一拉普拉斯中心极限定理知 _155 P(亏本)=P(20X・300)=P(X15)=1-P(X_15): 1-()=1-(4.48) V4.99 =1-0.99993=0.00007 所以,保险公司亏本的概率为0.00007,几乎为0。 (2)由棣莫弗一拉普拉斯中心极限定理知 10—5 P(禾I」润—100)=p(300—20X_100)=P(X乞10): ()=0.98 5-5 P(利润一200)二P(300-20X_200)=P(X岂5): ()=0.5 J4.99 以上结果说明,保险公司几乎不可能亏本.不过,关键之处是对死亡率的估计必须正确,如果所估计的死亡率比实际低,甚至低得多,那么,情况就会不同. 五、中心极限定理与切比雪夫不等式的联系与区别 前面我们已经学过了切比雪夫不等式,为了更好地与中心极限定理相比较,我们先来熟悉一下何为切比雪夫不等式。 切比雪夫不等式: 设随机变量X具有有限期望」和方差Var(X),则对与任意正数;,有如下的不等式成立 P(|X-亠|一;)乞Var[X)。 名 从上述切比雪夫不等式的定义可知,它和中心极限定理一样,都可以对所求的问题进行适度地估计,而且切比雪夫不等式和中心极限定理都要用到变量的期望■与方差Var(X)。 但不同的是,切比雪夫不等式在应用中,是在随机变量X 的分布未知的情况下,只利用X的期望与方差,即可对X的概率分布进行估值,但往往这种情况下估出来的值是粗糙的。 而中心极限定理在生活中的应用则是对于相互独立的随机变量序列{Xn},不管Xi(i=1,2,...,n)服从什么分布,只要它们是服从同一分布,且有数学期望和方差,那么,当n充分大时,这些随机变量之 n 和VXi就近似地服从正态分布NL»2)。 为了加深对它们的理解,请先看以下 id 这道例题: 例7.假设电站电网有10000盏电灯,夜晚每一盏灯开灯的概率都是0.7,而假定开关之间彼此独立,估计夜晚开着的灯数在6800与7200之间的概率。 旦 分析: 首先,我们先设夜晚开着的灯数为随机变量X,夜晚开着的灯数在6800与7200之间的概率为P。 因为题中灯和灯之间是独立的,而且开着的概率都一样为0.7,因此比较容易看出,此题中的X是服从二项分布的,所以我们可用二项分布的方法将P的具体值求出来,但是根据第四部分的分析,我们可知算一个P(X=k)=100000.7k(0.3)10000上就很困难,那么如果要算3999个这样的值是不 lk丿 是显得不太实际呢? 仔细观察这题的问题,不难发现,最后所求的区间是关于随机变量X的数学期望EX对称的区间,而且是要估计最后的结果,因此我们可以用切比雪夫不等式来估计。 我们都知道,切比雪夫有着一个重要的不等式,即 P|X-E(X): : : |;_1-Var[X),所以有着下面的解法一: : z 解法一: 因为X~B(10000,0.7),所以 E(X)=10000*0.7=7000,Var(X)=10000*0.7*0.3=2100,因此,根据切比雪夫不等式,有 p二P(6800: : X: : 7200)=P(|X-7000|: : 200)-120.9475 200 因此由切比雪夫不等式估计出的最后结果为p[0.9475,1],区间长度较短, 结果较好。 切比雪夫不等式估计出来的结果是比较好,但是这还只是估计出结果属于的 区间,到底结果是多少还是不知道。 要想知道具体结果是什么,还是用中心极限 定理来研究比较简单。 根据棣莫弗-拉普拉斯中心极限定理的积分极限定理,我们可知例题的条件符合它,为此我们有如下的解法: 解法二: 因为X~B(10000,0.7),所以根据积分极限定理有, /(4.37)-忙-4.37)=2叫4.37)T, 据标准正态分布函数表,有4.37二0.999993788,所以 p=P(6800X7200)-20.999993788-1二0.999987576 从这一题中,我们可明显地看出切比雪夫不等式和中心极限定理在处理二项分布中的近似计算问题时都有着极其强大的功能。 但是相比于切比雪夫
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中心 极限 定理 内涵 应用