第五章抽样与抽样分布.pptx
- 文档编号:14142222
- 上传时间:2023-06-21
- 格式:PPTX
- 页数:38
- 大小:387.19KB
第五章抽样与抽样分布.pptx
《第五章抽样与抽样分布.pptx》由会员分享,可在线阅读,更多相关《第五章抽样与抽样分布.pptx(38页珍藏版)》请在冰点文库上搜索。
end统计学原统计学原理理主讲:
李晓辉主讲:
李晓辉南昌航空大学南昌航空大学1end第一节统计量第二节大数定律与中心极限定理第三节由正态分布导出的几个重要分布第四节常用的抽样方法第五节抽样分布第五章抽样与抽样分布2end第一节统计量第一节统计量统计量(statistic):
描述样本特征的概括性数字度量,根据样本数据计算的一个随机变量,是对总体分布特征推断的工具。
设X1,X2,Xn为总体X的样本,如果样本的函数g(X1,X2,Xn)是一个随机变量,并且不包含任何未知参数,则称g(X1,X2,Xn)为统计量。
3end几个常用的统计量:
1.样本均值样本均值:
2.样本方差样本方差:
3.3.样本标准差样本标准差:
4niiXnX11212)(11XXnSnii21)(11XXnSniiend第二节大数定律与中心极限定理一、大数定律大数定律(lawsoflargenumbers)也称大数法则,它是阐述大量同类随机现象的平均结果稳定性的规律。
5end辛钦大数定理设随机变量X1,X2,Xn相互独立,服从同一分布,且具有数学期望EXi=(i=1,2,n)则对任意0,有定律表明:
只要随机变量独立同分布,即使不存在有限方差,其数学期望仍可由n个随机变量的算术平均值作为其近似值。
611lim1niinXnPend二、中心极限定理在统计学中,论证随机变量和的极限分布是正态分布的一系列定理统称为中心极限定理(centrallimittheorem)。
7end独立同分布中心极限定理设设X1,X2,Xn是独立同分布的随机变是独立同分布的随机变量序列,且存在有限的数学期望量序列,且存在有限的数学期望EXi=和方差和方差DXi=2(i=1,2,n),那么当,那么当n时,时,中心极限定理为均值的抽样推断奠定了理中心极限定理为均值的抽样推断奠定了理论基础。
不论总体服从何种分布,只要论基础。
不论总体服从何种分布,只要期望和方差存在,对这一总体进行重复期望和方差存在,对这一总体进行重复抽样,当样本量充分大,样本均值就趋抽样,当样本量充分大,样本均值就趋于正态分布。
于正态分布。
8),(21nnNXnii),(2nNX或end棣莫佛拉普拉斯中心极限定理定理表明,当定理表明,当n很大,很大,np和和n(1-p)(n是试验的次数,是试验的次数,p是试验中事件是试验中事件A发生的概率发生的概率)也都不太小时,也都不太小时,二项分布二项分布可以用正态分布去近似。
可以用正态分布去近似。
9end第三节由正态分布导出的几个重要分布由样本统计量对未知总体分布进行推断,必须知道统计量所服从的分布。
本节介绍几个重要的常用统计量分布:
2分布,t分布,F分布。
10end一、分位数设X为随机变量,对给定的概率(10),若实数F满足不等式则称F为随机变量X分布概率为的上侧分位数。
若实数T/2满足不等式则称T/2为随机变量X分布概率为的双侧分位数。
11FXP|2TXPend标准正态分布的上侧分位数标准正态分布的上侧分位数Z0Z12end标准正态分布的双侧分位数标准正态分布的双侧分位数/2/2Z0-Z/2Z/213end设设X1,X2,Xn是取自标准正是取自标准正态总体的样本,则随机变量态总体的样本,则随机变量服从具有服从具有n个自由度的个自由度的2分布,记为分布,记为cc2-分布分布(2-distribution)14niiX122)(2nend不同自由度的不同自由度的cc2-分布分布cc22n=1n=4n=1015end1.变量值始终为正变量值始终为正2.通常为不对称的右偏分布,随着自由度的通常为不对称的右偏分布,随着自由度的增大逐渐趋于对称增大逐渐趋于对称3.期望期望E
(2)=n,方差,方差D
(2)=2n(n为自由为自由度度)4.可加性:
若可加性:
若U和和V为两个独立的为两个独立的2分布分布随机变量,随机变量,U2(n1),V2(n2),则则U+V服从自由度为服从自由度为n1+n2的的2分布分布cc2-分布分布性质和特点性质和特点16endt-分布(t-distribution)设设XN(0,1),Y2(n),且且X与与Y相互独相互独立,则称立,则称服从自由度为服从自由度为n的的t分布,记为分布,记为tt(n)17nYXt/endt分布与标准正态分布的比较分布与标准正态分布的比较t分布分布标准正态分布标准正态分布tt(df=20)t(df=10)z018endt分布的性质:
(1)与正态分布一样,是对称的,但比正态分布要平一些。
(2)自由度充分大时,t分布近似于正态分布。
自由度趋向无穷大时,t分布就是标准正态分布。
(3)t分布的均值为0,其方差为n/(n-2)。
19end设设X2(m),Y2(n),且且X与与Y相互独相互独立,则称立,则称服从自由度服从自由度m和和n的的F分布,记为分布,记为F-分布分布(Fdistribution)20nYmXF),(nmFFend不同自由度的不同自由度的F分布分布F(1,10)(5,10)(10,10)右偏分布右偏分布21end第四节常用的抽样方法通常有以下几种抽样方法:
简单随机抽样分层抽样系统抽样整群抽样多阶段抽样22end一、简单随机抽样对总体未作任何处理,按随机原则直接从总对总体未作任何处理,按随机原则直接从总体中抽出若干单位构成样本体中抽出若干单位构成样本.抽取样本的具体方法:
抽签法:
将总体中每个单位的编号写在外形完将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中任意抽选全一致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。
,签上的号码所对应的单位就是样本单位。
随机数表法:
将总体中每个单位编上号码,然将总体中每个单位编上号码,然后使用随机数表,查出所要抽取的调查单位后使用随机数表,查出所要抽取的调查单位。
仅适用于规模不大、内部各单位标志值差异仅适用于规模不大、内部各单位标志值差异较小的总体较小的总体直接抽选法23end先将总体按某一标志分层,然后从先将总体按某一标志分层,然后从各层中按随机原则抽取样本单位组成样各层中按随机原则抽取样本单位组成样本。
本。
二、分层抽样实质上是分组法与随机原则的结合。
例如,在居民生活水平调查中,先按职业例如,在居民生活水平调查中,先按职业分类,然后每种职业分别随机抽取部分居分类,然后每种职业分别随机抽取部分居民进行调查。
民进行调查。
24end样本在各层间的分配方法:
等比例分配法:
按各层单位的比例分配样等比例分配法:
按各层单位的比例分配样本单位。
本单位。
类型抽样的优点:
q能提高样本的代表性;q组织起来较为方便;25end先将总体各单位按某一标志排队,然后按固先将总体各单位按某一标志排队,然后按固定的顺序和间隔抽取样本单位。
又称机械抽定的顺序和间隔抽取样本单位。
又称机械抽样或样或等距等距抽样。
抽样。
三、系统系统抽样系统抽样是不重复抽样,适合于对单位数不多且能进行排序的总体抽样。
按无关标按无关标志排队志排队按有关标按有关标志排队志排队排序和所研究标志数值大小无关。
排序和所研究标志数值大小无关。
如调查居民生活水平时,按姓氏笔如调查居民生活水平时,按姓氏笔划排队。
划排队。
排序和所研究标志数值大小有密切排序和所研究标志数值大小有密切关系。
如居民收入调查,按银行存关系。
如居民收入调查,按银行存款多少排序。
款多少排序。
26end根据样本抽选的方法不同,可分为:
根据样本抽选的方法不同,可分为:
随机起点系统抽样半距起点系统抽样对称起点系统抽样(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)27end系统抽样的好处:
1.可以使抽样过程大大简化,减轻抽样的工作量;2.如果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。
按有关标志排队系统系统抽样,实际上是一种特殊的分层分层抽样。
28end将总体全部单位分为若干“群”,然后以群将总体全部单位分为若干“群”,然后以群作为抽样单位,从总体中抽取若干群作为样作为抽样单位,从总体中抽取若干群作为样本,并对中选群的所有单位进行全面调查。
本,并对中选群的所有单位进行全面调查。
例:
总体群数例:
总体群数R=16样本群数样本群数r=4样本容量样本容量简单、方便,能节省人力、物力、财简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差四、整群抽样ABCDEFGHIJKLMNOPDPIH29hipdnnnnnend五、多阶段抽样五、多阶段抽样某公司要进行全国性的产品售后服务满意度某公司要进行全国性的产品售后服务满意度调查时,通常是先抽几个省,然后从抽中的调查时,通常是先抽几个省,然后从抽中的省中抽取若干个城市,从抽中的城市中,再省中抽取若干个城市,从抽中的城市中,再抽取若干个县、村,最后再抽到户,这种抽抽取若干个县、村,最后再抽到户,这种抽样方式就是多阶段抽样。
样方式就是多阶段抽样。
30end第五节抽样分布第五节抽样分布一、抽样分布概念样本统计量取值的概率分布,叫抽样分布(samplingdistribution)。
是推断统计中用样本推断总体时的重要理论依据。
31end1.1.在重复选取容量为在重复选取容量为n的样本时,由样本的样本时,由样本均值的所有可能取值形成的概率分布均值的所有可能取值形成的概率分布2.2.推断总体均值推断总体均值的理论基础的理论基础二、样本均值的分布二、样本均值的分布32end=50=10X总体分布总体分布n=4抽样分布抽样分布xn=16总体服从正态分布总体服从正态分布N(,2),该总体的任何容,该总体的任何容量的样本均值量的样本均值x也服从正态分布,也服从正态分布,x的期的期望值为望值为,方差为,方差为2/n。
即。
即xN(,2/n)335x50x5.2xend从均值为从均值为,方差为,方差为2的一个任意总体中抽的一个任意总体中抽取容量为取容量为n的样本,当的样本,当n(30)充分大时,样充分大时,样本均值的抽样分布近似服从均值为本均值的抽样分布近似服从均值为、方差、方差为为2/n的正态分布的正态分布样本均值样本均值的抽样分的抽样分布趋于正布趋于正态分布态分布任意任意分布分布的总的总体体x34nxxend样本均值抽样分布与总体分布的关系样本均值抽样分布与总体分布的关系总体分布总体分布正态分布正态分布非正态分布非正态分布大样本大样本小样本小样本样本均值样本均值正态分布正态分布样本均值样本均值正态分布正态分布样本均值样本均值非正态分布非正态分布35end1.1.总体总体(或样本或样本)中具有某种属性的单位与中具有某种属性的单位与全部单位总数之比全部单位总数之比不同性别的人与全部人数之比不同性别的人与全部人数之比合格品合格品(或不合格品或不合格品)与全部产品总数之比与全部产品总数之比2.2.总体比例可表示为总体比例可表示为3.3.样本比例可表示为样本比例可表示为三、样本比例的分布三、样本比例的分布(proportion)36NNNN101或nnpnnp101或end1.1.在重复选取容量为在重复选取容量为n的样本时,由样本的样本时,由样本比例的所有可能取值形成的概率分布比例的所有可能取值形成的概率分布2.2.当样本容量很大时当样本容量很大时(np5和和n(1-p)5),样本比例的抽样分布,样本比例的抽样分布可用正态分布近似,即可用正态分布近似,即3.3.样本比例的分布样本比例的分布37nNp)1(,end四、样本方差的分布四、样本方差的分布1.1.在重复选取容量为在重复选取容量为n的样本时,由样本方的样本时,由样本方差的所有可能取值形成的概率分布差的所有可能取值形成的概率分布2.2.对于来自正态总体的简单随机样本,则比对于来自正态总体的简单随机样本,则比值值的抽样分布服从自由度为的抽样分布服从自由度为(n-1)的的2分分布,即布,即38)1()1(222nsn22)1(sn
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 抽样 分布
![提示](https://static.bingdoc.com/images/bang_tan.gif)