欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    应用统计分析复习要点.docx

    • 资源ID:8859178       资源大小:956.25KB        全文页数:14页
    • 资源格式: DOCX        下载积分:3金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    应用统计分析复习要点.docx

    1、应用统计分析复习要点应用统计学复习要点(要求:每人携带具有开方功能的计算器)一、名词解释1.统计学收集、处理、分析、解释数据并从数据中得出结论的科学。2.方差分析 方差分析是通过分析数据的误差判断各总体均值是否相等,研究分类型自变量对数值型因变量的影响,分为单因素方差分析和双因素方差分析。3.假设检验假设检验是事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立。分为参数假设检验和非参数假设检验。一般采用逻辑上的反证法,依据统计上的小概率原理。4.置信区间置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence inte

    2、rval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。5.置信水平置信水平是指总体参数值落在样本统计值某一区内的概率。6.抽样分布抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。7.方差分析方差分析是通过分析数据的误差判断各总体均值是否相等,研究分类型自变量对数值型因变量的影响,分为单因素方差分析和双因素方差分析。8.相关分析相关分析(correlation analysis),相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相

    3、关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。9.推断统计推断统计是研究如何利用样本数据来推断总体特征的统计方法。包含两个内容:参数估计,即利用样本信息推断总体特征;假设检验,即利用样本信息判断对总体的假设是否成立。二、计算题1.在某地区随机抽取120家企业,按照利润额进行分组后结果如下:按利润额分组(万元)企业数(个)300以下19300400304005004250060018600以上11合计120 计算120家企业利润额的平均数和标准差(注:第一组和最后一组的组距按相邻组计算)。解答: 2.某银行为缩短顾客到银行办理业务等待的时间,准备了两种排队方式进行试验。为比较哪

    4、种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:5.56.66.76.87.17.37.47.87.8(1) 计算第二种排队时间的平均数和标准差。(2) 比较两种排队方式等待时间的离散程度。(3) 如果让你选择一种排队方式,你会选择哪一种?试说明理由。3. 某大学为了解学生每天上网的时间,在全校学生中随机抽取36人,调查他们每天上网的时间(单位:小时),得到的数据如下: 3.33.16.25.82.34.14.42.05.42.66.41.82.11.91.25.14

    5、.34.24.71.41.22.93.52.45.43.64.50.83.21.53.50.55.73.62.32.5求该校大学生平均上网时间的置信区间,置信水平分别为90%,95%和99%。(注:z(0.1)、z(0.05)和z(0.01)统计量值分别为1.65、1.96和2.58)4. 利用下面的信息,构建总体均值的置信区间。(1)总体服从正态分布,且已知=500,n=15,=8900,置信水平为95%。(注:z统计量值为1.96)(2)总体不服从正态分布,且已知=500,n=35,=8900,置信水平为95%。(注:z统计量值为1.96)(4) 总体不服从正态分布,未知,n=35,=89

    6、00,s=500,置信水平为90%。(注:z统计量值为1.65)(5) 总体不服从正态分布,未知,n=35,=8900,s=500,置信水平为99%。(注:z统计量值为2.58)5.对消费者的一项调查表明,17%的人早餐饮料是牛奶。某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。为验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐 饮用牛奶。在=0.05的显著性水平下,检验该生产商的说法是否属实?(注:z统计量值为1.96)6.一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为7.25小时,标准差为2.5小时。据报道,10年前每天每个家庭看电视的平均时

    7、间是6.7小时。取显著性水平=0.01,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?(注:z统计量值为1.96)7.下面是7个地区2000年的人均国内生产总值GDP(Y)和人均消费水平(X)的统计数据(注:此题对应的t统计量值为2.57):地区人均GDP(千元)Y人均消费水平(千元)XY-E(Y)X-E(X)(Y-E(Y)(X-E(X)(X-E(X)2(Y-E(Y)2北京22.4607.32610.2122.81028.6997.899104.276 辽宁11.2264.490-1.022-0.0260.0260.0011.045 上海34.54711.54622.2997.

    8、030156.76949.427497.226 江西4.8512.396-7.397-2.12015.6794.49354.722 河南5.4442.208-6.804-2.30815.7025.32546.300 贵州2.6621.608-9.586-2.90827.8738.45491.900 陕西4.5492.035-7.699-2.48119.0996.15359.281 合计85.739 31.609 263.84781.751854.751 (1) 计算相关系数,说明二者之间的关系。(2) 人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的

    9、实际意义。(3) 计算判定系数和估计标准误差,并解释其意义。(4) 检验回归方程线性关系的显著性。(=0.05)(5) 如果某地区的人均GDP为5千元,预测其人均消费水平。某地区的人均GDP为5 000元,预测其人均消费水平为2278.10657元(6) 求人均GDP为5千元时,人均消费水平95%的置信区间和预测区间。 人均GDP为5 000元时,人均消费水平95的置信区间为1990.74915,2565.46399,预测区间为1580.46315,2975.74999。8.随机抽取7家超市,得到其广告费支出(X)和销售额(Y)数据如下:(注:此题对应的t统计量值为2.57) 超市销售额(万元

    10、)Y广告费支出(万元)XY-E(Y)X-E(X)(Y-E(Y)(X-E(X)(X-E(X)2(Y-E(Y)2A191-23-7.143164.28651.020529B322-10-6.14361.42937.735100C4442-4.143-8.28617.1634D406-2-2.1434.2864.5924E5210101.85718.5713.449100F5314115.85764.42934.306121G54201211.857142.286140.592144合计29457447288.85710021 计算相关系数,说明二者之间的关系。r = 63.86/(6.424*11

    11、.964)=0.831广告费用支出作自变量,销售额作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。3 计算判定系数和估计标准误差,并解释其意义。4 检验回归方程线性关系的显著性。(=0.05)5 如果某超市的广告费用支出为5万元,预测其销售额。 据此进行计算(x为广告费)=37.13646 求广告费用支出为5万元时,超市销售额95%的置信区间和预测区间。三、论述题1.简述样本量与置信水平、总体方差、估计误差的关系。1. 估计总体均值时样本量n为2. 样本量n与置信水平1-、总体方差、估计误差E之间的关系为 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样

    12、本量越大; 与总体方差成正比,总体的差异越大,所要求的样本量也越大; 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。2.简述评价估计量的三个标准。(15分)1、无偏性:估计量抽样分布的数学期望等于被估计的总体参数 2、有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效 3、一致性:随着样本量的增大时,点估计量的值越来越接近被估总体的参数。3.简要说明残差分析在回归分析中的作用。(15分)残差是因变量的观测值y与根据估计的回归方程求出的预测值之差,它反映了用估计的回归方程去预测y而引起的误差。 4.简要误差分解的概念和基本原

    13、理。(15分)1.误差概念 :精确值与近似值之差称为误差,也叫绝对误差。 2.产生误差的主要原因 模型误差:在解决实际问题时,在一定条件下抓住主要因素将现实系统理想化的数学描述称为实际问题的数学模型,这种数学描述常常是近似的,数学模型与实际系统之间存在误差,这种误差称为模型误差。 观测误差:数学模型中往往含有一些由观测得到的物理量(如温度、电阻、长度)或由物理量估算出的模型参数,这些观测物理量或模型参数常常与实际数据存在误差。这种由观察产生的误差称为观测误差。 截断误差:数值计算中用有限运算近似代替无穷过程产生的误差。例如计算一个无穷次可微函数的函数值时,理论上只要能算出这个函数的泰勒级数值即可,但是实际工程上仅用泰勒级数中前面有限项来近似计算函数值,而舍去高阶无穷小量。这个被舍的高阶无穷小量正是截断误差。 舍入误差:计算中按四舍五入进行舍入而引起的误差或因计算机字长有限,数据在内存中存放时进行了舍入而引起的误差。误差分解指一个误差分配到几个变量上,这几个变量的误差各是多少。


    注意事项

    本文(应用统计分析复习要点.docx)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开