数据分析与R语言_002资料下载.pdf
- 文档编号:5968189
- 上传时间:2023-05-05
- 格式:PDF
- 页数:45
- 大小:1.30MB
数据分析与R语言_002资料下载.pdf
《数据分析与R语言_002资料下载.pdf》由会员分享,可在线阅读,更多相关《数据分析与R语言_002资料下载.pdf(45页珍藏版)》请在冰点文库上搜索。
两点分布,二项分布,泊松分布连续型分布:
均匀分布,指数分布,正态分布对于某一特定场景,其所符合的分布规律一般先验给出9DATAGURU专业数据分析网站2012.5.19两点分布10DATAGURU专业数据分析网站2012.5.19二项分布11DATAGURU专业数据分析网站2012.5.19泊松分布12DATAGURU专业数据分析网站2012.5.19均匀分布13DATAGURU专业数据分析网站2012.5.19指数分布14DATAGURU专业数据分析网站2012.5.19正态分布15DATAGURU专业数据分析网站2012.5.19R语言的各种分布函数16DATAGURU专业数据分析网站2012.5.19随机变量的数字特征期望(平均值)17DATAGURU专业数据分析网站2012.5.19随机变量的数字特征方差18DATAGURU专业数据分析网站2012.5.19总体与抽样大数定理与中心极限定理的意义常用统计量:
样本均值,样本方差,标准差,众数,最小值,最大值,分位数,中位数,上下四分位数19DATAGURU专业数据分析网站2012.5.19常见的数据描述性分析中位数median()百分位数quantile()20DATAGURU专业数据分析网站2012.5.19常见的数据描述性分析五数总括:
21DATAGURU专业数据分析网站2012.5.19常见的数据描述性分析正态性检验:
函数shapiro.test()P0.05,正态性分布22DATAGURU专业数据分析网站2012.5.19多元数据的数据特征方差与协方差、相关系数23DATAGURU专业数据分析网站2012.5.19协方差与相关系数计算函数cov()和cor()24DATAGURU专业数据分析网站2012.5.19相关性检验25DATAGURU专业数据分析网站2012.5.19相关分析与回归分析变量之间的关系函数关系:
有精确的数学表达式相关关系:
非确定性关系平行关系:
相关分析(一元,多元)依存关系:
回归分析(一元,多元)26DATAGURU专业数据分析网站2012.5.19相关分析的例子Iris数据集目测相关性plot(iris1,2)27DATAGURU专业数据分析网站2012.5.19相关分析的例子分离种属i1=iriswhich(iris$Species=setosa),1:
2plot(i1)28DATAGURU专业数据分析网站2012.5.19相关分析的例子求相关系数相关系数是否显著,不能只根据值的大小还需要进行假设检验29DATAGURU专业数据分析网站2012.5.19相关分析的例子相关系数显著性的假设检验假设r0为总体相关系数,r0=0则说明没有相关关系,建立假设H0:
r0=0,H1:
r00(alpha=0.05)计算相关系数r的t值和P-值30DATAGURU专业数据分析网站2012.5.19一元线性回归分析原理,最小二乘法步骤:
建立回归模型,求解回归模型中的参数,对回归模型进行检验例子数据:
身高-体重h=c(171,175,159,155,152,158,154,164,168,166,159,164)w=c(57,64,41,38,35,44,41,51,57,49,47,46)plot(wh+1)31DATAGURU专业数据分析网站2012.5.19一元线性回归分析自定义函数lxyb=lxy(h,w)/lxy(h,h)a=mean(w)-b*mean(h)a1-140.3644b11.15906作回归直线lines(h,a+b*h)32DATAGURU专业数据分析网站2012.5.19一元线性回归分析回归系数的假设检验建立线性模型33DATAGURU专业数据分析网站2012.5.19一元线性回归分析线性模型的汇总数据,t检验,summary()函数34DATAGURU专业数据分析网站2012.5.19一元线性回归分析汇总数据的解释Residuals:
参差分析数据Coefficients:
回归方程的系数,以及推算的系数的标准差,t值,P-值F-statistic:
F检验值Signif:
显著性标记,*极度显著,*高度显著,*显著,圆点不太显著,没有记号不显著35DATAGURU专业数据分析网站2012.5.19一元线性回归分析方差分析,函数anova()36DATAGURU专业数据分析网站2012.5.19一元线性回归分析预测:
一个身高185的人,体重大约是多少?
a+b*185174.061837DATAGURU专业数据分析网站2012.5.19lm()线性模型函数y1+x或yx均表示y=a+bx有截距形式的线性模型通过原点的线性模型可以表达为:
yx-1或yx+0或y0+x参见help(formula)38DATAGURU专业数据分析网站2012.5.19与线性模型有关的函数建立数据:
身高-体重x=c(171,175,159,155,152,158,154,164,168,166,159,164)y=c(57,64,41,38,35,44,41,51,57,49,47,46)建立线性模型a=lm(yx)求模型系数coef(a)(Intercept)x-140.364361.15906提取模型公式formula(a)yx39DATAGURU专业数据分析网站2012.5.19与线性模型有关的函数计算残差平方和(什么是残差平方和)deviance(a)164.82657绘画模型诊断图(很强大,显示残差、拟合值和一些诊断情况)plot(a)计算残差residuals(a)1234567-0.83495441.5288044-2.9262307-1.2899895-0.81280861.23282962.8690708891011121.27846782.6422265-3.03965293.0737693-3.721532240DATAGURU专业数据分析网站2012.5.19与线性模型有关的函数打印模型信息print(a)Call:
lm(formula=yx)Coefficients:
(Intercept)x-140.3641.15941DATAGURU专业数据分析网站2012.5.19与线性模型有关的函数计算方差分析表42DATAGURU专业数据分析网站2012.5.19与线性模型有关的函数提取模型汇总资料43DATAGURU专业数据分析网站2012.5.19与线性模型有关的函数作出预测z=data.frame(x=185)predict(a,z)174.0618predict(a,z,interval=prediction,level=0.95)fitlwrupr174.061865.986282.13739课后阅读:
薛毅书,p308,计算实例44DATAGURU专业数据分析网站FAQ时间45
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 语言 _002