回归分析影响公共交通工具的因素.docx
- 文档编号:15716769
- 上传时间:2023-07-07
- 格式:DOCX
- 页数:10
- 大小:103.93KB
回归分析影响公共交通工具的因素.docx
《回归分析影响公共交通工具的因素.docx》由会员分享,可在线阅读,更多相关《回归分析影响公共交通工具的因素.docx(10页珍藏版)》请在冰点文库上搜索。
回归分析影响公共交通工具的因素
WEIHUAsystemofficeroom【WEIHUA16H-WEIHUAWEIHUA8Q8-WEIHUA1688】
logistic回归分析影响公共交通工具的因素
logistic回归分析影响公共交通工具的因素
1.绪论
鉴于交通工具是我们出行中必不可少的一部分,而随着科技的发展与进步,交通方式愈加趋向于多元化,人们可以选择的交通工具也多种多样,新的交通工具带来便利的同时,也不可避免的给我们带来了一些问题。
不同社会地位的人所选择的交通工具的原因与其本身的内在因素以及外部条件相关。
不同的年龄,性别,收入都是影响人们交通方式的重要因素。
应用Logistic回归的原理和计算方法,并利用在公共交通调查数据在一次关于公共交通的社会调查中,年龄,月收入,性别与是乘公共汽车上下班还是骑自行车上下班的资料,采用Logistic回归方法,进行假设检验,对影响的因素进行分析。
建立Logistic回归模型,更加明确因变量与自变量之间的关系。
2.Logistic回归理论
logistic回归的因变量可以是二分类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释。
所以实际中最为常用的就是二分类的logistic回归。
由于Y取值非0即1,如设Y取1的概率为P,则它取0的概率为Q=1-P。
第i个观察对象的发生概率比数(odds)为
称为发生比,是发生概率与不发生概率的比。
发生概率取对数称为LOGIT变换。
回归系数的解释,β,i表示xi改变一个单位时,logitP的平均变化量。
相对危险度:
RR=P1/P2
比数:
Odds=P/(1-P)
比数比:
OR=
对比数比取自然对数得到关系式:
β的意义是在其他自变量固定不变的情况下,自变量X的水平没改变一个测量单位时所引起的比数比的自然对数改变量。
或者说,在其他自变量固定不变的情况下,当自变量X的水平每增加一个测量单位时所引起的比数比为增加前的
倍。
Logit回归模型实质是求一种概率的估计,将某种概率与一个线性模型联系起来。
三.实例
原始数据
因变量y=1表示乘坐公共汽车,y=0表示骑自行车。
自变量x1是年龄,作为连续变量;x2是月收入,x3是性别,x3=1表示男性,x3=0表示女性,调查对象为工薪族群体。
表1公共交通社会调查
序号
年龄x1
月收入x2
性别x3
交通y
1
18
850
0
0
2
21
1200
0
0
3
23
850
0
1
4
23
950
0
1
5
28
1200
0
1
6
31
850
0
0
7
36
1500
0
1
8
42
1000
0
1
9
46
950
0
1
10
48
1200
0
0
11
55
1800
0
1
12
56
2100
0
1
13
58
1800
0
1
14
18
850
1
0
15
20
1000
1
0
16
25
1200
1
0
17
27
1300
1
0
18
28
1500
1
0
19
30
950
1
1
20
32
1000
1
0
21
33
1800
1
0
22
33
1000
1
0
23
38
1200
1
0
34
41
1500
1
0
25
45
1800
1
1
26
48
1000
1
0
27
52
1500
1
1
28
56
1800
1
1
程序与分析
程序
datasasa;
inputnx1x2x3y;
datalines;
11885000
221120000
32385001
42395001
528120001
63185000
736150001
842100001
94695001
1048120000
1155180001
1256210001
1358180001
141885010
1520100010
1625120010
1727130010
1828150010
193095011
2032100010
2133180010
2233100010
2338120010
2441150010
2545180011
2648100010
2752150011
2856180011
;
proclogisticdata=sasadesending;
modely=x1x2x3/selection=stepwise;
Run;
运行结果分析
输入数据信息
Logistic回归方程log(odds)默认的形式是处理那个变量值比较小的,由运行结果可以看得出,因变量y取值的排列顺序是从大到小,所以第一个可能概率模型为y=1。
引入变量
给出了自变量进入模型的次序。
先是截距项Step0了,step1x3第一个进入模型,附带了很多评估它对因变量预测能力的指标。
-2LogL和Score用来检测自变量是否显着。
-2LogL中的L就是LikelihoodRatio,它的p值是,Score的p值是,wald的p值为,都小于,故x3是一个很显着的解释变量。
AIC和SC两个信息量标准用来比较不同的模型,它们数值越小,模型变现就越好,step2x1变量进入模型后的情况,模型的情况变化不大,step2x1变量移除模型后的情况比step2的情况好,AIC和SC的值变小了,-2LogL和Score对应的p值也更小。
模型的总体检验
由运行结果可以看出,p<,所以模型有较好的拟合效果。
参数检验以及几个描述性统计量、参数OR值,以及95%置信区间
给出了模型参数的估计,据此可以写出改回归方程的形式是
log(p/(1-p))=。
概率为
X3为性别,结果显示其回归系数b=,P值为,表明在控制其他因素不变的情况下,性别对使用公共交通工具有负面影响。
OR(X3)=,表示消除其他影响后,男性乘坐公共汽车是女性的倍,女性乘坐公共汽车的人多
95%置信区间为[,]
4.结论
二分类logistic回归法分析公共交通社会调查,我们发现乘坐公共汽车与年龄,月收入关系不显着,女性乘坐公共汽车的人数多于男性,男性骑自行车的人数多于女性,于此看出,男性群体普遍热爱运动,女性大众也应多骑自行车,有利于身体健康。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 影响 公共交通 工具 因素
![提示](https://static.bingdoc.com/images/bang_tan.gif)