脑卒中发病环境因素分析及干预模型探讨.docx
- 文档编号:7954522
- 上传时间:2023-05-12
- 格式:DOCX
- 页数:26
- 大小:475.87KB
脑卒中发病环境因素分析及干预模型探讨.docx
《脑卒中发病环境因素分析及干预模型探讨.docx》由会员分享,可在线阅读,更多相关《脑卒中发病环境因素分析及干预模型探讨.docx(26页珍藏版)》请在冰点文库上搜索。
脑卒中发病环境因素分析及干预模型探讨
脑卒中发病环境因素分析及干预模型探讨
摘要
本文对我国某城市各家医院的脑卒中发病病例信息及相应期间当地的逐日气象资料进行了统计分析,主要采用多元逐步回归方法,建立了气温、气压和相对湿度对脑卒中发病的多元线回归模型,并对模型进行了检验,最终得到了脑卒中发病率与气温、气压和相对湿度之间的关系。
针对问题一,我们根据病人基本信息,用Excel软件对数据进行了统计分析,得到了2007年到2010年不同职业和不同年龄段的发病人数。
分析表明:
随着年龄的增加,脑卒中的发病率也随之增加,其中老年的发病率高达59.16%;职业不同,发病率也不同,农民的发病率为47.87%约占总人数的一半;同时得出男性发病率比女性高。
针对问题二,本文通过分析题中附件中所给的数据,利用MATLAB软件工具箱,作出脑卒中发病率与气温、气压、相对湿度的散点图,再对图形进行拟合,建立了多元逐步回归模型,解决了脑卒中发病率与环境因素之间的关系分别成负相关、正相关、负相关。
针对问题三,我们查阅相关资料,得到对应结论,对高危人群提出的预警是针对职业为农民和处于老年年龄段的人群在春季定期到医院检查血压、血糖、降低血脂和治疗疾病;干预的建议方案:
平衡膳食结构;减轻心理社会因素对血压的影响;有效降压治疗;充分利用社区医疗资源,通过建立健康档案,有助于了解每个居民的生活习惯,健康状况,及时掌握居民的疾病动态;通过健康教育,使人们认识到高血压、糖尿病、高血脂等疾病为脑卒中的可控危险因素,并意识到危险因素长期存在的危害性。
此模型很好的体现了影响脑卒中发病率与环境因素之间的关系,具有较强的规律性,并且能够推广到空气质量好坏受环境因素的影响,暴雨的提前预警,未来人口预测等。
关键词:
脑卒中发病率环境因素多元回归模型MATLABExcel软件
一、问题重述
脑卒中(俗称脑中风)是目前威胁人类生命的严重疾病之一,它的发生是一个漫长的过程,一旦得病就很难逆转。
这种疾病的诱发已经被证实与环境因素,包括气温和湿度之间存在密切的关系。
因此,有必要了解影响脑卒中患者发病的环境因素及发病机制,为提出综合的干预措施提供依据。
数据(见Appendix-C1)来源于中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息以及相应期间当地的逐日气象资料(Appendix-C2)。
我们根据题目提供的数据,主要解决以下问题:
1.根据病人基本信息,对发病人群进行统计描述。
2.建立数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系。
3.查阅和搜集文献中有关脑卒中高危人群的重要特征和关键指标,结合1、2中所得结论,对高危人群提出预警和干预的建议方案。
二、问题分析
脑卒中发病环境因素分析主要是研究在2007-2010年期间,气温、气压及相对湿度与脑卒中发病率之间的关系,以及与此相关的其它指标。
因此要对发病环境因素分析,就先要分析清楚各种影响因素的变化规律,然后才能根据各种环境因素对发病率的影响情况,由它们之间的模型关系对未来人群提出预警与干预。
根据题目信息分析,发现脑卒中发病率主要与气温、气压、相对湿度、职业、年龄和性别等因素有关。
由附录Appendix-C1和Appendix-C2中的数据分析以上因素对发病率的影响。
通过查阅和搜集有关高危病人的重要特征和关键指标,以及根据这4年所给数据的统计分析,使用多元逐步回归进行分析建立脑卒中发病率与气温、气压和相对湿度之间的函数关系。
最后对脑卒中高危人群提出合理的预警及干预方案,并将模型推广到生活中,比如GDP的增长,环境污染对空气质量的影响等。
三、模型假设
1.表中数据客观真实,具有可靠性。
2.问题的求解只考虑气温、气压和相对湿度三个基本因素。
3.假设除去少数异常点外其余所给数据真实。
4.将年龄段划分为婴儿、幼儿、儿童、少年、青年、中年、老年和其它[6]。
5.使用气象学上通常所用的阳历记数(即3、4、5月为春季,6、7、8月为夏季,9、10、11月为秋季,12月与次年1、2月为冬季)。
6.假设患脑卒的病人在统计过程中没有死亡。
7.将年龄和职业代号缺失的病人基本信息记作其它。
8.假设统计时所在城市的总人数不变。
四、符号说明
1.
:
发病率
2.
:
回归参数;
3.
:
表示在压强影响下各年第
月份总和的平均压强;
4.
:
表示在温度影响下各年第
月份总和的平均温度;
5.
:
表示在相对湿度影响下各年第
月份总和的平均相对湿度;
6.
=1,2,、、12。
五、模型的建立与求解
问题一
1.本文首先通过Excel对题中给出数据进行统计分析及处理,分别得出不同月份、不同职业、不同年龄段以及男女的发病人数,并计算出了与之对应的发病率[5](发病率是表示在一定期间内,一定人群中某病新发生的病例出现的频率。
是反映疾病对人群健康影响和描述疾病分布状态的一项测量指标)。
具体公式如下:
分子是某时期(年度、季度、月份)内的新发病人数,暴露人口是指观察地区内可能发生该病的人群,对那些不可能再发生该病的人(如已经感染了传染病或因预防接种而获得免疫力的人),理论上不应计入分母内,但实际工作中却难以把这部分人分辨出来。
当描述某地区的某病发病率时,分母多以该地区该时间内的平均人口,这时应注明分母是平均人口。
如观察时间以年为单位时,可为年初人口与年终人口相加再除以2,或以当年年中(7月1日零时)的人口数表示。
2.根据附件Appendix-C1中的数据,用Excel软件进行统计整理得到2007-2010年每月份的发病人数。
如下表:
表1-12007-2010年每月份的发病人数
2007年
2008年
2009年
2010年
合计
一月
934
1827
906
1761
5428
二月
732
1954
847
1491
5024
三月
1019
1918
815
1730
5482
四月
1049
1759
860
1686
5354
五月
1052
1771
874
1882
5579
六月
1022
1495
794
1616
4927
七月
1012
1495
913
1754
5174
八月
1197
1376
921
1687
5181
九月
1221
1282
833
1638
4974
十月
1375
1472
758
1724
5329
十一月
1209
1377
666
1570
4822
十二月
1370
1321
802
1078
4571
根据表1-1中的数据可以得出平均每月发病人数占总发病人数的比值,用Excel软件绘出柱形图,如下图:
图1-12007-2010年平均每月发病人数占总发病人数的比值
由图1-1我们可以直观的看出,4年中每月的发病人数既有上升也有下降,由此很难得到相关规律,因此利用我们对季度的划分,得到不同季度发病人数占总人数的比值。
如图1-2:
图1-2不同季度发病人数占总发病人数的比
由图知,随着春夏秋冬季节的变化,发病人群出现下降趋势,可以说明气温对脑卒中发病率有一定的影响。
由于春季为头一年的12月与次年的1、2月,温度比较低;夏季为3、4、5月,温度比较适中。
说明温度低对脑卒中发病率的影响比较大。
3.根据附件Appendix-C1中的数据,用Excel软件进行统计整理得到2007-2010年不同职业的发病人数。
如下表:
表1-22007-2010年不同职业的发病人数
职业
农民
工人
退休人员
教师
渔民
医务人员
职工
离退人员
其它
人数/人
29605
4731
6896
229
130
93
612
1632
17917
图1-3不同职业的发病人群数占总数的比值
由表和图知,农民的发病人群数远远高于其它职业,可以预测部分农民由于忙碌对自己的身体健康状况不够关注。
4.不同年龄阶段的发病人数统计如下表
表1-32007-2010年不同年龄段发病人数
年龄阶段
婴儿
幼儿
儿童
少年
青年
中年
老年
其它
发病人数/人
0
12
6
12
643
13866
36588
10718
根据表1-3的数据我们使用Excel软件求出不同年龄阶段的发病人数占发病总人数的比值,得到相应的柱形图如图1-4.
注:
婴儿—[0,1)幼儿—[1,6)儿童—[6,12)少年—[12,18)青年—[18,40)
中年—[40,65)老年—[65,110)其它—(不包含上述年龄段)
图1-4不同年龄阶段发病人群数占总发病人数数的比值
我们对得到的柱形图进行分析发现,随着年龄的增长,发病人数就增加。
其中,老年的发病人数最高。
可以推测年龄越高,发病率越大。
5.最后,我们对发病人群的男女比例进行了统计,得到了表1-4和图1-5
表1-42007-2010男女分别得发病人群
男(人)
女(人)
合计(人)
2007年
7122
6070
13192
2008年
10283
8764
19047
2009年
5393
4596
9989
2010年
10592
9025
19617
图1-5男女发病人数分别占总人数的百分比
我们可以得到,男性发病率高于女性发病率。
即男性比女性更容易患脑卒中。
问题二
1.模型的建立
根据附件Appendix-C1所给数据,利用Excel2003软件工具箱进行统计分析,得出2007年—2010年四年中平均气温、平均气压和平均相对湿度在各月份的平均数据和在四年中各月份的平均气温、平均气压和平均相对湿度的数据(见附录1),利用MATLAB工具作出四年每个可能影响因素与脑卒中发病率的散点图,如图2-1、图2-2和图2-3(程序见附录2,3,4)
图2-12007年——2010年平均温度对发病率的散点图
图2-22007年——2010年平均压强对发病率的散点图
图2-32007年——2010年平均相对湿度对发病率的散点图
分析图2-1,图2-2,图2-3可以得出脑卒中与温度、湿度及压强的平均值存在线性关系
2、模型的求解
2.1、建立多元线性回归模型:
利用MATLAB软件求解,得表2-1(程序见附录5):
表2-1
参数
参数估计(
)
置信区间(
)
00.9738
-0.0009
-0.009
0.0008
由表2-1可得如下模型:
由表2-1对模型分析可知R2=0.2670,F=0.9713,
=0.4525,拟合度很低,由此,需对模型进行改进。
2.2、建立多元交互影响回归模型:
利用MATLAB软件求解,得表2-2(程序见附录6):
表2-2
参数
参数估计值(
)
置信区间(
)
26.6523
-0.0261
0.0451
-0.3625
-0.0001
0.0004
0.0001
由表2-2可得如下模型:
由表可知,R2=0.7702,F=2.7934,
=0.1397,拟合度很低,由此,不得不对模型进行改进。
3、模型的改进
3.1由于本题是多元线性回归模型,在Excel2003软件中,对本题中的三个自变量,平均气压、平均温度及相对湿度与脑卒中发病率进行相关性分,分析表明三自变量与脑卒中发病率相关性较好,可以利用Excel2003中的回归分析工具建立回归模型,并得出“归统计表、“方差分析”和“回归结果”3张表
图3-1
3.2、利用Excel回归分析工具建立回归模型(详细过程参考文献[2],315页-322页)
3.2.1本题中,MultipeR(相关系数)的值为0.99883786和RSquare(判定系数r2)的值为0.99776819,都非常接近1,所以可以判定变量平均温度、压强及相对湿度与自变量发病率y有较强的关系,标准误差相对于变量的取值也较小,说明回归方程比较可靠。
在方差分析表“图-2”中,通过分析残差平方和在总的离差平方和中所占比重来判段拟合结果的优劣,也可以通过计算F统计量进行显著性判断,这里的方差分析基本假设是回归系数为零,H0:
r=0。
本题中,残差平方和只占总的离差平方和的比例不到10%。
F统计量的值为1341.579,远远大于F临界值,因此拒绝r=0的原假设,即认为数据间存在明显的相关,从显著性分析(SignificanceF)也可以看出原假设成立的概率非常小。
在两个自变量的线性拟合图中,可以看到人口、经销商数两个自变量对销售总额变量的线性拟合程度都很好,预测值和实测值基本重合,如图所示
图3-2回归分析结果
回归分析的目的是找出变量与自变量之间准确的数学关系式,残差分析和拟合分析的作用在于判断通过运算得到的回归方程的可靠性。
回归方程由截距和斜率表示,这组参数列在图3-1的第3张表中。
根据本例的运算结果,可以得到回归方程为:
图3-1第3张表除了给出线性方程的回归参数外,还计算了每个参数的标准误差、T统计量、概率值和在给定置信区间下的估值区间。
3.2.2、“残差分析”的输出结果如图3-3所示。
在残差分析表中,对于每个实测值给出了按回归方程计算的预测值和预测值与真实值直接的残差、标准残差。
图3-4
总的看来,残差的值相对较小,说明回归方程可靠。
由于本案例在回归选项中选中了“标准残差”,因此表中显示出标准残差。
标准残差等于每个残差与总残差均值的差,然后除以残差的标准差。
通过残差图能直观地看出残差的分布情况,如果残差图上残差的分布是随机上网,则说明回归预测的系统偏差小,本案例生成的残差图如图3-4所示。
图3-5
3.2.3、“概率分析”的输出结果如图3-5所示。
概率分布式按照百分比排位列出实测值,并将实测值和百分比排位为数据源绘制散点图,以此说明数据的线性特征。
图3-6
如图所示,可以看出实测值良好的线性。
此外,还可以在概率图中添加线性区域先,观察实测数据点与趋势线的相互位置关系,判断拟合程度。
3.3.1、
平均温度、压强差及相对湿度与自变量发病率的关系:
重复3.2程序,将压强列数据替换为压强差数,最后可得MultipeR(相关系数)的值为0.999031和RSquare(判定系数r2)的值为0.998064,都非常接近1,所以可以判定变量平均温度、压强差及相对湿度与自变量发病率y有较强的关系,标准误差相对于变量的取值也较小,说明回归方程比较可靠。
可得到发病率与平均温度、压强差及相对湿度的关系模型如下(运行结果见附录
由此模型可知压强差对发病率的影响极大,同时明显改变相对湿度的回归系数,这两因素对发病率存在交互影响。
问题三
阅资料和上网搜索文献分析得出有关脑卒中高危人群的重要特征和关键指标,通过1、2问数据的统计分析得出环境、职业、年龄、性别和患病史都将在不同程度上影响脑卒中患病率。
将环境因素又细分为气温、气压、相对湿度对发病率的影响;将职业因素考虑1问中的所有因素,因为我们在前面已经由统计数据知道40岁以下患脑卒中的人数较少,患病人群主要集中在老年、中年;同时性别比例也已求出(见一问表格);患病史的有无也是一个检测的指标,因为考虑到这些因素影响程度不同,所有层次分可以很好地解决这一问题。
六、模型的评价与推广
6.1优点
(1)模型的适用范围广,易于推广,模型对生活中的其它现象(如空气质量好坏受环境因素的影响,暴雨的提前预警,未来人口预测等)同样适用。
(2)使用多元回归模型建立发病率与气温、气压及相对湿度之间的关系,已经经过残差分析,回归系数全在置信区间,得到了更加精确的模型。
(3)从建立的模型来看,更好运用了数形结合的思想,这样使得问题更清晰直观、易于理解。
6.2缺点
(1)本题数据比较多,对数据的处理不够精确。
(2)分析过程中的随机性和评价者主观上的不确定性及认识上的模糊性。
(3)改进模型没有深入讨论交互影响,只是简单得出压强差和湿度对发病率存在交互影响
七、参考文献
[1]颜文勇,王科,数学建模,北京:
高等教育出版社,2011。
[2]赫艳芳,李振宏,李辉,Excel2003统计与分析,北京:
人们邮电出版社,2006。
[3]王旭,沈阳地区脑卒中发病与气象环境因素的相关性,
[4]阴阳盛,熊西文,林建华,MATLAB6.1数学软件,大连:
大连理工大学出版社,2003。
[5]百科名片,发病率,
[6]爱问知识网,年龄划分,
[7]季度是如何划分的,
八、附件
附录0使用MATLAB6.1和EXCEL2003软件
附录1表2-1四年中平均气温、平均气压和平均相对湿度在各月份的平均数据
2007年
平均气压(百帕)
平均温度(摄氏)
平均相对湿度(
百分比)
2008年
平均气压(百帕)
平均温度(摄氏)
平均相对湿度(
百分比)
一月
1028.23
4.503
73.23
一月
1027.23
3.13
57.52
二月
1020.7
8.7
70.7
二月
1027.6
3
57.9
三月
1018.28
11.56
69.29
三月
1018.81
11.08
57.97
四月
1016.5
11.4
62.6
四月
1014.6
15.6
62.4
五月
1008.39
22.62
61.77
五月
1008.55
21.41
66.26
六月
1006.2
24.7
75.5
六月
1005.6
23.5
82.4
七月
1002.97
29.394
73.32
七月
1003.67
30.17
71.32
八月
1004.93
29.56
69.10
八月
1005.84
28.01
77.32
九月
1010.5
24.3
76.1
九月
1011.3
24.9
79.4
十月
1018.95
19.34
71.65
十月
1018.19
19.91
77.19
十一月
1024.1
12.6
62.0
十一月
1023.2
12.1
75.6
十二月
1023.46
7.93
67.77
十二月
1025.05
6.80
65.55
2009年
平均气压(百帕)
平均温度(摄氏)
平均相对湿度(
百分比)
2010年
平均气压(百帕)
平均温度(摄氏)
平均相对湿度(
百分比)
一月
1027.668
2.9613
69.6452
一月
1025.7548
4.4387
70.9355
二月
1019.557
8.2964
79.4629
二月
1020.7
6.9
74.7
三月
1019.435
10.0032
70.9355
三月
1020.3710
8.7484
70.8065
四月
1015.683
15.9067
67.3
四月
1017.9
12.5
69.6
五月
1012.126
21.6129
61.2581
五月
1009.7871
20.7065
68.3871
六月
1003.39
26.02
74.3667
六月
1007.6
23.7
76.4
七月
1003.826
28.4387
75.1290
七月
1005..2226
28.5871
75.5807
八月
1005.848
27.5516
81.5484
八月
1007.471
30.4323
71.5807
九月
1012.12
24.33
80
九月
1011.513
25.5467
77.2
十月
1016.842
20.4419
69.5484
十月
1018.852
18.0581
74.2903
十一月
1027.6
11.0333
77.4
十一月
1021.94
12.9933
68.9
十二月
1026.7
5.5548
71.9032
十二月
1020.239
6.9387
62.2258
附录2
x1=[1025.751020.701020.371017.881009.791007.641005.221007.471011.511018.851021.941020.23];
y=[0.08780.08120.08870.08080.09020.07960.08360.08040.08610.07790.07390.0739];
plot(x1,y,'*')
附录3
x2=[4.4396.98.7512.5220.7623.728.5930.4325.5518.0612.996.94];
y=[0.08780.08120.08870.08080.09020.07960.08360.08040.08610.07790.07390.0739];
plot(x2,y,'*')
附录4
x3=[70.9474.770.8169.5768.3976.475.5871.5877.274.2968.962.23];
y=[0.08780.08120.08870.08080.09020.07960.08360.08040.08610.07790.07390.0739];
plot(x3,y,'*')
附录5
x1=[1025.751020.671020.371017.881009.791007.641005.221007.471011.511018.051021.841020.23];
x2=[4.446.948.7512.5220.7223.728.5930.4324.5518.0612.996.94];
x3=[70.9464.6870.8169.5768.7876.475.5871.5877.274.2968.962.22];
y=[0.08780.08120.08870.08080.09020.07960.08360.08040.08610.07790.07390.0739];
x=[ones(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 脑卒中 发病 环境 因素 分析 干预 模型 探讨