1、鼻炎家族史(0=无 1=有)x2 :主(被)动吸烟(0=无 1=有)x3 :孕早期病毒感染(0=无 1=有)x4 :孕期用药(0=无 1=有)x5 :先兆早产(0=无 1=有)x6 :流产史(0=无 1=有)x7 :早产(0=无 1=有)x8 :剖宫产(0=无 1=有)x9 :孕期营养(0=一般 1=好)x10:孕期活动量(0=小 1=一般)x11:出生体重(2.5=1 2.54=2 4=3)x12:妊娠反应(轻1 中2 重3)P:在m个自变量的作用下患病的概率: 回归系数(j=0,112)Si:Sig的检验值Smax:Si的最大值S: Sig的临界值Sig=0.05Sig: “显著性”,当0
2、.01Sig0.05,则为差异显著,如果Sig0.01,则差异极显著。赞同 四、模型假设1、影响因素对疾病的影响是独立的。2、各个因素的有无影响程度大小不考虑。3、除这12种因素外有可能引起该病的因素不考虑。五、模型建立1、y=1 患病;y=0 未患病;自变量 在m个自变量的作用下患病的概率记作: (1)即: (2)将P作logit转换为,有 (3)2、建立似然函数模型: (4)通过,求出,代入(3)得logistic回归方程同时也可求出Sig值。m=12,j=(1,2200)3、逐步回归的后退法: 根据原始数据由SPSS软件得出多元线性回归结果;2 找到最大的Sig值Smax与临界值S=0.
3、05比较,如果SmaxS,剔除Smax对应变量,重新根据余下的变量数据由SPSS软件再得出多元线性回归结果,再返回(1),否则进入(3)。3 如果Smax0.05,剔除。孕期活动量Sig值最大为0.8580.05,剔除主(被)动吸烟Sig值最大为0.6160.05,剔除。早产的Sig值最大为0.397流产史的Sig值最大为0.192妊娠反应的Sig值最大为0.186出身体重Sig值最大为0.180所有变量的Sig值0.05,故最终回归模型Logit(P)=0.111+0.144x1+0.184x4+0.400x5+0.186x8+0.188x9综上知:鼻炎家族史,孕期用药,先兆早产,剖宫产和孕
4、期营养为诱发胎儿疾病的主要影响因素。七、模型检验方法1:根据t的检验方法,试验证,如下:用SPSS软件得:由于Sig的值都小于0.05,从而验证正确。方法2:判别分析法与回归分析的最优判别函数是一致的。用Fisher判别法的判别函数经计算得:y=0.0051x1+0.0009x2+0.0002x3+0.0052x4+0.0116x5+0.0025x6+0.0033x7+0.0051x8+0.0047x9-0.0004x10-0.0035x11+0.0016x12判别系数大小前五的为:x1 x4 x5 x8 x9与上模型计算结果一致。八、模型应用可以用来预测在不同的自变量情况下,发生某病或某种情
5、况的主要影响因素。适用于与本题类似的医学研究问题,也适用于其他情况。在生物学中生物呈s增长的相关研究问题也适用。如基于Logistic回归服装品牌忠诚度影响因素分析等。 九、模型评价在影响结果的混杂因素比较多的时候,难以满足均衡可比的要求,且像本题给出各因素的定性数据,不能直接利用线性回归进行分析,因而Logistic回归模型更为适合。利用SPSS软件包计算方便、精准,易于判断、理解,但是,适用本模型的前提是自变量对疾病的影响是独立的,实际情况有时并不如此,就需利用其他方法进行降维处理,再利用本模型进行统计分析。由这种模型,根据Sig的值,也可得到最重要的影响因素,依次次要的因素等。如本题:先
6、兆早产Sig值最小,为最重要的,次要的为孕期用药,剖宫产和孕期营养,再为鼻炎家族史十、参考文献十一、附录附表1:病例组:患儿代码鼻炎家族史主(被)动吸烟 孕早期病毒感染孕期用药先兆早产流产史早产剖宫产孕期营养孕期活动量出生体重 (kg)妊娠反应无=0 有=1无=0有=1一般0好1小0 一般12.5=1 2.54=2 4=3轻1 中2 重3123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100对照组:儿童代码一般0 好1