第一讲 量化研究与统计分析.docx
- 文档编号:2556458
- 上传时间:2023-05-04
- 格式:DOCX
- 页数:16
- 大小:84.14KB
第一讲 量化研究与统计分析.docx
《第一讲 量化研究与统计分析.docx》由会员分享,可在线阅读,更多相关《第一讲 量化研究与统计分析.docx(16页珍藏版)》请在冰点文库上搜索。
第一讲量化研究与统计分析
1
第一讲量化研究与统计分析
1-1、量化研究的基本概念
1-2、量表分析步骤
1-3、量表的编码
1-4、复选题及其它方式的数据建文件
1-1、量化研究的基本概念
一、概述
社会科学领域研究的二个主要范畴:
1、量的资料(quantitativedata)分析
2、质的研究(qualitativeresearch)。
量的数据分析,受到信息科学进步的影响,数据的处理更为简易也较为客观,因而社会科学中多数研究论文仍倾向于量的研究。
量的研究主要采取逻辑实证主义的论点,重视变量间因果关系或变量间的相关,重视的是假设演绎取向法,强调受试取样的代表性,以使研究结果能有效推论到样本的母群体。
二、量化研究的方法
(一)、量化研究的统计方法
1.描述统计学(descriptivestatistics)
2.推论统计学(inferentialstatistics)
目的:
为了解整个研究母群体的特性。
在社会科学领域中,由于母群体数目大多过于庞大,在时间、人力、物力、财力等考虑上,无法全部抽取母群体作为统计分析的对象,因而只能以随机或其它抽样的方式,抽取母群体中具代表性的样本作为研究分析的对象,再根据样本统计分析结果,推论到整个母群的性质。
如:
研究新课标施行后,我国中学生的学习情况,只能以部分学生的学习情况去推断全国学生的学习情况。
缺点:
在推论统计学中,由于是根据样本特性再推论到整个母群属性,因而可能包含取样误差与推论误差存在,也就是此研究推论会有可能犯错的机率(probability)。
(二)、量化研究的设计方法:
1.调查法:
分访问调查及问卷调查法;
2.实验法:
分真正实验设计与准实验设计法;
量化研究的主要特征,皆要经由观察、测验、量表、问卷以取得研究实施的数据资料,作为假设验证的基础,因而如何搜集有效度的资料,如何配合研究目的与研究架构,选用合适的统计方法,以作为支持或否定原假设的证据资料,就显得格外重要。
(三)、量化研究的步骤:
选题—设计问卷、调查—分析数据—给出结论
1.选择与定义问题
研究问题必须是可以检验的假设,或研究者领域所感兴趣、有价值或重要性的问题,问题可以经过资料搜集、分析来加以检验或回答。
量化研究问题可能是研究者感兴趣的主题;或有价值性的问题;或研究者认为是社会科学领域中重要的问题,此部份可以由相关文献的研究分析,挖掘相关研究的主题。
制定研究主题后,要拟定研究架构,草拟研究问题及要检验的研究假设,并对重要的关键词,给予完整的概念性定义及操作型定义。
2.执行研究的程序
完整的实施程序包括样本或受试者的选择,测量工具的改进,数据的搜集。
执行研究的程序就是决定抽样的方式,预试及正式问卷各抽取多少受试者,发展、编制或修订研究的测量工具,研究工具是否要先经专家效度检验?
3.资料分析
资料分析通常包括一个以上统计技巧的应用。
数据分析的结果可提供研究者检验研究假设或回答研究问题。
数据分析要根据检验的研究假设及变量性质,选用合适而正确的统计方法,包括预试问卷的信效度检验及正式问卷的统计应用分析等。
在数据分析时,研究者要避免“垃圾进、垃圾出”的现象,首要的是正确统计方法的选用与数据结果的客观解释。
4.结果分析与结论
结论的呈现主要根据数据分析的结果,结论应该与最初拟定的假设或研究问题有关,研究结论也要指出研究假设是否得到支持。
研究的结论要根据研究主要结果而来,重视客观性及实证性,进而再根据研究结论提出研究的具体建议及研究限制所在,以作为未来研究者的参考。
根据学者Bryman与Cramer,(1997)二人的观点,完整量化的研究历程,如下图1所示:
图1研究的完整程序(数据源:
Bryman&Cramer,1997,p.3)
(四)、注意的问题:
1.常用的抽样方法有三种(Gay,1992):
(1)随机抽样(randomsampling):
依据机率理论,以随机原则方式从母群体中抽取一定比例的受试者,使用方法如抽签法、随机随机数表抽样等。
(2)分层随机抽样(stratifiedrandomsampling):
研究设计中,如果受试者母群间的差异很大(异质性很高),或某些样本点很少,为顾及小群体的样本点也能被抽取,应采用分层随机取样较为适宜。
分层随机抽样的图示如下:
(3)整群抽样法(clustersampling):
如果样本所属的母群体很大或涵括的地理位置很广,则采用整群抽样法较为简宜。
整群抽样法是以一个群组(cluster)或一个团体为抽取单位,而不以个人为取样单位,因而整群抽样法时,抽取的样本点是一个群组、一个群组,群组与群组间的特征非常接近,同构型很高;而群组内彼此成员的差异较大,异质性高。
在社会科学领域中,整群抽样的群组如班级、学校、组别、部门、学区等。
总之,样本选取时,最重要的是样本要有代表性,才能从受试样本群推论到其母群的性质,受试样本要有代表性。
2.取样的样本要多少:
在研究设计中,受试者的数目要多大才算具有代表性,多少个样本才算“够大”(largeenough),这个议题,社会科学研究领域中,似乎无一致结论。
学者Gay(1992)对于样本数多少,则提出以下之看法:
(1)描述研究(descriptiveresearch)时,样本数最少占母群体的10%,如果母群体较小,则最小的样本数最好为母群体的20%。
(2)相关研究(correlationalstudies)的目的在于探究变项间有无关系存在,受试者至少须在30人以上。
(3)因果比较研究(causal-comparativestudies)与许多实验研究,各组的人数至少要有30位。
(4)如果实验研究设计得宜,有严密的实验控制,每组受试者至少在15人以上,但权威学者还是认为每组受试者最少应有30人,最为适宜。
3.变量属性的界定:
不同变量属性,所适用的统计方法也不同。
数据分析的变量属性的分类中,多采纳学者Stevens(1946、1951)的观点,Stevens的看法中,乃根据测量量表或测量水平的基准,将变量属性类别划分成以下几种:
(1)名义变量(nominalvariable)或称类别变量(categoricalvariable)
主要在于分类对象,把对象转变为间断类别,变量主要属性只是用来辨识事物或表示事物的类别而已,如性别、种族、学校大小、教师职务、教师性别、学生年级等。
名义变量无法陈述事物与事物之间的差异大小或形式,它属于间断变量的一种。
(2)次序变量(ordinalvariable)
变量除具有分类特性外,又具有等级排序关系。
变量间根据某个准则,可将对象由最高至最低作有规则的排序,变量主要属性在于可用数值表示对象间之优劣、多少、高低、次序等。
次序变量与名义变量不同之处在于次序变量有“方向次序”存在。
统计学上的中位数与百分等级等统计方法也属于次序变量。
(3)等距/比率变量(interval/ratiovariable)
等距变量除可表示对象类别及比较大小次序外,对象类别间距离是相等的,因而变量间有“可加性”(additivity)。
如果对象类别间存有绝对的零点(logicalzeropoints),则称为比率变量,比率变量间有”可乘性”(multiplicativity),二者均属连续变量(continuousvariables)。
研究者在变量属性确认方面,要能正确区分连续变量(包括等距变量与比率变量)与间断变量(包含类别变量与次序变量),方能选用正确的统计方法。
4.变量性质与适用时机
通常因变量为连续变量时,可进行参数统计,如平均数差异检验的t检验、方差分析、共变量分析、回归分析、多变量分析、典型相关等。
另外一种常见的情形,是研究的样本数很少,或研究分析的变量为间断变量,则此时最好采用“非参数统计法”。
(五)、量表编制原则
在社会科学领域中,常用的李克特式的多选项量表(multiple-itemscales),严格说起来,量表之变量性质是一种次序变量,但次序变量与名义变量均属“离散变量”(discretevariable),离散变量无法求其平均数、或进行相关、回归等统计分析,因而无法验证相关的研究假设,所以多数研究者在编制多选项量表时,皆把量表视为等距变量来设计。
李克特量表(Likert-typescale)填答方式,通常以四至六点量表法,为多数研究者与学者采用,其中以五点量表法的内部一致性较佳。
常用的选项名称如:
选项名称一
选项名称二
选项名称三
选项名称四
非常符合5
符合 4
有时符合3
不符合 2
非常不符合1
总是如此5
时常如此4
有时如此3
很少如此2
从未如此1
非常同意5
同意 4
不能确定3
不同意 2
极不同意1
(非常不同意)
非常重要5
重要 4
不能确定3
不重要 2
极不重要1
(非常不重要)
为了使评定量表各选项上的差距相等,在问卷编制上可采用两极端的方式来编制问卷或直接把数字填上,让受试者填答,如:
非常满意 非常不满意
我对于在职训练讲师之授课方式感到 □□□□□
或
非常满意 非常不满意
我对于在职训练讲师之授课方式感到 54321
非常同意 非常不同意
我认为参加在职训练能增进工作效率 □□□□□
或
非常同意 非常不同意
我认为参加在职训练能增进工作效率 54321
此外,在社会科学领域中,另一个常见的变量为“二分变量”(dichotomousvariables),此变量被视为名义变量或次序变量,均属于离散变量,对象属性只分为二大类别,如“男”、“女”;“及格”、“不及格”等。
如果离散变量有三大类或三个水平时,则称为“三分变量”(trichotomousvariable),如包含三个类别以上或三个水平以上的离散变量,又称为“多分变量”(multichotomousvariable)。
在统计研究上,高层次的连续变量可以区分为低层次的二分变量或三分变量或多分变量。
1-2、量表分析步骤
在问卷调查法(questionnairesurvey)或实验研究法(experimentalmethod)中,研究或调查工具编制甚为重要,问卷如果编制或选用得宜,则研究才更具可靠性与价值性。
本章先说明问卷信效度分析的简要步骤,各步骤的操作方法则分别于以后各章节详细说明。
问卷信效度分析的步骤:
一、编拟预试问卷
在预试问卷的编制或修订上,应根据研究目的、相关文献资料与研究架构等方面加以考虑,如果有类似的研究工具,可根据研究当时的实际情形,加以修订、增删;如果是自己重新编制问卷,问卷内容应依据研究架构的层面,加以编制。
在编制问卷时,应注意:
1.如果问卷的题项内容过于敏感,应在问卷中穿插数题「测谎题」,以探知填答者是否据实填答。
2.态度量表通常采用的是李克特式量表(Likert-typeScale)法,量表填答方式以五点量表最可靠。
3.预试问卷题项数最好是将来所需正式题项总数的3-4倍,在某些特定内容范围中,至少要约为正式量表题项数的1.5倍。
二、预试
预试问卷编拟完后,应实施预试,预试对象的性质应与将来正式问卷要抽取的对象性质相同,预试对象人数以问卷中包括最多题项的“分量表”的3-5倍人数为原则,如调查预试问卷中,包括三种分量表,每种分量表包含的题项分别为40题、35题、25题,则预试对象,最好在120位至200位中间。
再根据学者Gay与Airasion(2000)的观点,样本的大小应根据研究的种类来决定,如:
1.描述性研究:
样本人数至少应有总体人数的10%,如果总体较小时,则样本人数至少要有20%左右。
2.相关研究时:
样本人数至少应有30人,始能确定有无相关存在。
3.实验研究与事后反馈研究:
每组人数至少应有30人。
4.如果实验研究设计得宜,有严密的实验控制,每组受试者至少在15人以上,但其他权威学者还是认为每组人数至少应有30人最为适合。
三、整理问卷与编号
问卷回收后,应一份一份检查筛选,对于数据不全或不诚实填答的问卷,应考虑将之删除;对于填答时皆填同一性答案者,是否删除,研究者应考虑问卷题项本身的内容与描述,自行审慎判断。
筛选完后的问卷应加以编号,以便将来核对数据之用;之后再给予各变量、各题项一个不同代码,并依问卷内容,有顺序的键入计算机。
四、项目分析(各题项高低分组受试者给分的均值检验)
项目分析即在求出每一个题项的“决断值”(criticalratio;简称CR值),其求法是将所有受试者在预试量表的得分总和依高低排列,得分前25%至33%者为高分组,得分后25%至33%者为低分组,求出高低二组受试者在每题得分平均数差异的显著性检验(多数数据分析时,均以测验总分最高的27%及最低的27%,作为高低分组界限),如果题项的CR值达显者水平(<0.05或<0.01),即表示这个题项能鉴别不同受试者的反应程度,此为题项是否删除首应考虑的判断准则。
五、因素分析(主成分分析或因子分析)
项目分析完后,为检验量表的建构效度(constructvalidity),应进行因素分析。
所谓建构效度系指态度量表能测量理论的概念或特质之程度,即根据受试者实际的测验分数,经统计检验结果能解释受试者的心理特质有多少。
因素分析目的即在找出量表潜在的结构,减少题项的数目,使之变为一组较少而彼此相关较大的变量,此种因素分析方法,是一种“探索性的因素分析”(exploratoryfactoranalysis)。
六、信度分析
因素分析完后,继续要进行分析的是量表各层面与总量表的信度考验。
所谓信度(reliability),就是量表的可靠性或稳定性,即测验工具所得到结果的一致性或稳定性。
一般而言,二次或二个测验之结果愈是一致,则误差愈小,所得的信度愈高。
在态度量表法常用检验信度的方法为L.J.Cronbach所创的系数,其公式为:
其中K为量表所包括的总题数。
为测验量表总分的变异量。
为每个测验题项总分的变异量。
系数值界于0至1之间,出现0或1两个极端值的机率甚低,但究竟系数要多大,才算有高的信度?
一般来说,系数值如果在0.60至0.65之间最好不要;系数值界于0.65至0.70间是最小可接受值;系数值界于在0.70至0.80之间相当好;系数值界于在0.80至0.90之间非常好。
另外,亦可求出量表的折半信度(split-halfreliability),所谓折半信度是将量表的题目分成两半计分,根据受试者在两半题项上所得的分数,计算二者的相关系数。
七、再测信度
如果要继续求出量表的再测信度(test-retestreliability),要以正式量表对同一组受试者前后测验二次,根据受试者前后二次测验分数得分,求其积差相关系数。
再测信度又称稳定系数(coefficientofstability),反应量表的稳定与一致性程度,一般而言,间隔时间愈长,稳定系数愈低。
再测信度间隔时间通常以星期或月为单位,较常用者为间隔二星期或一个月。
将以上量表编制建构的流程图,整理如下:
1-3、量表的编码
以“学生生活经验调查表”为例说明,题号代号编码时应注意:
1.题号代号不能重复。
2.同一量表的题号最好有相同的标识符,如A1至A20为量表一;B1至B25为量表二;C1至C24为量表三(为父母影响历程量表);D1至D19为量表四(教师行为量表)。
3.名义或类别变量的变量代码最好与其意义内涵有关,以三至五个英文字简写代表最好。
如学生性别为SSEX、教师性别为TSEX、年龄为AGE、年级为YEAR、教育程度为EDU、工作类别为JOB、家庭结构为STRU、学校历史为HIST等。
4.变量代码不要用中文字,如要加注部份变量的中文说明,可于SPSS操作中更改。
原始问卷中,第一部份父母影响历程量表中的第一题至第八题均为反向题。
本问卷中,父母影响历程与教师行为量表前还有二份量表,因篇幅关系省略,因而父母影响历程量表24题的编码为c1、c2...c23、c24;而教师行为量表的十九题之变项编码为d1、d2、d3......d18、d19。
此为单选题的编码,每个题项均占一栏;如果是复选题,则每个“选项”各占一栏,每个选项均单独成一个变量,如第一题为复选题,内有五个选项,则变项编码为a11、a12、a13、a14、a15,其中a1代表第一题,第三个数字为题项中选项编号。
【基本数据】
( )1.你的年级?
(1).小学四年级
(2).小学六年级 (3).高中二年级
( )2.你的性别?
(1).男生
(2).女生
( )3.你数学老师的性别?
(1).男老师
(2).女老师
( )4.你在家的生活是?
(1).只有和父亲住在一起
(2).只有和母亲住在一起 (3).和父母亲住在一起 (4).和其他长辈住在一起
【第一部份】父母影响历程量表
※此部份填答,受试者就题项实际知觉情形,从“非常不同意”、“有点不同意”、“不能确定”、“有点同意”、“非常同意”五个选项中勾选一个最符合实际情况者。
1.父母亲对我的成绩从来没有满意过。
2.我想我在学校已经表现很好了,但父母总认为我还可以表现得更好。
3.考绩成绩不好时我怕回家。
4.考试只有考一百分父母才会高兴。
5.父母亲对的期望太高。
6.父母总认为我在学校还没有尽力。
7.做回家作业时,父母会给我很多压力。
8.如果父母亲不那么严格,上学会更令人愉快。
9.好成绩使我兴奋,因为我知道那会使父母高兴。
10.我在学校表现很好,其中父母的帮忙很大。
11.我和父母亲相处得非常好。
12.父母亲期望我读大学。
13.父母亲希望我进一所“好”大学。
14.父母亲对我的回家作业非常有兴趣。
15.父母关心我在学校的上课情形。
16.如果我尽力了,父母会感到满意。
※此部份填答,受试者就题项实际知觉情形,从“从不如此”、“很少如此”、“有时如此”、“通常如此”、“总是如此”五个选项中勾选一个最符合实际情况者。
17.考卷带回家后,父母通常会和我讨论错误的地方.。
18.父母会帮忙我做回家的数学作业。
19.当我的回家功课不会做时,父母会帮忙我。
20.父母会帮我检查回家功课作得对不对。
21.在考试前父母会帮忙我复习功课。
22.在上学前父母会询问我东西带齐了没。
23.父母会帮我选择购买我要读的书。
24.在考试之前父母会先帮我小考一下。
第二部份【教师行为量表】
教师行为量表,填答时采五点量表法,分别就“完全不符合”、“有点不符合”、“不能确定”、“有点符合”、“完全符合”五个选项中择一填答。
1.老师认为我是一位非常用功的学生。
2.老师认为我上课很专心。
3.老师很关心我在学校的行为表现。
4.老师很在意我的学业成绩。
5.老师认为我是一位可造之才。
6.老师认为我学习的能力好。
7.老师对我的一举一动都非常在意。
8.老师很重视我的看法或想法。
9.老师认为我做事很细心。
10.老师认为我的理解力很好。
11.老师很关心我学习的困难。
12.老师对我学业的要求很高。
13.老师认为我非常有潜力。
14.老师常认为我的行为表现很好。
15.在教学外,老师也很关心我的生活有关问题。
16.老师很喜欢我。
17.老师对我的印象很好,认为我是位好学生。
18.老师对我未来发展的期望很高。
19.老师常常鼓励我努力上进。
1-4、复选题及其它方式的数据建文件
您的性别:
1□男生 2□女生
您的职务:
1□主任 2□组长 3□教师
一、您认为目前教改阻力来自那些单位?
(可复选)
1□教育行政单位 2□民意代表 3□学校行政人员
4□家长团体 5□教师会 6□教师本身
7□其它团体
二、
第一题为复选题,内有七个选项,在建文件时应分别建立七个变量,如:
Num
Sex
job
A11
A12
A13
A14
A15
A16
A17
A21
A22
A23
A24
001
1
1
1
0
1
1
0
0
1
002
1
2
0
0
1
1
1
0
0
其中A11代表第一题第一个选项,A17代表第一题第七个选项,如果第二题也是复选题,内有四个选项可以勾选,则编码时,最好编成A21、A22、A23、A24,这样在数据建文件上较为方便。
复选题有勾选者输入1,没有勾选者输入0,将来统计时只要执行【分析】/【描述性统计】/【频数分析】程序,即可得知各选项被勾选的次数与有效百分比多少。
一、您认为班级经营内涵的重要性如何?
最重要者请填1,次重要者请填2,依次类推..
□教学活动 □训育工作 □辅导活动
□行政处理 □情境规划 □人际关系
□亲师合作
此种有等级重要性之题项,在变量编码时与复选题相同,内有多少个选项,就要设定多少个变量,如例题中有七个选项,要编成七个码,统计时,只要执行【分析】/【描述性统计】/【描述性统计量】程序,求出各变量的平均数大小即可,平均数愈小者代表第一重要;次小者代表第二重要。
本章主要内容:
一、概述:
量化研究;质的研究。
二、量化研究的方法
(一)、量化研究的统计方法:
1.描述统计学;2.推论统计学。
(二)、量化研究的设计方法:
1.调查法;2.实验法。
(三)、量化研究的步骤:
选题—设计问卷、调查—分析数据—给出结论。
(四)、注意的问题:
1.常用的抽样方法:
随机抽样;分层随机抽样;整群抽样法。
2.取样的样本要多少。
3.变量属性的界定:
连续变量;离散变量。
4.变量性质与适用的统计方法。
(五)、量表编制原则:
李克特五点量表法。
三、量表分析步骤
编拟预试问卷--预试--整理问卷与编号--项目分析--因素分析--信度分析--再测信度
四、量表的编码及数据文件的建立:
单选题;复选题。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一讲 量化研究与统计分析 第一 量化 研究 统计分析