最终到了结构方程模型的分享,听这个名字好似很难懂,不外在实质的理解上倘若你仔细阅读每一个SEM的分享,必定会豁然开朗,这次分享为了让大众认识SEM的前世今生,让大众彻底学会用SEM,咱们大大概十次上下的分享,循序渐进。这次分享的内容都数为罗胜强教授的《管理学问卷调查办法》这本书中针对结构方程模型的解释,这本书可谓是万卷书法系列中最清晰,最容易上手且干货慢慢的一本书,尤其举荐管理学大类的朋友进行学习。
首要,咱们搜索一下结构方程模型,找到一个关联的诠释:结构方程模型(Structural Equation Modeling,SEM) 是社会科学科研中的一个非常好的办法。该办法在20世纪80年代就已然成熟,可惜国内认识的人并不多。"在社会科学以及经济、市场、管理等科研行业,有时需处理多个原由、多个结果的关系,或会碰到不可直接观测的变量(即潜变量),这些都是传统的统计办法不可很好处理的问题。20世纪80年代败兴,结构方程模型快速发展,弥补了传统统计办法的不足,作为多元数据分析的重要工具。
搜索出的结果中有以下五点优点
(一)同期处理多个因变量
结构方程分析可同期思虑并处理多个因变量。在回归分析或路径分析中,就算统计结果的图表中展示多个因变量,其实在计算回归系数或路径系数时,仍是对每一个因变量逐一计算。因此图表看似对多个因变量同期思虑,但在计算对某一个因变量的影响或关系时,都忽略了其他因变量的存在及其影响。
(二)容许自变量和因变量含测绘误差
态度、行径等变量,常常含有误差,亦不可简单地用单一指标测绘。结构方程分析容许自变量和因变量均含测绘误差。变量亦可用多个指标测绘。用传统办法计算的潜变量间关联系数,与用结构方程分析计算的潜变量间关联系数,可能相差很大。
(三)同期估计因子结构和因子关系
假设要认识潜变量之间的关联,每一个潜变量者用多个指标或题目测绘,一个常用的做法是对每一个潜变量先用因子分析计算潜变量(即因子)与题目的关系(即因子负荷),从而得到因子得分,做为潜变量的观测值,而后再计算因子得分,做为潜变量之间的关联系数。这是两个独立的过程。在结构方程中,这两步同期进行,即因子与题目之间的关系和因子与因子之间的关系同期思虑。
(四)容许更大弹性的测绘模型
传统上,咱们只容许每一题目(指标)从属于单一因子,但结构方程分析容许更加繁杂的模型。例如,咱们用英语书写的数学试题,去测绘学生的数学能力,则测验得分(指标)既从属于数学因子,亦从属于英语因子(由于得分亦反映英语能力)。传统因子分析难以处理一个指标从属多个因子或思虑高阶因子等有比较繁杂的从属关系的模型。
(五)估计全部模型的拟合程度
在传统路径分析中,咱们只估计每一路径(变量间关系)的强弱。在结构方程分析中,除了以上参数的估计外,咱们还能够计算区别模型对同一个样本数据的整体拟合程度,从而判断哪一个模型更接近数据所呈现的关系。
以上内容是搜索告诉咱们关于结构方程模型的基本描述,比较重点的地区咱们进行了标红,除此之外,中间商调节效应的分析在SEM下亦是很好分析的,并且随着普通多元回归的乱用,通常的统计模型已然不可满足实证分析中需要推断因果关系的需求,因此此时候就需要多种统计模型来进行分析,当然,SEM亦是有必定不足的?在之前中间商调节效应初探中说过,SEM的一个特点便是数据导向,然则实质分析中,是需要理论来证明的,并且需要的样本量亦比很强,针对数据信效度的需求页比较高。
为了让大众针对SEM有比较系统的认识,咱们需要追根溯源来给大众介绍,通常的书籍中,将SEM分成两个部分,一个是结构模型,一个是测绘模型,当然最先要处理的是测绘模型,倘若测绘模型存在问题,那样结构模型必然有巨大问题,针对详细的这部分内容,咱们在后续会逐步给大众介绍。而今天为了让大众认识测绘模型,咱们给大众普及有些基本的知识,方便大众理解测绘模型的内容。
古典测绘模型:初中理学,测绘水的温度,需要三次或更加多次数的测绘而后取得平均值,这是自然科学办法,在社会科学中咱们怎么测绘呢?在大都数科研中,由于成本问题,显然不可能多次测绘,且社会科学中非常多变量并不客观,那样这个测绘的过程中就会显现误差。
下面引用上面说到书中的例子来讲明:
在实质测绘中,真实值和观测值是会有必定误差的,而在普通的回归中,咱们默认得到的测绘值便是实质值,这个假设有必定恰当性,当然亦是有必定问题的
针对古典测量模型来讲,公式很简单:X=q+w(被叫作作古典测绘模型)误差服从(0,1)正态分布。(1904,斯皮尔曼在科研关联系数的时候发明的),发掘真实的关联比测绘的关联大,因此怎样提高测绘的精度?
最简单的处理办法便是测绘多个,原理是什么呢?
由于咱们在测绘的时候,指标与真实的数值之间都会有必定的差异,这个差异是随机的,正向负向,而多个测绘指标之间会显现正负项的相互抵消。
除了古典测绘模型之外,同属测绘模型:与古典测绘模型有很大的相同,然则本质区别是在于能够准许每一个指标表率的比重不同样(权重)。
而在结构方程模型中,测绘模型便是在进行模型拟合之前,针对得到数据的质量进行一个初步分析,当然这个分析便是经过信效度来分,针对信效度的分析,SPSS做起来相对容易直观,stata的分析咱们在前面的分享中亦有介绍。而量表信效度的分析在SEM亦能够完成,其核心思想与SPSS中并无什么区别。
简单的来讲,信度便是量表题目测绘的稳定性,重复性。然则从专业的方向说,信度被定义为一个测绘工具免于随机误差的影响程度。理解这个信度的概念还需要测绘的关联知识,这里弥补。
回想咱们之前说的经典测绘模型,观测值(测绘分数)的构成是由于真实值以及随机误差构成,信度指数便是真实值的方差除以观测值的办法,然则真实值咱们是不晓得的。然而真实的数据收集的过程中,误差不可能是仅仅是随机误差。不外再说下去就可能是测绘学关联的知识了,接下来咱们给大家介绍一下关联的信度。
1. 复本信度,区别再测的关联系数
复本信度都是到便是用区别的工具测同一个构念,不需要是同一个对象,只需要是同一类适用人群,而得到的两份数据的关联系数就能够说明复本信度的高低。
2. 重测信度(再测信度)
两个区别的时间点,用同一工具针对同一测绘对象(这通常来讲很难做到,因此运用的很少),一样亦是用关联系数去确定重测信度
3.内部一致性信度
a系数(由于那个字母欠好打),评估各指标之间的一致性(同质性),要明白内部一致性信度,必须先晓得量表长度与信度之间的关系。简单的说量表越长,信度越高,依据为斯皮尔曼-布朗公式,这亦是和信度的测绘目的相互匹配的。
通常都会报告a系数和关联系数,通常a系数0.7以上合格,而0.7以下不合格,0.8以上良好。
在通常的分析中咱们仅仅需要关注a系数,因此这儿有必要对a系数做出深入的认识。
公式说明 N/N-1 (总方差—每一个题目方差之和)/总方差
A
B
C
VARIANCE
1
6
5
4
1
2
6
4
5
1
3
5
3
3
1.33
4
4
4
4
0
5
4
5
4
0.33
3.67
totly
7
上图引用自书中。a系数的一个特点是,随着题目数量的增加,系数值会增大。
而针对效度
简单的说效度便是咱们测绘的东西是不是是咱们想测绘的构念。
效度:咱们将问卷中的每一道题作为条目(项目)或是他所反映的一个指标,而测绘同一个构念的一组指标则被作为量表、量表是为了测绘某个构念而设计的,量表是否能真实反映咱们想测试的构念,这个便是量表的效度。
关于效度检验:效度重点分四个方面:内容效度,结构效度,效标效度,构念效度。
1.内容效度
1.测绘的内容是不是充分反映了这个构念(如,一个构念有N个指标,而你只用了N-n个指标,其中N>n)2.指标的选择是不是有表率性(如,一个构念有N个指标,然则你用的指标中有与构念不符合的,例如满意度的量表变成为了幸福感的,或工作满意度的用生活满意度测绘)3.问卷形式需要符合当地文化。
盲人摸象的故事便是说明内容效度不足,测绘需要准确覆盖构念的每一个部分(重点办法有规律判断法,专家分析法和实证科研法)
2.(内部)结构效度
测绘数据得到的构念的结构是不是于咱们对构念的预期一致。(因子分析是处理结构效度的很好的办法,因子分析能够帮我认识一个测绘项目背面有多少个因子)
内容结构效度是咱们通常论文中量表效度所指。
探索性因子分析在研发量表中有很大的功效,当构念不足清楚的时候,咱们需要经过数据去探索这个概念的维度。而验证性是在已然晓得维度的状况下去验证,通常用来检验别人已然研发和使用的量表。相对来讲,探索性因子分析的需求比验证性更加苛刻,通常探索性不外的话亦不需要直接删除题目。
3.基于该测绘与其他测绘关系之间的效度(效标效度,规律关系网)
效标效度(又叫作效标相关效度)举例测绘了A和B,并且理论已然告诉咱们AB最少有比较强的关联性(不必定是因果),然则发掘AB不关联,那样通常便是AB的测绘出了问题。
规律关系网,简单的说便是你的数据验证了理论或模型,那样你的数据就应该是有效度的。
4.聚合效度和区别效度(被误解最多的效度)
科研中的因子分析并不可说明咱们的问卷拥有聚合效度或区分效度。由于因子分析只能说明量表能够把几个概念区掰开,然则并不可说明有效度。
聚合效度的意思是一个构念的测绘与表率一样测绘关联性很大,而区别效度是一个构念的测绘和其他构念关联很小。
但在结构方程模型中,聚合效度(construct validity)因子载荷大于0.71说明题目有很大的聚合,组合效度(Hair,2006),为何呢?由于0.71x0.71>0.5,解释超过百分之五十的方差变异,而在社会科学中0.55以上便是能够接受的范围。因子载荷在下一节中讲
多质多法检验量表的聚合和区别效度
在研发量表的时候极为重要,举例,例如一个构念A的量表(来自美国社会科学行业),咱们觉得A的测绘的不准确(亦便是通俗的不符合文化环境),那样咱们需要研发一个A+,表率有中国特殊的问卷,此时咱们需要引入B(理论上区别然则很相信的概念),此时,将三个问卷放入一个数据中,此时候倘若A+与A关联系数很强,且A+与B关联系数较小,则说明新的量表A+有区分和聚合效度,而这个区分和聚合效度是针针对区别概念的区分,以及一样概念的聚合。
此办法是campbell以及Fiske在1959年提出的,多质多法矩阵(MTMM),需要自评和他评估以及两个以上的构念进行关联矩阵的输出,多于一个的办法测绘多于一个的质。
针对NTMM倘若想有深入认识的话,大众能够查询关联书籍。
接下来是效度的干货内容
而在通常的论文中,咱们是没法满足这么多效度的检验,因此,通常咱们采取的是
建构效度 建构效度分为两种:收敛效度与区别效度。收敛效度是指的是相同概念里的项目,彼此之间关联度高。区别效度指的是区别概念里的项目,彼此关联度低。简单来讲便是区别构念(潜变量)之间的关联度要少于构念内部的关联度。这个原由很好理解,咱们科研区别构念之间的关系,当然是期盼咱们的自变量与因变量有很强的关联性,最好还是掌控有些变量状况下的净关联性,这般才可说明咱们关注的点是正确的,我们能够简单理解成,期盼区别构念之间的关联性要很强,这般得到的回归系数亦会越大越明显,然则这亦是需要有一个限度的,而怎么确定这个限度的,为了方便,在科研中,咱们关注的是构念之间的关联和构念内部的关联的关系,因此内部的关系必定要强于外边的关系。这便是表现区别,而收敛便是自己的构念题目内,要有必定关联性,而这个关联性就用AVE进行测绘。
对测绘模型进行验证性因子分析来检验重点潜变量的收敛效度(convergent validity)和判别效度(discriminant validity)(Anderson and Gerbing,1 988)128]。
1. 收敛效度检验。对三个量表即三个测绘模型进行收敛效度检验时,第1步考察每一个潜变量的标准化因子载荷系数,载荷值应>0.5,这寓意着问
项与其潜变量之间的一起方差大于问项与误差方差之间的一起方差,都是明显的;第二步考察AVE值。AVE值应>0.5,这寓意着每一个因子所提取的可解释50%以上的方差(Fomell和Larcker,1981) 2. 判别效度检验。针对各维度间是不是存在足够的区分效度,一般采用比较各维度间完全标准化关联系数与所触及各维度自己AVE的平方根值体积,当前者少于后者,则显示各维度间存在足够的区分效度,反之,则区分效度不足。(Fomell&Larcker,1981)
今天的分享重点便是测绘模型需要认识的前提知识亦是针对信效度的一个回顾和加深
|