二、验证性因子分析(Confirmatory Factor Analysis, CFA)
前面我们也分析过EFA和CFA的区别,我再重新总结一下(找到一个简洁的):
CFA的进行必须有特定的理论观点或概念架构作为基础,然后借由数学程序来确定评估该理论观点你所导出的计量模型是否适当、合理,因此理论架构对CFA的影响是在分析之前,其计量模型具有先验性,理论是一种事前的概念。(邱皓政,2005)
简单来说(说人话):如果你的模型是别人的已经研究过的模型,同时,你的各变量的题项是确定的(参考别人的),各变量的维度也是被验证过的,同时各维度的题项也是已知的,通过检验的(有人用过的),那就要用CFA
关于CFA我们采用的工具是AMOS或者是Mplus,我们主要讲AMOS,因为比较简单基础,如果有时间,后续会更新Mplus的操作过程和结果解读。
AMOS具体操作过程:
打开AMOS软件,我们会有这样的画面:

刚使用的朋友可能没有感觉,但是使用过的朋友,特别是我这类的美术功底不怎么样,又没有耐心的朋友,一般都会有这样的烦恼:这操作界面(纸)太小了,不够画。。。盖亚。。。所以在操作之前,我建议大家把纸张调大一点,这样既美观,也方便最后的复制。具体操作如下:
View→ Interface Properties

然后根据需要调节就行了,我一般选择A4。。作为灵魂画师的我感觉够画了。。

主要讲解一个核心内容:
方框和圈圈的区别:方框代表观测变量,椭圆代表潜变量,小圆圈代表误差。
在行为科学领域,有许多假设构念是无法直接被测量或观察到的。如焦虑、态度、动机、压力、满意度等等。这种假设构念知识一种特质或抽象的概念,无法直接得知,要得知人们在这些构念上的实际情况,只能间接以量表或者观察到的实际指标数来反应该构念的特质。举个栗子:“工作满意度”是一个构念,也就是潜变量,他对工作是否满意取决于很多方面,比如“对工作环境是否满意”“对薪酬是否满意”“对工作中的人际交往是否满意”等等。上述具体的满意指标就是工作满意度的指标变量,或者成为显著变量、观测变量。如果具体的满意指标越多,那么对一个人的工作满意度判断的正确性会越高,可信度也越好。
观察变量与潜变量的关系如下:

注意:一个潜在变量必须以两个及以上的观测变量来估计,成为多元指标原则。在SEM分析中,观察变量一定存在,但潜变量不可能单独存在
验证性因子分析的关系图:

那么我们该如何画出这样的图呢?
(1)在空白处画一个椭圆,然后选取第一行第三列图标,在椭圆形上连续点击若干下,点击一次会在椭圆形上方出现一组测量指标与误差项,点几下取决于你的潜变量中,观测变量最多的那一个,最多有几个观测变量我们就点几下。
(2)点击像手掌一样的那个图标(第三行第二列),全选你的图形,然后移动(图标:第五行第二列,红色小车)到中间靠右的位置,然后点击第六行第二列那个图标,点击图形,这个时候你就可以移动观测变量的位置,把它移动到最左边。如图所示的样子:

(3)然后,保持全选状态,点击第五行第一列的图标,复制。点击图片,整体向下移动鼠标然后松开。按照你的需要,有几个潜变量就复制几次。然后如图所示:

(4)导入数据。点击第八行第一列的图标如图所示。然后点File Name选择SPSS格式(.sav)保存的文件,点击OK。

(5)填充观测变量。点击第三行,第三列的按钮。如图所示:

找到之前计算好的变量名称。按照潜变量的分类,将因子得分点击后放入到方框中。这一步我们的逻辑是验证性因子分析的核心逻辑。同时也包含了,潜变量和观测变量的关系。(如果不明白的同学请返回顶部仔细研究,这里不再赘述)
然后我们根据我们填充的观测变量命名我们的潜变量名称。这里面有一个细节需要注意,潜变量的名称不能和.sav文件中的变量名称一样或有重复的。要不然计算不出结果!
最后删除多余的观测变量框(红叉图标,第五行第三列)。
(6)连接相关关系的线。第二行第二例的图标,对潜变量间两两互相建立相关关系。然后对误差项命名,第一种办法,手动输入。双击小圆圈,然后如图所示:

然后输入e1,同理依次将误差项标注完。如果误差项少还好,如果多了就很呆。。。那么第二种方法就来了。一步到位法。点击Plugins – Name Unobserved Variables 自动就填补误差项e了。
(7)然后输入TITLE。点击第三行第一列Title图标。在画布中点击空白处,如图所示:

然后在方框内输入:
CMIN=\CMIN( p =\P) ; GFI =\GFI
RMSEA=\RMSEA ;CFI=\CFI;NFI=\NFI
输入的内容意义我会在结果解读中详细说明
(8)输出结果选择。点击第八行第二列图标,然后点击output,如图所示:

如果仅仅知识用AMOS做验证性因子分析,只需要勾选“修正指标”(Modification indices)即可。
(9)然后点击计算(第八行第三列的图标)。
到这里为止,具体操作步骤就讲解完成,我补充一点无法跑出结果的原因,同学们要注意自查和避免:
1.潜变量间没有画相关关系的线。
2.潜变量名称与.sav格式文件中的变量名称冲突
3.潜变量误差项没有命名。
4.没有标选误差项。这里需要注意,有的同学没有按照我的画图思路来画图,而是按照研究模型来画图,最后跑不出结果。这是因为如果按照你想要研究的模型作图,那么你必须在潜变量上加误差项。因为按照研究模型画图,潜变量之间的关系是绝对关系,即单箭头表示的。我们有一个原则:箭头的发出端必有误差项。正确图如下:

那么结果我们该如何看,模型拟合的判别标准又是什么?
点击计算以后,可能会出现没有弹出结果表页面的情况,这时候,不要慌,点击第九行第二列的图标即可。
输出结果如图所示:

点击左边菜单栏的Model Fit,我们主要的模型摘要分析都在这个表里面。如图所示:

判别标准如下:

所以,综上所述,我们需要在结果输出表中展示的指标有:CMIN、CMIN/DF、SRMR、RMSEA、CFI。(和Title中输出的内容是一致的)
SRMR的计算方法如下:

然后保持对话框存在的状态,再次点击计算即可得出结果。

因为我做了一个关于辱虐管理对强制性公民行为的研究,验证性因子分析的结果如下:

我们发现结果指标很好,不需要进行修正。但是,在实际研究中,并非所有的检验结果都会如此,如果出现拟合度不好的情况我们班该怎么办?
(1)首先,在结果输出表中,找到 Modification Indices
(2)我找一张图为你们讲解:

如图所示,我们可以看到M.I值,我们根据这个值来进行修正。找到M.I值最大的那一对,在他们之间建立双向的相关关系。如本例中,e2和e7的M.I最大,所以我们在模型中,对e2和e7建立相关关系,然后再计算,看拟合结果指标的变化,如此反复检验直到模型拟合。
最后,点击图标(红色箭头那个)即可查看各变量间的未标准化系数和Title的输出结果了。

模型拟合程度不达标(能计算但是结果不太理想)的可能性:
1.观测变量不够或者有问题,没有找到最能体现潜变量的观测变量。
2.数据不理想。
本文来自zhihu,观点不代表一起大数据-技术文章心得立场,如若转载,请注明出处:https://zhuanlan.zhihu.com/p/448970216
注意:本文归作者所有,未经作者允许,不得转载