写在前面
时间回到5年前,那时的我还是个小白研究生,正在大量的文献阅读中寻找自己的研究方向,我所在的交通学科是一个超级的交叉学科,计算机、统计、社会学、管理学、心理学众多学科的研究者们都可以在交通学科找到用武之地,而我这个刚从本科毕业的交通专业的学生却什么都不会(主要原因是自己太菜,现在的师弟师妹都很强)。在找到自己的主要研究方向后,我遇到了结构方程模型这个对科研新手超级友好的方法,我便开始了结构方程模型之旅。虽然现在已很少用到这个方法,但我还是决定将它分享出来,希望可以给跟我之前一样的研究小白提供一些参考,另外,我已经很久没有关注这个方法了,如果有写错的地方请大家积极指出来哈!
1、基本概念
观测变量:可直接测量的变量,例如人的年龄、性别等变量。
潜在变量:无法直接测量的变量,例如,人们对某一行为的态度、对某些社会性规范的感受等。
2、结构方程模型简介
SEM是一种包含因素分析和路径分析的统计分析技术,适用于多变量间相互关系的研究,在心理学、管理学、社会学等社会科学领域中都有应用,SEM包含测量模型和结构模型两个基本模型。
测量模型
测量模型表示潜在变量与观测变量间的共变关系,可看作一个回归模型,由观测变量向潜在变量回归。用方程可以表示为:
其中, 表示
的观测向量;
为观测向量对应的
的因子矩阵;
为
的因子得分向量;
是与
独立的误差项。
结构模型
结构模型部分表示潜变量间的结构关系,也可看作一个回归模型,由内生潜在变量对若干内生和外生潜在变量的线性项作回归。用方程表示为:
其中, 和
分别是
和
的潜在变量;
和
表示未知的相关参数矩阵;
为误差项。
建模步骤
使用结构方程模型进行分析一般分为4个步骤:
- 模型设定:进行模型估计之前,先要根据理论分析或以往研究成果来设定初始理论模型,也就是初步拟定上述测量模型和结构模型。
- 模型识别:要决定所设定的模型是否能够对待估计参数求解,在一些情况下,由于模型设定的问题,造成了模型不可识别的问题,如样本量过少所造成的待求系数太多而方程数目太少,一般情况下,样本与变量数之比为5:1以上较为合适(结构方程模型对样本数量要求较高,当样本量较小时,可以选用贝叶斯结构方程模型,具体可参考:贝叶斯结构方程模型(Bayesian-SEM)简介及AMOS实现)。
- 模型估计:模型参数可以采用几种不同的方法来估计,通常的方法包括最大似然法和广义最小二乘法,贝叶斯估计目前也经常被用到结构方程模型的参数估计当中。
- 模型评价与修正:模型估计之后,须对模型的整体拟合效果和单一参数的估计值进行评价。如果模型拟合效果不佳,可以对模型进行修正来提高模型拟合效果。
3、AMOS22.0实现步骤
AMOS软件是专门用来进行结构方程模型分析的软件之一,下面使用AMOS22.0对上述4个建模步骤进行举例实现,下图是AMOS的初始界面。

本次例子所用数据是北京市交通发展年报中2003年到2020年的交通统计数据,分别包含每年的人口、GDP、私人机动车保有量、地铁里程以及每年交通事故数量。数据链接: https://pan.baidu.com/s/1rSQs5z08cdaItCgUiQBx7w 提取码: wgew (数据为归一化后数据,原始数据请自行去北京交通发展研究院官网下载整理)研究目的为建立城市交通事故的宏观影响因素分析模型,确定宏观经济因素、宏观交通因素对交通事故数量的影响。
模型设定
根据相关的理论知识,在AMOS中画出模型的理论结构图,AMOS中,方框表示观测变量,椭圆表示潜在变量,单箭头表示因果关系,双箭头表示相关关系,绘出城市交通事故宏观影响因素分析模型的理论结构。

模型识别
使用Select data file(s)导入数据,本次例子观测变量为共5个,样本量为18个,比例约为4:1,勉强可以用来进行分析(正式研究时样本量应尽量大于5:1)。

模型估计
AOMS中默认的算法为最大似然法,在Analysis properties功能中提供多种最小二乘法或其他方法进行选择。

同时,可在Output中选择要输出的内容。

模型评价与修正
在参数估计完成后,输出一个带有系数的结构流程图,点击红色方框里的按键即可显示。

如果要详细分析模型参数估计结果,评价模型的适应性以及进一步修正模型,需要对本次模型的输出文件进行详细分析,点击下图的红色方框即可获得AMOS软件的模型输出结果。

一般情况下,我们会用到Estimates、Modification Indices及Model fit等三个输出子项。

首先根据Modification Indices来修正模型(一般这里面的结果会有变量间相互关系的建议,由于数据的关系,本模型未给出相关建议如下图所示)。

随后根据Model fit中各拟合度指标来评估模型的适应性,适应性指标的界限值如下表所示(网图侵删)。

符合要求后,根据Estimates来分析模型结果,结果提供了回归权重和标准化之后的回归权重两个模型参数结果。我们对第一个结果进行分析可以发现,宏观经济因素与事故数量之间的系数为0.66,影响并不显著,表明人口经济等宏观经济因素对交通事故有正向影响;交通因素与事故数量之间的系数为-1.49,影响在95%的显著性水平上显著,表明轨道交通及汽车保有量等交通因素对交通事故有负向影响(这里的数据量较小,得到的结果不一定正确,仅供参考)。

参考文献:
- 吴明隆. 结构方程模型:AMOS的操作与应用.第2版[M]. 重庆大学出版社, 2010.
- Jie-Ling J, Yuan-Chang D. Analysis of drink-driving behavior: Considering the subjective and objective factors of drivers[J]. Traffic injury prevention, 2021, 22(3): 183-188.
- 金杰灵, 邓院昌. 酒驾行为心理影响因素分析[J]. 中国安全科学学报, 2018, 28(5):6.
本文来自zhihu,观点不代表一起大数据-技术文章心得立场,如若转载,请注明出处:https://zhuanlan.zhihu.com/p/208777306
注意:本文归作者所有,未经作者允许,不得转载