效度是指测量的有效性程度,是测量工具能测出所要测量特质的程度,即准确性、有用性。
该部分的效度分析主要是结构效度分析
结构效度指测量结果体现出来的某种结构与测值之间的对应程度。效度分析最理想的方法是利用因子分析测量量表或整个问卷的结构效度。因子分析的主要功能是从量表全部变量(题项)中提取一些公因子,各公因子分别与某一群特定变量高度关联,这些公因子即代表了量表的基本结构。通过因子分析可以考察问卷是否能够测量出研究者设计问卷时假设的某种结构。在因子分析的结果中,用于评价结构效度的主要指标有累积贡献率、共同度和因子负荷。累积贡献率反映公因子对量表或问卷的累积有效程度,共同度反映由公因子解释原变量的有效程度,因子负荷反映原变量与某个公因子的相关程度。
因子分析又分为探索性因子分析(Exploratory Factor Analysis,EFA)和验证性因子分析(Confirmatory Factor Analysis, CFA)
探索性因子分析(EFA):主要是为了找出影响观测变量的因子个数,以及各个因子和各个观测变量之间的相关程度,以试图揭示一套相对比较大的变量的内在结构。
简单且具体来说:我的问卷有20个题目,我不知道这20个题目中,含有几个变量(观测变量的因子个数),所以我用探索性因子分析来找找看。或者说,我的研究主题是A,然后我通过阅读文献发现,测量这个A的问卷一共有20个题目,但是我现在想研究A的维度(将公因子分类,看看这些题目有哪些公共部分,即我们要找的维度),那么就用探索性因子分析。
验证性因子分析(Confirmatory Factor Analysis, CFA):与探索性因子分析相比,验证性因子分析建立在研究者已经对所研究的因子和内在结构有了完整研究的假设基础上,它允许研究者明确描述模型完整细节,包括各观测变量、因子、残差之间的关系,而分析的目的是对相应的模型假设进行检验,确认数据是否符合所做的模型假设。一般来讲,根据拟合结果,模型假设可能需要进行调整,然后再重新拟合,指导模型的拟合度可以接受。
举个例子来说:我要研究主题A,并且我知道这个主题A有3个维度,那么我要验证各维度的题目和各个维度对应关系是否和我的预测保持一致。就用验证性因子分析。
对于社科类的文章来说,都是成熟的量表,各维度和题项都是确定的。所以大部分都是采用验证性因子分析。
但是为了方便,我会具体讲解两种方法的使用。
一、探索性因子分析的具体操作步骤
现在假设,我不知道我想研究的主题辱“辱虐管理”中的公因子个数,也不清楚观测变量与因子之间又怎样的关联结构,只是基于数据本身进行分析。
降维→因子

点击进入下一步后,大家注意,如果是分量表测量的话一定要分量表进行因子分析。即每个变量都要单独做一次因子分析。如果是整体的量表(大部分本科毕业论文和少部分硕士论文会用到整体),那就把所有题目都选入其中。因为大部分本科论文的变量都是单一维度,所以我们可以选择选择全部量表。但是如果是分量表,一定要分开进行

紧接着,点击描述,选择系数、显著性水平、决定因子和KMO和巴特利特球形度检验

点击继续然后选择提取,其中,方法一定要选择主成分法,提取选择特征值大于1(必要时也可以选择特征值小于1,但是在专业上有明确含义的公因子)碎石图理论上是要选的。。实际上就看情况选择,因为碎石图的作用我认为是比较直观的让你看出因子提取的数量。。。但是在总方差解释表中,我们凭借特征值和累计贡献率也能判断

然后点击继续,选择旋转,一定要选择最大方差法

点击继续,选择得分(可以跳过),这个部分是计算因子得分的第一种方法:因子分析法。各变量(维度)的因子得分通过因子分析直接计算。如果需要点击保存为变量即可

最后一个“选项”是调整结果的输出形式的。选择按大小排序。“禁止显示小系数”的意思是,绝对值小于0.3的系数不会显示。增加变量的分辨效果的。

具体的输出结果和解读如下:

首先是KMO和巴特利特检验表,这个表最主要的两个值分别是KMO指和显著性。
KMO:KMO统计量越接近于1,说明因子间的偏相关性越强,因子分析效果就越好。在实际分析中,当KMO检验统计量大于0.7时,因子分析效果一般会比较好;而当KMO检验统计量小于0.5时,不适合用因子分析法,应当考虑重新设计变量结构或者采用其他统计方法。本例中,KMO=0.890,大于0.7,说明适合进行因子分析。
显著性:P=0.000,说明在α<0.001的水平下显著。即,各变量(题项)独立的假设被拒绝,变量(题项)间具有较强的相关性。
其次,公因子方差,它表示各变量(题项)中,所含有的原始信息能被提取的公因子代表的程度。在实际运用中,提取致大于0.6即视为解释能力较强。

碎石图显示各因子的重要程度,其横轴代表因子序号,纵轴代表特征值的大小。前面的陡坡对应较大的特征值,作用明显;后面的平台对应较小的特征值,作用较弱。本例中,前两个因子的三点位于陡坡上,而后其余的因子三点则形成缓坡和平台,且特征值小于1,因此考虑前两个因子即可。

在总方差解释表中,先看特征值,因为我们选择提取特征值大于1的公因子,通过特征值判断提取了几个因子。再看总方差表的累积%,即几个公因子累积解释的方差比例,理想状态是达到80-85%,市场研究中能超过50%就可以接受了,70%就很好了。本例中,特征值大于1的有个2个公因子,且累计方差贡献率为75.678%>0.7。

为了便于观察,我们之前使用了“选项”种的“系数显示格式”对结果进行重新排序和简化。可见表格按照系数大小进行了排序,而且系数绝对值小于0.3的也被禁止输出了,这样结果就更清晰易读了。由旋转后的结果可以看出,因子1的题目在反应替代性辱虐管理上有较大载荷,因此命名为替代性辱虐管理;因子2在自我感知的辱虐管理上有较大载荷,因此命名为自我感知的辱虐管理。
本文来自zhihu,观点不代表一起大数据-技术文章心得立场,如若转载,请注明出处:https://zhuanlan.zhihu.com/p/448511605
注意:本文归作者所有,未经作者允许,不得转载