SEM中,标准化路径系数必须<1么?

创建时间:2025-03-06 16:42

     上周的推文SEM佳作推荐!中,有一个结果图显示,该SEM模型中的路径系数大于1(下图中红圈部分)。

不少读者私信提出困惑,指出标准路径系数大于1是否意味着结果有问题,这其实也是很多人都有疑问的一个问题,今天咱们就掰开揉碎澄清一下,看看标准化路径系数是否可能大于1。

      要弄清这一问题,我们必须弄清楚标准化的路径系数是个啥?上图中结果来自以下SEM模型:

  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
#final modelmodel_final=psem(  lme(gamma_stab~alpha_stab+spatial_asynchrony+mfd+betamfd,random=~1|field, corr=corAR1(form=~1|field),df),  lme(alpha_stab ~ sp_stab + species_asynchrony+mfd,random=~1|field, corr=corAR1(form=~1|field), df),  lme(spatial_asynchrony ~ betamfd,random=~1|field, corr=corAR1(form=~1|field),df),  lme(sp_stab ~ mfd,random=~1|field, corr=corAR1(form=~1|field),df),  lme(species_asynchrony ~ mfd,random=~1|field, corr=corAR1(form=~1|field),df) ,    alpha_stab %~~% spatial_asynchrony,       # a mathematical relationship  species_asynchrony %~~% sp_stab,          # a mathematical relationship  species_asynchrony %~~%  spatial_asynchrony, ## a mathematical relationship    sp_stab %~~%    spatial_asynchrony,   species_asynchrony %~~% betamfd,  sp_stab %~~%  betamfd,  alpha_stab %~~%   betamfd)
dSep(model_final) # summary(model_final, .progressBar = T)

summary结果,对应的图中的大于1的路径系数用红色标注:

这里系数为Std.Estimates, 也就是标准化路径系数,那么这个系数是如何得来的呢?其实我们只需要把上面代码中对应的模型中的因变量和自变量同时进行标准化(减去均值,除以SD),即可以得到标准化的路径系数。也就是说,标准化的路径系数就是自变量和因变量都标准化之后的回归系数。

我们也可以直接用effectsize包下的standardise函数直接得到标准化回归系数:

那么问题来了,这个标准化的回归系数到底是何意义?他能否大于1?

这里因为我们同时都对模型中的因变量Y和自变量X都进行了标准化,那么,这里回归系数的意义就变成了X变化一个SD下,Y会变化多少个SD。

那么我们看这里数据中Y总体的变异范围是多少个SD:

可见,这里Y变化了6.87个SD。

而其中的一个自变量sp_stab的变化幅度是4.98个SD。


     所以,尽管我们对模型中的自变量和因变量都进行标准化,但他们各自有多少个SD的变异幅度,而不是大家有共同的变异幅度。所以理论上,只要自变量变化一个SD引起的因变量Y的变化超过一个SD,那么其标准回归系数就必然大于1。也就是说,标准化回归系数大于1这种情况,理论上是完全可能的

      那么我们看读者经常提出的第二个问题,标准化路径系数大于1是否可能是自变量之间共线性太强引起的?

      这当然可能,因为piecewise SEM的本质就是回归,共线性太强会引起回归系数出问题,当然也会引起SEM的的标准化路径系数出问题。

      但与一般回归模型一样,共线性检验,是我们跑一个模型之前就要检查的问题(事先就要通过共线性检验决定哪些因子可以放到同一个模型中),而不是模型跑完之后再去检查共线性问题。所以SEM也一样,跑模型之前,就需要把共线性先检查一番。

      比如上述模型的共线性检验,虽然有两个变量间的VIF值超过了3,但宽松点说,仍在可接受范围之内。

        所以,最终建议,构建SEM时,首先就要检验单个模型中不同自变量之间的共线性问题,共线性都没问题了,其他指标(如样本量,fisherC检验,dSep检验等)也都没问题了,那么标准化回归系数,是多少就写多少,不必纠结其值是否大于1

案例来源:

Meng, Y., S.-p. Li, S. Wang, S. J. Meiners, and L. Jiang. 2023. Scale-dependent changes in ecosystem temporal stability over six decades of succession. Science Advances 9:eadi1279.

SEM佳作推荐!