Guías de análisis para PLS-SEM y CB-SEM

Author

Roberto Gil-Saura

Published

August 31, 2025

Introducción

Anteriormente, exploramos las filosofías y diferencias conceptuales entre PLS-SEM y CB-SEM. Ahora, vamos a traducir esa teoría en acción. Una vez que has especificado tu modelo y recogido los datos, ¿cómo sabes si tu modelo es “bueno”? ¿Qué métricas debes mirar y en qué orden? Este post sirve como una guía práctica, una checklist secuencial para la evaluación de modelos en ambos paradigmas. Presentaremos los pasos lógicos, los estadísticos clave y los umbrales o “rules of thumb” comúnmente aceptados, basados en la literatura de referencia (Hair, Sarstedt, Ringle, Henseler, etc.). Estas guías no son leyes inflexibles, sino un estándar riguroso para asegurar la calidad y la validez de tu investigación. La guía de PLS-SEM, en particular, está alineada con la nomenclatura y los procedimientos del influyente paquete seminr para R.

Guía de análisis para PLS-SEM: El enfoque predictivo secuencial

La evaluación en PLS-SEM sigue una lógica de dos fases. Es crucial que el modelo de medida sea robusto antes de poder confiar en las relaciones del modelo estructural.

Fase 1: Evaluación del modelo de medida

El objetivo aquí es asegurar que tus constructos latentes están bien medidos por sus indicadores.

Paso 1: Fiabilidad de los indicadores (Cargas externas)

  • ¿Qué se comprueba? Si cada indicador individual está fuertemente correlacionado con su constructo.
  • Estadístico a mirar: Cargas externas (Outer Loadings) de los indicadores. En seminr, estas se encuentran en la salida del summary(), en la sección loadings.
  • Umbrales (Rules of Thumb):
    • Ideal: Cargas > 0.708. Esto implica que el constructo explica más del 50% de la varianza del indicador (0.708² ≈ 0.5).
    • Aceptable: Cargas entre 0.40 y 0.708. Se pueden retener si su eliminación no mejora la fiabilidad compuesta o la validez convergente del constructo.
    • A eliminar: Cargas < 0.40. Estos indicadores deben ser eliminados del modelo.

Paso 2: Fiabilidad del constructo (Consistencia interna)

  • ¿Qué se comprueba? Si el conjunto de indicadores para un constructo mide de forma consistente el mismo concepto subyacente.
  • Estadísticos a mirar: Fiabilidad compuesta (CR) y Alpha de Cronbach. La CR es generalmente preferida. En seminr, se obtienen con summary(tu_modelo)$reliability.
  • Umbrales (Rules of Thumb):
    • Ideal: CR > 0.70.
    • Aceptable en investigación exploratoria: CR entre 0.60 y 0.70.
    • Inaceptable: CR < 0.60.

Paso 3: Validez convergente

  • ¿Qué se comprueba? El grado en que un conjunto de indicadores realmente converge para medir un único constructo.
  • Estadístico a mirar: Varianza Extraída Media (AVE - Average Variance Extracted). En seminr, se encuentra junto a la fiabilidad.
  • Umbral (Rule of Thumb):
    • Requerido: AVE > 0.50. Esto significa que el constructo explica, en promedio, más del 50% de la varianza de sus indicadores.

Paso 4: Validez discriminante

  • ¿Qué se comprueba? Si un constructo es empíricamente distinto de otros constructos en el modelo.
  • Métodos y umbrales:
    • Criterio de Fornell-Larcker: La raíz cuadrada del AVE de cada constructo debe ser mayor que su correlación con cualquier otro constructo.
    • Ratio Heterotrait-Monotrait (HTMT): Considerado el método más fiable. El valor del HTMT entre dos constructos debe ser significativamente menor que 1. En seminr, se obtiene con summary(tu_modelo)$validity$htmt.
      • Umbral estricto: HTMT < 0.85 para constructos conceptualmente muy similares.
      • Umbral general: HTMT < 0.90.

Fase 2: Evaluación del modelo estructural

SOLO si el modelo de medida es satisfactorio, se procede a evaluar las relaciones entre los constructos.

Paso 5: Comprobación de la colinealidad

  • ¿Qué se comprueba? Si los constructos predictores de un constructo dependiente están demasiado correlacionados entre sí.
  • Estadístico a mirar: VIF (Variance Inflation Factor). En seminr, se obtiene con summary(tu_modelo)$validity$vif_antecedents.
  • Umbral (Rule of Thumb):
    • Ideal: VIF < 3.
    • Aceptable: VIF < 5.

Paso 6: Significación y relevancia de las relaciones

  • ¿Qué se comprueba? Si las relaciones (paths) propuestas en el modelo son estadísticamente significativas.
  • Procedimiento: Bootstrapping. En seminr, se usa la función bootstrap_model().
  • Estadísticos a mirar: Coeficientes de path (β) y sus p-valores.
  • Umbral (Rule of Thumb):
    • Significativo al 95%: p < 0.05.

Paso 7: Poder predictivo del modelo (en muestra)

  • ¿Qué se comprueba? Cuánta de la varianza de los constructos dependientes es explicada por los predictores.
  • Estadístico a mirar: R² (y R² ajustado) para cada constructo endógeno. En seminr, está en summary(tu_modelo)$paths.
  • Umbrales (Rules of Thumb - contexto-dependientes):
    • 0.75: Poder predictivo sustancial.
    • 0.50: Poder predictivo moderado.
    • 0.25: Poder predictivo débil.

Paso 8: Tamaño del efecto (f²)

  • ¿Qué se comprueba? El impacto de un predictor específico en el R² de un constructo dependiente. En seminr, se obtiene con summary(tu_modelo)$fSquare.
  • Estadístico a mirar: f² de Cohen.
  • Umbrales (Rules of Thumb):
    • 0.02: Efecto pequeño.
    • 0.15: Efecto mediano.
    • 0.35: Efecto grande.

Paso 9: Relevancia predictiva fuera de muestra (out-of-sample) con PLSpredict

  • ¿Qué se comprueba? Si el modelo puede predecir nuevos casos, no solo ajustarse a los datos existentes. Es una prueba crucial de la generalización del modelo.
  • Procedimiento: El algoritmo PLSpredict (Shmueli et al., 2019), implementado en seminr con la función predict_model(). Utiliza validación cruzada (k-fold cross-validation) para simular predicciones en datos “no vistos”.
  • Estadísticos a mirar y criterios de decisión:
    1. Q²_predict: Primero, se revisa este estadístico para cada indicador de los constructos dependientes.
      • Umbral: Q²_predict > 0. Si es positivo, significa que el modelo predice mejor que simplemente usando la media. Si es negativo para muchos indicadores, el modelo carece de relevancia predictiva y el análisis se detiene aquí.
    2. Comparación de errores de predicción: Si el paso anterior se cumple, se compara el error de predicción del modelo PLS (RMSE o MAE) con el de un modelo de referencia muy simple, el Modelo Lineal (LM).
      • Alta potencia predictiva: El modelo PLS-SEM tiene un error de predicción menor que el del LM para la mayoría de los indicadores del constructo dependiente.
      • Baja potencia predictiva: El modelo PLS-SEM tiene un error de predicción menor que el del LM para una minoría de los indicadores.
      • Sin potencia predictiva: El modelo PLS-SEM tiene un error de predicción igual o mayor que el del LM para todos los indicadores.

Guía de análisis para CB-SEM: El enfoque confirmatorio global

La evaluación en CB-SEM es más holística. Se centra en el ajuste global del modelo a los datos, aunque también requiere la validación del modelo de medida.

Fase 1: Pre-análisis y especificación del modelo

Paso 1: Identificación del modelo

  • ¿Qué se comprueba? Si hay suficiente información en los datos para estimar todos los parámetros.
  • Estadístico a mirar: Grados de libertad (df) > 0.

Paso 2: Requisitos de los datos

  • ¿Qué se comprueba? Tamaño de la muestra (N > 200 como regla general) y normalidad multivariante (ej. test de Mardia). Si no hay normalidad, se deben usar estimadores robustos (ej. MLR).

Fase 2: Evaluación del modelo de medida (usando un CFA)

Es una buena práctica evaluar el modelo de medida a través de un Análisis Factorial Confirmatorio (CFA) antes de testar el modelo estructural completo.

Paso 3: Fiabilidad y validez convergente

  • Estadísticos a mirar:
    • Cargas factoriales estandarizadas: > 0.50 (aceptable), > 0.70 (ideal).
    • Fiabilidad compuesta (CR): > 0.70.
    • Varianza Extraída Media (AVE): > 0.50.

Paso 4: Validez discriminante

  • Método: Comparar la correlación al cuadrado entre dos constructos con el AVE de cada uno de ellos. El AVE de ambos constructos debe ser mayor que su correlación al cuadrado.

Fase 3: Evaluación del modelo estructural

Paso 5: Bondad de ajuste global del modelo

  • ¿Qué se comprueba? El grado en que el modelo teórico completo se ajusta a los datos observados. Se deben reportar múltiples índices.
  • Estadísticos y umbrales (Rules of Thumb):
    • Chi-cuadrado (χ²): Se busca un p-valor > 0.05, pero es muy sensible a N. Es más útil el ratio χ²/df (< 3 es bueno, < 5 es aceptable).
    • CFI / TLI: > 0.90 (aceptable), > 0.95 (excelente).
    • RMSEA: < 0.08 (aceptable), < 0.06 (excelente).
    • SRMR: < 0.08 (excelente).

Paso 6: Significación de las relaciones estructurales

  • ¿Qué se comprueba? Si las relaciones individuales (paths) entre los constructos son estadísticamente significativas.
  • Estadísticos a mirar: Coeficientes de path estandarizados y sus p-valores (o ratios críticos - C.R. > |1.96|).

Conclusión: Rigor metodológico como estándar

Estas guías proporcionan un camino claro para la validación de modelos SEM. Aunque puedan parecer una larga lista de comprobaciones, cada paso es una barrera de calidad que asegura que las conclusiones extraídas de tu modelo sean creíbles, robustas y defendibles. Adoptar este rigor no es solo una buena práctica; es una condición necesaria para producir una investigación de mercados de alto impacto.

Referencias

Fornell, C., & Larcker, D. F. (1981). Evaluating structural equation models with unobservable variables and measurement error. Journal of Marketing Research, 18(1), 39-50. https://doi.org/10.1177/002224378101800104

Hair, J. F., Hult, G. T. M., Ringle, C. M., & Sarstedt, M. (2017). A primer on Partial Least Squares Structural Equation Modeling (PLS-SEM) (2nd ed.). Sage.

Hair, J. F., Sarstedt, M., Ringle, C. M., & Gudergan, S. P. (2018). Advanced issues in Partial Least Squares Structural Equation Modeling (PLS-SEM). Sage.

Henseler, J., Ringle, C. M., & Sarstedt, M. (2015). A new criterion for assessing discriminant validity in variance-based structural equation modeling. Journal of the Academy of Marketing Science, 43(1), 115-135. https://doi.org/10.1007/s11747-014-0403-8

Jöreskog, K. G. (1978). Structural analysis of covariance and correlation matrices. Psychometrika, 43(4), 443-477. https://doi.org/10.1007/BF02293808

Shmueli, G., Sarstedt, M., Hair, J. F., Cheah, J. H., Ting, H., & Ringle, C. M. (2019). Predictive model assessment in PLS-SEM: guidelines for using PLSpredict. European Journal of Marketing, 53(11), 2322-2347. https://doi.org/10.1108/EJM-02-2019-0189