Análisis de covarianza - Analysis of covariance

El análisis de covarianza ( ANCOVA ) es un modelo lineal general que combina ANOVA y regresión . ANCOVA evalúa si las medias de una variable dependiente (DV) son iguales en todos los niveles de una variable independiente categórica (IV) a menudo llamada tratamiento, mientras que controla estadísticamente los efectos de otras variables continuas que no son de interés principal, conocidas como covariables ( CV) o variables molestas. Matemáticamente, ANCOVA descompone la varianza en el DV en varianza explicada por los CV, varianza explicada por el IV categórico y varianza residual. Intuitivamente, se puede pensar que ANCOVA 'ajusta' el VD por medio del grupo de los CV.

El modelo ANCOVA asume una relación lineal entre la respuesta (DV) y la covariable (CV):

En esta ecuación, el DV, es la j-ésima observación del i-ésimo grupo categórico; el CV, es la j- ésima observación de la covariable bajo el i- ésimo grupo. Las variables del modelo que se derivan de los datos observados son (la gran media) y (la media global de la covariable ). Las variables a ajustar son (el efecto del i- ésimo nivel del IV), (la pendiente de la línea) y (el término de error no observado asociado para la j- ésima observación en el i- ésimo grupo).

Según esta especificación, los efectos del tratamiento categórico suman cero. También se supone que son válidos los supuestos estándar del modelo de regresión lineal, como se analiza a continuación.

Usos

Aumentar la potencia

El ANCOVA se puede utilizar para aumentar el poder estadístico (la probabilidad de que se encuentre una diferencia significativa entre los grupos cuando existe una) al reducir la varianza del error dentro del grupo . Para entender esto, es necesario entender la prueba utilizada para evaluar las diferencias entre los grupos, la prueba F . La prueba F se calcula dividiendo la varianza explicada entre los grupos (por ejemplo, las diferencias de recuperación médica) por la varianza no explicada dentro de los grupos. Por lo tanto,

Si este valor es mayor que un valor crítico, concluimos que existe una diferencia significativa entre los grupos. La varianza inexplicable incluye la varianza del error (por ejemplo, diferencias individuales), así como la influencia de otros factores. Por tanto, la influencia de los CV se agrupa en el denominador. Cuando controlamos el efecto de los CV en el DV, lo eliminamos del denominador haciendo que F sea más grande, aumentando así su poder para encontrar un efecto significativo, si es que existe alguno.

Varianza de partición

Ajustar diferencias preexistentes

Otro uso de ANCOVA es ajustar las diferencias preexistentes en grupos no equivalentes (intactos). Esta controvertida aplicación tiene como objetivo corregir las diferencias de grupo iniciales (antes de la asignación de grupo) que existen en DV entre varios grupos intactos. En esta situación, los participantes no pueden igualarse a través de la asignación aleatoria, por lo que los CV se utilizan para ajustar las puntuaciones y hacer que los participantes sean más similares que sin el CV. Sin embargo, incluso con el uso de covariables, no existen técnicas estadísticas que puedan equiparar grupos desiguales. Además, el CV puede estar tan íntimamente relacionado con el IV que eliminar la variación en el DV asociado con el CV eliminaría una variación considerable en el DV, haciendo que los resultados no tengan sentido.

Supuestos

Hay varios supuestos clave que subyacen al uso de ANCOVA y afectan la interpretación de los resultados. Los supuestos de regresión lineal estándar son válidos; además, asumimos que la pendiente de la covariable es igual en todos los grupos de tratamiento (homogeneidad de las pendientes de regresión).

Supuesto 1: linealidad de la regresión

La relación de regresión entre la variable dependiente y las variables concomitantes debe ser lineal.

Supuesto 2: homogeneidad de las variaciones de error

El error es una variable aleatoria con media cero condicional y varianzas iguales para diferentes clases de tratamiento y observaciones.

Supuesto 3: independencia de los términos de error

Los errores no están correlacionados. Es decir, la matriz de covarianza de error es diagonal.

Homogeneidad de las pendientes de regresión.png

Supuesto 4: normalidad de los términos de error

Los residuos (términos de error) deben distribuirse normalmente ~ .

Supuesto 5: homogeneidad de las pendientes de regresión

Las pendientes de las diferentes líneas de regresión deben ser equivalentes, es decir, las líneas de regresión deben ser paralelas entre los grupos.

La quinta cuestión, relacionada con la homogeneidad de las diferentes pendientes de regresión de tratamiento, es particularmente importante para evaluar la idoneidad del modelo ANCOVA. También tenga en cuenta que solo necesitamos que los términos de error se distribuyan normalmente. De hecho, tanto la variable independiente como las variables concomitantes no se distribuirán normalmente en la mayoría de los casos.

Realización de un ANCOVA

Prueba de multicolinealidad

Si un CV está muy relacionado con otro CV (con una correlación de 0,5 o más), entonces no ajustará el DV por encima del otro CV. Uno u otro deben eliminarse ya que son estadísticamente redundantes.

Probar el supuesto de homogeneidad de la varianza

Probado por la prueba de Levene de igualdad de varianzas de error. Esto es más importante después de que se han realizado los ajustes, pero si lo tiene antes del ajuste, es probable que lo tenga después.

Probar la homogeneidad del supuesto de pendientes de regresión

Para ver si el CV interactúa significativamente con el IV, ejecute un modelo ANCOVA que incluya tanto el IV como el término de interacción CVxIV. Si la interacción CVxIV es significativa, no se debe realizar ANCOVA. En cambio, Green & Salkind sugiere evaluar las diferencias de grupo en el DV en niveles particulares del CV. También considere usar un análisis de regresión moderado , tratando el CV y ​​su interacción como otro IV. Alternativamente, se podrían utilizar análisis de mediación para determinar si el CV explica el efecto de la IV en la VD.

Ejecutar análisis ANCOVA

Si la interacción CV × IV no es significativa, vuelva a ejecutar el ANCOVA sin el término de interacción CV × IV. En este análisis, debe utilizar las medias ajustadas y el MSerror ajustado. Las medias ajustadas (también denominadas medias de mínimos cuadrados, medias LS, medias marginales estimadas o EMM) se refieren a las medias del grupo después de controlar la influencia del CV en el DV.

Gráfico de efectos principales simple que muestra una pequeña interacción entre los dos niveles de la variable independiente.

Análisis de seguimiento

Si hubo un efecto principal significativo , significa que hay una diferencia significativa entre los niveles de un IV, ignorando todos los demás factores. Para encontrar exactamente qué niveles son significativamente diferentes entre sí, se pueden usar las mismas pruebas de seguimiento que para el ANOVA. Si hay dos o más IV, puede haber una interacción significativa , lo que significa que el efecto de un IV en el DV cambia según el nivel de otro factor. Se pueden investigar los efectos principales simples utilizando los mismos métodos que en un ANOVA factorial .

Consideraciones de energía

Si bien la inclusión de una covariable en un ANOVA generalmente aumenta el poder estadístico al tener en cuenta parte de la varianza en la variable dependiente y, por lo tanto, aumenta la razón de varianza explicada por las variables independientes, agregar una covariable en ANOVA también reduce los grados de libertad . En consecuencia, agregar una covariable que represente una varianza muy pequeña en la variable dependiente podría en realidad reducir la potencia.

Ver también

  • MANCOVA (análisis multivariado de covarianza)

Referencias

enlaces externos