Análisis de varianza bidireccional - Two-way analysis of variance

En las estadísticas , la de dos vías de análisis de varianza ( ANOVA ) es una extensión de la ANOVA de una vía que examina la influencia de dos diferentes categorías variables independientes en una continua variable dependiente . El ANOVA bidireccional no solo tiene como objetivo evaluar el efecto principal de cada variable independiente, sino también si existe alguna interacción entre ellas.

Historia

En 1925, Ronald Fisher menciona el ANOVA bidireccional en su célebre libro, Métodos estadísticos para investigadores (capítulos 7 y 8). En 1934, Frank Yates publicó los procedimientos para el caso desequilibrado. Desde entonces, se ha producido una extensa literatura. El tema fue revisado en 1993 por Yasunori Fujikoshi . En 2005, Andrew Gelman propuso un enfoque diferente de ANOVA, visto como un modelo multinivel .

Conjunto de datos

Imaginemos un conjunto de datos para el cual una variable dependiente puede estar influenciada por dos factores que son fuentes potenciales de variación. El primer factor tiene niveles ( ) y el segundo tiene niveles ( ) . Cada combinación define un tratamiento , para un total de tratamientos. Representamos el número de réplicas para el tratamiento por , y sea ​​el índice de la réplica en este tratamiento ( ) .

A partir de estos datos, podemos construir una tabla de contingencia , donde y , y el número total de réplicas es igual a .

El diseño experimental está equilibrado si cada tratamiento tiene el mismo número de repeticiones . En tal caso, también se dice que el diseño es ortogonal , lo que permite distinguir completamente los efectos de ambos factores. Por tanto, podemos escribir y .

Modelo

Al observar la variación entre todos los puntos de datos, por ejemplo mediante un histograma , "la probabilidad puede usarse para describir dicha variación". Por lo tanto, denotemos por la variable aleatoria qué valor observado es la -ésima medida para el tratamiento . El ANOVA bidireccional modela todas estas variables como que varían independientemente y normalmente alrededor de una media , con una varianza constante, ( homocedasticidad ):

.

Específicamente, la media de la variable de respuesta se modela como una combinación lineal de las variables explicativas:

,

donde es la gran media, es el efecto principal aditivo del nivel del primer factor ( i -ésima fila en la tabla de contingencia), es el efecto principal aditivo del nivel del segundo factor ( j -ésima columna en la tabla de contingencia) y es el efecto de interacción no aditivo del tratamiento de ambos factores (celda en la fila i y columna j en la tabla de contingencia).

Otra forma equivalente de describir el ANOVA bidireccional es mencionar que, además de la variación explicada por los factores, queda algo de ruido estadístico . Esta cantidad de variación inexplicable se maneja mediante la introducción de una variable aleatoria por punto de datos , denominada error . Estas variables aleatorias se ven como desviaciones de las medias y se supone que son independientes y están distribuidas normalmente:

.

Supuestos

Siguiendo a Gelman y Hill, los supuestos del ANOVA, y más generalmente el modelo lineal general , son, en orden decreciente de importancia:

  1. los puntos de datos son relevantes con respecto a la cuestión científica bajo investigación;
  2. la media de la variable de respuesta está influenciada de forma aditiva (si no es el término de interacción) y linealmente por los factores;
  3. los errores son independientes;
  4. los errores tienen la misma varianza;
  5. los errores se distribuyen normalmente.

Estimación de parámetros

Para asegurar la identificabilidad de los parámetros, podemos agregar las siguientes restricciones de "suma a cero":

Evaluación de la hipótesis

En el enfoque clásico, la prueba de hipótesis nulas (que los factores no tienen efecto) se logra a través de su importancia, lo que requiere calcular sumas de cuadrados .

Probar si el término de interacción es significativo puede resultar difícil debido al número potencialmente elevado de grados de libertad .

Ver también

Notas

Referencias