Prueba de Dunnett - Dunnett's test
En estadística , la prueba de Dunnett es un procedimiento de comparación múltiple desarrollado por el estadístico canadiense Charles Dunnett para comparar cada uno de varios tratamientos con un solo control. Las comparaciones múltiples con un control también se denominan comparaciones de varios a uno.
Historia
La prueba de Dunnett se desarrolló en 1955; En 1964 se publicó una tabla actualizada de valores críticos.
Problema de comparaciones múltiples
El problema de comparaciones múltiples, multiplicidad o pruebas múltiples ocurre cuando uno considera un conjunto de inferencias estadísticas simultáneamente o infiere un subconjunto de parámetros seleccionados en base a los valores observados. El tema principal en cualquier discusión sobre procedimientos de comparación múltiple es la cuestión de la probabilidad de errores de Tipo I. La mayoría de las diferencias entre las técnicas alternativas resultan de diferentes enfoques a la cuestión de cómo controlar estos errores. El problema es en parte técnico; pero en realidad es una cuestión mucho más subjetiva de cómo desea definir la tasa de error y qué tan grande está dispuesto a permitir que sea la tasa de error máxima posible. Las pruebas de Dunnett son bien conocidas y se utilizan ampliamente en el procedimiento de comparación múltiple para comparar simultáneamente, mediante estimación de intervalo o prueba de hipótesis, todos los tratamientos activos con un control cuando se toman muestras de una distribución en la que el supuesto de normalidad es razonable. La prueba de Dunnett está diseñada para mantener la tasa de error familiar igual o inferior al realizar comparaciones múltiples del grupo de tratamiento con el control.
Usos de la prueba de Dunnett
Tukey y Scheffé realizaron el trabajo original sobre el problema de las comparaciones múltiples . Su método era general, que consideraba todo tipo de comparaciones por pares. Los métodos de Tukey y Scheffé permiten cualquier número de comparaciones entre un conjunto de medias muestrales. Por otro lado, la prueba de Dunnett solo compara un grupo con los demás, abordando un caso especial de problema de comparaciones múltiples: comparaciones por pares de múltiples grupos de tratamiento con un solo grupo de control. En el caso general, donde comparamos cada uno de los pares, hacemos comparaciones (donde k es el número de grupos), pero en el caso de tratamiento vs. controles solo haremos comparaciones. Si en el caso de los grupos de tratamiento y control utilizáramos los métodos más generales de Tukey y Scheffé, pueden resultar en intervalos de confianza innecesariamente amplios. La prueba de Dunnett toma en consideración la estructura especial de comparar el tratamiento con el control, lo que produce intervalos de confianza más estrechos.
Es muy común usar la prueba de Dunnett en experimentos médicos, por ejemplo comparando mediciones de recuento sanguíneo en tres grupos de animales, uno de los cuales sirvió como control mientras que los otros dos fueron tratados con dos medicamentos diferentes. Otro uso común de este método es entre los agrónomos: los agrónomos pueden querer estudiar el efecto de ciertos químicos agregados al suelo sobre el rendimiento del cultivo, por lo que dejarán algunas parcelas sin tratar (parcelas de control) y las compararán con las parcelas donde se agregaron los químicos. el suelo (parcelas de tratamiento).
Descripción formal de la prueba de Dunnett
La prueba de Dunnett se realiza calculando una estadística t de Student para cada grupo experimental o de tratamiento, donde la estadística compara el grupo de tratamiento con un solo grupo de control. Dado que cada comparación tiene el mismo control en común, el procedimiento incorpora las dependencias entre estas comparaciones. En particular, los estadísticos t se derivan todos de la misma estimación de la varianza del error que se obtiene al agrupar las sumas de cuadrados para el error en todos los grupos (tratamiento y control). El estadístico de prueba formal para la prueba de Dunnett es el mayor valor absoluto de estos estadísticos t (si se requiere una prueba de dos colas), o el más negativo o más positivo de los estadísticos t (si una prueba de una cola es necesario).
En la prueba de Dunnett podemos usar una tabla común de valores críticos, pero las opciones más flexibles son hoy en día fácilmente disponibles en muchos paquetes de estadísticas como R . Los valores críticos para cualquier punto porcentual dado dependen de: si se realiza una prueba de una o dos colas; el número de grupos que se comparan; el número total de ensayos.
Supuestos
El análisis considera el caso donde los resultados del experimento son numéricos, y el experimento se realiza para comparar p tratamientos con un grupo de control. Los resultados se pueden resumir como un conjunto de medias calculadas de los conjuntos de observaciones, mientras que se refieren al tratamiento y se refieren al conjunto de observaciones de control, y es una estimación independiente de la desviación estándar común de todos los conjuntos de observaciones. Se supone que todos los conjuntos de observaciones se distribuyen de forma independiente y normal con una varianza y medias comunes . También se asume que hay una estimación disponible para .
Cálculo
El cálculo de la prueba de Dunnett es un procedimiento que se basa en calcular declaraciones de confianza sobre los valores verdaderos o esperados de las diferencias , por lo tanto, las diferencias entre la media de los grupos de tratamiento y la media del grupo de control. Este procedimiento garantiza que la probabilidad de todos los estados que son simultáneamente correcto es igual a un valor especificado, . Al calcular el intervalo de confianza superior (o inferior) de un lado para el valor real de la diferencia entre la media del tratamiento y el grupo de control , constituye la probabilidad de que este valor real sea menor que el límite superior (o mayor que el inferior) de ese intervalo. Al calcular el intervalo de confianza bilateral , constituye la probabilidad de que el valor real esté entre los límites superior e inferior.
Primero, denotaremos las N observaciones disponibles por cuando y y estimaremos la varianza común por, por ejemplo: cuando es la media del grupo y es el número de observaciones en el grupo y los grados de libertad. Como se mencionó anteriormente, nos gustaría obtener límites de confianza separados para cada una de las diferencias de modo que la probabilidad de que todos los intervalos de confianza contengan el correspondiente sea igual a .
Consideraremos el caso general donde hay grupos de tratamiento y un grupo de control. Escribiremos:
también escribiremos:, que sigue la distribución del estadístico t de Student con n grados de libertad . Los límites de confianza más bajos con el coeficiente de confianza conjunto para los efectos del tratamiento vendrán dados por:
y las constantes se eligen para que . Del mismo modo, los límites superiores vendrán dados por:
Para saltar en ambas direcciones, se puede tomar el siguiente intervalo:
cuando se eligen para satisfacer . La solución a esos valores particulares de para la prueba de dos caras y para la prueba de una cara se da en las tablas. En 1964 se publicó una tabla actualizada de valores críticos.
Ejemplos
Resistencia a la rotura de la tela
El siguiente ejemplo fue adaptado de uno proporcionado por Villars [6]. Los datos representan mediciones de la resistencia a la rotura de la tela tratada mediante tres procesos químicos diferentes en comparación con un método estándar de fabricación.
estándar | proceso 1 | proceso 2 | proceso 3 | |
---|---|---|---|---|
55 | 55 | 55 | 50 | |
47 | 64 | 49 | 44 | |
48 | 64 | 52 | 41 | |
Medio | 50 | 61 | 52 | 45 |
Diferencia | 19 | 27 | 9 | 21 |
Aquí, p = 3 y N = 3. La varianza promedio es , que es una estimación de la varianza común de los cuatro conjuntos con (p + 1) (N-1) = 8 grados de libertad. Esto se puede calcular de la siguiente manera:
.
La desviación estándar es y el error estándar estimado de una diferencia entre dos medias es .
La cantidad que se debe sumar y / o restar de las diferencias observadas entre las medias para dar sus límites de confianza ha sido llamada por Tukey una "tolerancia" y viene dada por , donde t se extrae de la distribución t multivariante , o puede ser obtenido de la Tabla 1 de Dunnett si se desean límites de un lado o de la Tabla 2 de Dunnett si se desean límites de dos lados. Para p = 3 y gl = 8, t = 2,42 para los límites de un lado y t = 2,88 para los límites de dos lados para p = 95%. Pueden determinarse valores análogos de t a partir de las tablas si se requiere una confianza de p = 99%. Para límites unilaterales, la tolerancia es A = (2.42) (3.56) = 9 y el experimentador puede concluir que:
- La resistencia a la rotura utilizando el proceso 1 supera el estándar en al menos
- La resistencia a la rotura mediante el proceso 2 supera el estándar en al menos .
- La resistencia a la rotura utilizando el proceso 3 supera el estándar en al menos .
La declaración conjunta que consta de las tres conclusiones anteriores tiene un coeficiente de confianza del 95%, es decir, a largo plazo, el 95% de dichas declaraciones conjuntas serán realmente correctas. Los límites superiores para las tres diferencias se pueden obtener de manera análoga. Para límites de dos lados, la tolerancia es A = (2.94) (3.56) = 11 y el experimentador puede concluir que:
- La resistencia a la rotura utilizando el proceso 1 excede el estándar en una cantidad entre
y
- La resistencia a la rotura utilizando el proceso 2 excede el estándar en una cantidad entre
y .
- La resistencia a la rotura utilizando el proceso 3 excede el estándar en una cantidad entre
y . El coeficiente de confianza conjunta para estas tres declaraciones es superior al 95%. (Debido a una aproximación hecha en el cálculo de las Tablas 2a y 2b, los valores tabulados de t son algo mayores de lo necesario, de modo que las p reales alcanzadas son ligeramente superiores al 95 y 99%. No se hizo tal aproximación en el cálculo de las Tablas 1a y 1b) .
Referencias
- ^ Upton G. y Cook I. (2006.) Un diccionario de estadística , 2e, Oxford University Press, Oxford, Reino Unido.
-
↑ Rumsey, Deborah (19 de agosto de 2009). Estadística II para tontos . Wiley. pags. 186 . Consultado el 22 de agosto de 2012 .
prueba de Dunnett desarrollada por.
- ^ Everett BS y Shrondal A. (2010.) Diccionario de estadísticas de Cambridge , 4e, Cambridge University Press, Cambridge, Reino Unido.
- ^ "Software estadístico | Tecnología de la información de la Universidad de Kentucky" . Uky.edu. Archivado desde el original el 31 de julio de 2012 . Consultado el 22 de agosto de 2012 .
- ↑ a b c d Dunnett CW (1955). "Un procedimiento de comparación múltiple para comparar varios tratamientos con un control" . Revista de la Asociación Estadounidense de Estadística . 50 : 1096-1121. doi : 10.1080 / 01621459.1955.10501294 .
- ^ a b Dunnett CW (1964.) "Nuevas tablas para comparaciones múltiples con un control", Biometrics , 20 : 482–491.
- ^ a b c David C. Howell, "Métodos estadísticos para la psicología", 8ª ed.
- ^ Prueba de Dunnett , HyperStat Online: un libro de texto introductorio de estadística y un tutorial en línea para obtener ayuda en los cursos de estadística
- ^ Mecánica de diferentes pruebas - Bioestadística BI 345 Archivado el 1 de junio de 2010 en la Wayback Machine , Saint Anselm College