Hipótesis nula - Null hypothesis

En la estadística inferencial , la hipótesis nula (a menudo denominada H 0 ) es una hipótesis predeterminada de que una cantidad a medir es cero (nula). Normalmente, la cantidad que se va a medir es la diferencia entre dos situaciones, por ejemplo, para intentar determinar si hay una prueba positiva de que se ha producido un efecto o de que las muestras proceden de diferentes lotes.

La hipótesis nula está afirmando efectivamente que una cantidad (de interés) es mayor o igual a cero y menor o igual a cero. Si cualquiera de los requisitos puede anularse positivamente, la hipótesis nula se "excluye del ámbito de las posibilidades".

En general, se asume que la hipótesis nula sigue siendo posiblemente cierta. Se pueden realizar múltiples análisis para mostrar cómo la hipótesis debe ser rechazada o excluida, por ejemplo, teniendo un alto nivel de confianza, demostrando así una diferencia estadísticamente significativa. Esto se demuestra mostrando que cero está fuera del intervalo de confianza especificado de la medición en cualquier lado, generalmente dentro de los números reales . El hecho de no excluir la hipótesis nula (con alguna confianza) no confirma ni respalda lógicamente la hipótesis nula (no demostrable). (Cuando se demuestra que algo es, por ejemplo, más grande que x , no implica necesariamente que sea plausible que sea más pequeño o igual que x ; en cambio, puede ser una medición de mala calidad con baja precisión. Confirmar la hipótesis nula de dos caras sería equivale a demostrar positivamente que es mayor o igual que 0 y a demostrar positivamente que es menor o igual a 0; esto es algo para lo que se necesita una precisión infinita, así como un efecto exactamente cero, ninguno de los cuales normalmente es realista. Además, las mediciones nunca indicar una probabilidad distinta de cero de exactamente una diferencia cero.) Entonces, el fracaso de una exclusión de una hipótesis nula equivale a un "no sé" en el nivel de confianza especificado; no implica inmediatamente nulo de alguna manera, ya que los datos pueden mostrar una indicación (menos fuerte) para un valor no nulo. El nivel de confianza utilizado no corresponde en absoluto a la probabilidad de nulo al no excluir; de hecho, en este caso, un alto nivel de confianza utilizado amplía el rango todavía plausible.

Una hipótesis no nula puede tener los siguientes significados, dependiendo del autor: a) se utiliza un valor distinto de cero, b) se utiliza algún margen distinto de cero yc) la hipótesis "alternativa".

Pruebas (excluir o no excluir) la hipótesis nula hipótesis proporciona evidencia de que existen (o no) motivos estadísticamente suficientes para pensar que existe es una relación entre dos fenómenos (por ejemplo, que un tratamiento potencial tiene un no-cero efecto, en ambos sentidos) . Probar la hipótesis nula es una tarea central en la verificación de hipótesis estadísticas en la práctica científica moderna. Existen criterios precisos para excluir o no excluir una hipótesis nula en un cierto nivel de confianza. El nivel de confianza debería indicar la probabilidad de que muchos más y mejores datos aún puedan excluir la hipótesis nula del mismo lado.

El concepto de hipótesis nula se usa de manera diferente en dos enfoques de inferencia estadística. En el enfoque de prueba de significancia de Ronald Fisher , se rechaza una hipótesis nula si es significativamente improbable que los datos observados hayan ocurrido si la hipótesis nula fuera cierta. En este caso, se rechaza la hipótesis nula y se acepta una hipótesis alternativa en su lugar. Si los datos son consistentes con la hipótesis nula estadísticamente posiblemente verdadera, entonces la hipótesis nula no se rechaza. En ningún caso está probada la hipótesis nula o su alternativa; con mejores o más datos, el nulo aún puede ser rechazado. Esto es análogo al principio legal de presunción de inocencia , en el que se supone que un sospechoso o acusado es inocente (nulo no se rechaza) hasta que se demuestre su culpabilidad (nulo se rechaza) más allá de una duda razonable (en un grado estadísticamente significativo).

En el enfoque de prueba de hipótesis de Jerzy Neyman y Egon Pearson , una hipótesis nula se contrasta con una hipótesis alternativa , y las dos hipótesis se distinguen sobre la base de los datos, con ciertas tasas de error. Se utiliza para formular respuestas en la investigación.

La inferencia estadística se puede hacer sin una hipótesis nula, especificando un modelo estadístico correspondiente a cada hipótesis candidata y utilizando técnicas de selección de modelos para elegir el modelo más apropiado. (Las técnicas de selección más comunes se basan en el criterio de información de Akaike o en el factor de Bayes ).

Principio

La prueba de hipótesis requiere la construcción de un modelo estadístico de cómo se verían los datos si el azar o los procesos aleatorios fueran los únicos responsables de los resultados. La hipótesis de que el azar es el único responsable de los resultados se denomina hipótesis nula . El modelo del resultado del proceso aleatorio se llama distribución bajo la hipótesis nula . Los resultados obtenidos se comparan con la distribución bajo la hipótesis nula, por lo que se determina la probabilidad de encontrar los resultados obtenidos.

La prueba de hipótesis funciona mediante la recopilación de datos y la medición de la probabilidad de que el conjunto particular de datos sea (asumiendo que la hipótesis nula es verdadera), cuando el estudio se realiza en una muestra representativa seleccionada al azar. La hipótesis nula asume que no hay relación entre las variables de la población de la que se selecciona la muestra .

Si el conjunto de datos de una muestra representativa seleccionada al azar es muy improbable en relación con la hipótesis nula (definida como parte de una clase de conjuntos de datos que sólo se observarán raramente), el experimentador rechaza la hipótesis nula, concluyéndola (probablemente ) Es falso. Esta clase de conjuntos de datos generalmente se especifica mediante una estadística de prueba , que está diseñada para medir el grado de desviación aparente de la hipótesis nula. El procedimiento funciona evaluando si la desviación observada, medida por el estadístico de prueba, es mayor que un valor definido, de modo que la probabilidad de ocurrencia de un valor más extremo es pequeña bajo la hipótesis nula (generalmente en menos del 5% o 1 % de conjuntos de datos similares en los que se cumple la hipótesis nula).

Si los datos no contradicen la hipótesis nula, entonces solo se puede llegar a una conclusión débil: a saber, que el conjunto de datos observados proporciona evidencia insuficiente contra la hipótesis nula. En este caso, debido a que la hipótesis nula podría ser verdadera o falsa, en algunos contextos esto se interpreta en el sentido de que los datos brindan evidencia insuficiente para llegar a una conclusión, mientras que en otros contextos, se interpreta en el sentido de que no hay evidencia suficiente para Apoyar el cambio de un régimen actualmente útil a otro diferente. No obstante, si en este punto el efecto parece probable y / o suficientemente grande, puede haber un incentivo para investigar más a fondo, como ejecutar una muestra más grande.

Por ejemplo, un determinado medicamento puede reducir la posibilidad de sufrir un ataque cardíaco. Las posibles hipótesis nulas son "este medicamento no reduce las posibilidades de sufrir un ataque cardíaco" o "este medicamento no tiene ningún efecto sobre las posibilidades de sufrir un ataque cardíaco". La prueba de hipótesis consiste en administrar el fármaco a la mitad de las personas de un grupo de estudio como experimento controlado . Si los datos muestran un cambio estadísticamente significativo en las personas que reciben el fármaco, se rechaza la hipótesis nula.

Definiciones basicas

La hipótesis nula y la hipótesis alternativa son tipos de conjeturas que se utilizan en las pruebas estadísticas, que son métodos formales para llegar a conclusiones o tomar decisiones sobre la base de datos. Las hipótesis son conjeturas sobre un modelo estadístico de la población , que se basan en una muestra de la población. Las pruebas son elementos centrales de inferencia estadística , muy utilizados en la interpretación de datos experimentales científicos, para separar las afirmaciones científicas del ruido estadístico.

"La afirmación que se prueba en una prueba de significación estadística se denomina hipótesis nula . La prueba de significación está diseñada para evaluar la solidez de la evidencia frente a la hipótesis nula. Por lo general, la hipótesis nula es una afirmación de 'ningún efecto' o ' ninguna diferencia'." A menudo se simboliza como H 0 .

El enunciado que se está probando contra la hipótesis nula es la hipótesis alternativa . Los símbolos incluyen H 1 y H a .

Prueba de significación estadística: "De manera muy aproximada, el procedimiento para decidir es el siguiente: tome una muestra aleatoria de la población. Si los datos de la muestra son consistentes con la hipótesis nula, entonces no rechace la hipótesis nula; si los datos de la muestra son inconsistentes con la hipótesis nula, luego rechace la hipótesis nula y concluya que la hipótesis alternativa es verdadera ".

Las siguientes secciones agregan contexto y matices a las definiciones básicas.

Ejemplo

Dadas las puntuaciones de las pruebas de dos muestras aleatorias , una de hombres y otra de mujeres, ¿se diferencia un grupo del otro? Una posible hipótesis nula es que la puntuación media de los hombres es la misma que la media de las mujeres:

H 0 : μ 1 = μ 2

dónde

H 0 = la hipótesis nula,
μ 1 = la media de la población 1, y
μ 2 = la media de la población 2.

Una hipótesis nula más sólida es que las dos muestras se extraen de la misma población, de modo que las varianzas y formas de las distribuciones también son iguales.

Terminología

Hipótesis simple
Cualquier hipótesis que especifique completamente la distribución de la población. Para tal hipótesis, la distribución muestral de cualquier estadística es una función únicamente del tamaño de la muestra.
Hipótesis compuesta
Cualquier hipótesis que no especifique completamente la distribución de la población. Ejemplo: una hipótesis que especifica una distribución normal con una media especificada y una varianza no especificada.

La distinción simple / compuesta fue hecha por Neyman y Pearson.

Hipótesis exacta
Cualquier hipótesis que especifique un valor de parámetro exacto. Ejemplo: μ = 100. Sinónimo: hipótesis puntual .
Hipótesis inexacta
Aquellos que especifican un rango o intervalo de parámetros. Ejemplos: μ ≤ 100; 95 ≤ μ ≤ 105.

Fisher requirió una hipótesis nula exacta para probar (consulte las citas a continuación).

Una hipótesis unilateral (probada mediante una prueba unilateral) es una hipótesis inexacta en la que el valor de un parámetro se especifica como:

  • por encima o igual a un cierto valor, o
  • por debajo o igual a un cierto valor.

Se dice que una hipótesis de una cola tiene direccionalidad .

El ejemplo original de Fisher ( té de degustación de dama ) fue una prueba de una cola. La hipótesis nula fue asimétrica. La probabilidad de adivinar todas las tazas correctamente era la misma que adivinar todas las tazas incorrectamente, pero Fisher notó que solo adivinar correctamente era compatible con la afirmación de la dama. (Vea las citas a continuación sobre su razonamiento).

Objetivos de las pruebas de hipótesis nulas

Hay muchos tipos de pruebas de significancia para una, dos o más muestras, para medias, varianzas y proporciones, datos emparejados o no emparejados, para diferentes distribuciones, para muestras grandes y pequeñas; todos tienen hipótesis nulas. También hay al menos cuatro objetivos de hipótesis nulas para las pruebas de significancia:

  • Las hipótesis técnicas nulas se utilizan para verificar los supuestos estadísticos. Por ejemplo, los residuos entre los datos y un modelo estadístico no se pueden distinguir del ruido aleatorio. Si es cierto, no hay justificación para complicar el modelo.
  • Los supuestos científicos nulos se utilizan para avanzar directamente una teoría. Por ejemplo, el momento angular del universo es cero. Si no es cierto, la teoría del universo primitivo puede necesitar una revisión.
  • Se utilizan hipótesis nulas de homogeneidad para verificar que múltiples experimentos están produciendo resultados consistentes. Por ejemplo, el efecto de un medicamento en los ancianos es coherente con el de la población adulta en general. Si es cierto, esto refuerza la conclusión de eficacia general y simplifica las recomendaciones de uso.
  • Las hipótesis nulas que afirman la igualdad de efecto de dos o más tratamientos alternativos, por ejemplo, un fármaco y un placebo, se utilizan para reducir las afirmaciones científicas basadas en el ruido estadístico. Ésta es la hipótesis nula más popular; Es tan popular que muchas declaraciones sobre pruebas significativas asumen tales hipótesis nulas.

El rechazo de la hipótesis nula no es necesariamente el objetivo real de un probador de significancia. Un modelo estadístico adecuado puede estar asociado con la imposibilidad de rechazar el nulo; el modelo se ajusta hasta que no se rechaza el nulo. Fisher conocía bien los numerosos usos de las pruebas de significación, que analizó muchos de ellos en su libro escrito una década antes de definir la hipótesis nula.

Una prueba de significación estadística comparte muchas matemáticas con un intervalo de confianza . Se iluminan mutuamente . Un resultado suele ser significativo cuando hay confianza en el signo de una relación (el intervalo no incluye 0). Siempre que el signo de una relación sea importante, la significación estadística es un objetivo digno. Esto también revela las debilidades de las pruebas de significancia: un resultado puede ser significativo sin una buena estimación de la fuerza de una relación; la importancia puede ser una meta modesta. Una relación débil también puede alcanzar importancia con suficientes datos. Por lo general, se recomienda informar tanto la importancia como los intervalos de confianza.

Los variados usos de las pruebas de significancia reducen el número de generalizaciones que se pueden hacer sobre todas las aplicaciones.

Elección de la hipótesis nula

La elección de la hipótesis nula se asocia con consejos escasos e inconsistentes. Fisher mencionó algunas restricciones sobre la elección y afirmó que se deben considerar muchas hipótesis nulas y que son posibles muchas pruebas para cada una. La variedad de aplicaciones y la diversidad de objetivos sugiere que la elección puede ser complicada. En muchas aplicaciones, la formulación de la prueba es tradicional. La familiaridad con la variedad de pruebas disponibles puede sugerir una hipótesis nula y una prueba en particular. La formulación de la hipótesis nula no está automatizada (aunque los cálculos de las pruebas de significancia generalmente lo son). Sir David Cox ha dicho: "La forma en que se hace [la] traducción del problema de la materia al modelo estadístico es a menudo la parte más crítica de un análisis".

Una prueba de significación estadística está destinada a probar una hipótesis. Si la hipótesis resume un conjunto de datos, no tiene ningún valor probar la hipótesis en ese conjunto de datos. Ejemplo: si un estudio de los informes meteorológicos del año pasado indica que la lluvia en una región cae principalmente los fines de semana, solo es válido probar esa hipótesis nula en los informes meteorológicos de cualquier otro año. Probar hipótesis sugeridas por los datos es un razonamiento circular que no prueba nada; Es una limitación especial a la elección de la hipótesis nula.

Un procedimiento de rutina es el siguiente: Partir de la hipótesis científica. Traduzca esto a una hipótesis alternativa estadística y proceda: "Debido a que H a expresa el efecto del que deseamos encontrar evidencia, a menudo comenzamos con H a y luego establecemos H 0 como el enunciado de que el efecto esperado no está presente. " Este consejo se invierte para las aplicaciones de modelado en las que esperamos no encontrar evidencia en contra de la nula.

Un ejemplo de caso complejo es el siguiente: El estándar de oro en la investigación clínica es el ensayo clínico aleatorizado , doble ciego, controlado con placebo . Pero probar un nuevo medicamento contra un placebo (médicamente ineficaz) puede no ser ético para una enfermedad grave. Probar un fármaco nuevo frente a un fármaco más antiguo médicamente eficaz plantea cuestiones filosóficas fundamentales con respecto al objetivo de la prueba y la motivación de los experimentadores. La hipótesis nula estándar de "ninguna diferencia" puede recompensar a la compañía farmacéutica por recopilar datos inadecuados. La "diferencia" es una hipótesis nula mejor en este caso, pero la significación estadística no es un criterio adecuado para llegar a una conclusión matizada que requiere una buena estimación numérica de la eficacia del fármaco. Un cambio propuesto "menor" o "simple" en la hipótesis nula ((nuevo versus antiguo) en lugar de (nuevo versus placebo)) puede tener un efecto dramático en la utilidad de una prueba por razones complejas no estadísticas.

Direccionalidad

La elección de la hipótesis nula ( H 0 ) y la consideración de la direccionalidad (ver " prueba de una cola ") es fundamental.

Coincidencia de la prueba de hipótesis nula

Considere la cuestión de si una moneda lanzada es justa (es decir, que en promedio cae cara el 50% de las veces) y un experimento en el que lance la moneda 5 veces. Un posible resultado del experimento que consideramos aquí es 5 cabezas. Considere que los resultados son poco probables con respecto a una distribución supuesta si su probabilidad es menor que un umbral de significancia de 0.05.

Una posible hipótesis nula que implica una prueba de una cola es "esta moneda no está sesgada hacia caras". Tenga en cuenta que, en este contexto, la palabra "cola" tiene dos significados: como resultado de un solo lanzamiento o como región de valores extremos en una distribución de probabilidad.

De hecho, con una moneda justa, la probabilidad de que el resultado de este experimento sea 1/2 5 = 0.031, que sería aún menor si la moneda estuviera sesgada a favor de la cruz. Por lo tanto, las observaciones no son lo suficientemente probables para que se mantenga la hipótesis nula, y la prueba la refuta. Dado que la moneda no es aparentemente ni justa ni sesgada hacia la cruz, la conclusión del experimento es que la moneda está sesgada hacia las caras.

Alternativamente, una hipótesis nula que implica una prueba de dos colas es "esta moneda es justa". Esta hipótesis nula podría examinarse buscando demasiadas colas o demasiadas caras en los experimentos. Los resultados que tenderían a rechazar esta hipótesis nula son aquellos con un gran número de caras o un gran número de cruces, y nuestro experimento con 5 caras parecería pertenecer a esta clase.

Sin embargo, la probabilidad de 5 lanzamientos del mismo tipo, independientemente de si son cara o cruz, es el doble que la de la aparición de 5 caras considerada individualmente. Por lo tanto, bajo esta hipótesis nula de dos colas, la observación recibe un valor de probabilidad de 0.063. Por lo tanto, nuevamente, con el mismo umbral de significancia usado para la prueba de una cola (0.05), el mismo resultado no es estadísticamente significativo. Por lo tanto, la hipótesis nula de dos colas se conservará en este caso, sin apoyar la conclusión a la que se llegó con la hipótesis nula de una sola cola, de que la moneda está sesgada hacia caras.

Este ejemplo ilustra que la conclusión a la que se llega de una prueba estadística puede depender de la formulación precisa de las hipótesis nula y alternativa.

Discusión

Fisher dijo que "la hipótesis nula debe ser exacta, es decir, libre de vaguedad y ambigüedad, porque debe proporcionar la base del 'problema de distribución', del cual la prueba de significancia es la solución", lo que implica un dominio más restrictivo para H 0 . Según este punto de vista, la hipótesis nula debe ser numéricamente exacta: debe establecer que una cantidad o diferencia particular es igual a un número particular. En la ciencia clásica, lo más típico es la afirmación de que no hay efecto de un tratamiento en particular; en las observaciones, es típico que no haya diferencia entre el valor de una variable medida en particular y el de una predicción.

La mayoría de los estadísticos creen que es válido establecer la dirección como parte de una hipótesis nula, o como parte de un par de hipótesis nulas / hipótesis alternativas. Sin embargo, los resultados no son una descripción completa de todos los resultados de un experimento, simplemente un resultado único adaptado a un propósito particular. Por ejemplo, considere una H 0 que afirma que la media de la población para un nuevo tratamiento es una mejora con respecto a un tratamiento bien establecido con una media de la población = 10 (conocida por una larga experiencia), con la alternativa de una cola que es que la media del nuevo tratamiento > 10 . Si la evidencia muestral obtenida mediante x -bar es igual a −200 y el estadístico de la prueba t correspondiente es igual a −50, la conclusión de la prueba sería que no hay evidencia de que el nuevo tratamiento sea mejor que el existente: no reportaría que es notablemente peor, pero eso no es lo que busca esta prueba en particular. Para superar cualquier posible ambigüedad al informar el resultado de la prueba de una hipótesis nula, es mejor indicar si la prueba fue bilateral y, si es unilateral, incluir la dirección del efecto que se está probando.

La teoría estadística requerida para tratar los casos simples de direccionalidad aquí tratados, y los más complicados, hace uso del concepto de prueba no sesgada .

La direccionalidad de las hipótesis no siempre es obvia. La hipótesis nula explícita del ejemplo del té de degustación de la Dama de Fisher fue que la Dama no tenía tal habilidad, lo que condujo a una distribución de probabilidad simétrica. La naturaleza de una cola de la prueba resultó de la hipótesis alternativa de una cola (un término no utilizado por Fisher). La hipótesis nula se volvió implícitamente unilateral. La negación lógica de la afirmación unilateral de la Dama también fue unilateral. (Reclamación: Habilidad> 0; Declarado nulo: Habilidad = 0; Nulo implícito: Habilidad ≤ 0).

Los argumentos puros sobre el uso de pruebas de una cola se complican por la variedad de pruebas. Algunas pruebas (por ejemplo, la prueba de bondad de ajuste χ 2 ) son inherentemente unilaterales. Algunas distribuciones de probabilidad son asimétricas. Las pruebas tradicionales de 3 o más grupos son de dos colas.

El asesoramiento sobre el uso de hipótesis unilaterales ha sido inconsistente y la práctica aceptada varía entre los campos. La mayor objeción a las hipótesis unilaterales es su subjetividad potencial. Un resultado no significativo a veces se puede convertir en un resultado significativo mediante el uso de una hipótesis de una cola (como la prueba de la moneda justa, según el capricho del analista). La otra cara del argumento: es menos probable que las pruebas unilaterales ignoren un efecto real. Las pruebas unilaterales pueden suprimir la publicación de datos que difieren en el signo de las predicciones. La objetividad fue un objetivo de los desarrolladores de pruebas estadísticas.

Es una práctica común utilizar una hipótesis de una cola de forma predeterminada. Sin embargo, "si no tiene una dirección específica firmemente en mente de antemano, utilice una alternativa de dos caras. Además, algunos usuarios de estadísticas argumentan que siempre deberíamos trabajar con la alternativa de dos caras".

Una alternativa a este consejo es utilizar pruebas de tres resultados. Elimina los problemas relacionados con la direccionalidad de las hipótesis probando dos veces, una vez en cada dirección y combinando los resultados para producir tres resultados posibles. Las variaciones de este enfoque tienen una historia, y se han sugerido quizás 10 veces desde 1950.

Los desacuerdos sobre las pruebas de una cola se derivan de la filosofía de la ciencia. Si bien Fisher estaba dispuesto a ignorar el improbable caso de que la Dama adivinara todas las tazas de té incorrectamente (lo que puede haber sido apropiado para las circunstancias), la medicina cree que un tratamiento propuesto que mata a los pacientes es significativo en todos los sentidos y debería informarse y quizás explicarse. . Las malas prácticas de presentación de informes estadísticos han contribuido a los desacuerdos sobre las pruebas unilaterales. La significación estadística resultante de las pruebas de dos colas es insensible al signo de la relación; Informar sobre la importancia por sí solo es inadecuado. "El tratamiento tiene un efecto" es el resultado no informativo de una prueba de dos colas. "El tratamiento tiene un efecto beneficioso" es el resultado más informativo de una prueba de una cola. "El tratamiento tiene un efecto, reduciendo la duración promedio de la hospitalización en 1,5 días" es el informe más informativo, que combina el resultado de una prueba de significancia de dos colas con una estimación numérica de la relación entre el tratamiento y el efecto. Informar explícitamente un resultado numérico elimina una ventaja filosófica de una prueba de una cola. Un problema subyacente es la forma apropiada de una ciencia experimental sin teorías predictivas numéricas: un modelo de resultados numéricos es más informativo que un modelo de signos de efecto (positivo, negativo o desconocido) que es más informativo que un modelo de significado simple (no cero o desconocido); en ausencia de teoría numérica, los signos pueden ser suficientes.

Historia de las pruebas estadísticas

La historia de las hipótesis nula y alternativa está incrustada en la historia de las pruebas estadísticas.

  • Antes de 1925: hay rastros transitorios ocasionales de pruebas estadísticas durante siglos en el pasado, que proporcionan ejemplos tempranos de hipótesis nulas. A finales del siglo XIX se definió la significación estadística. A principios del siglo XX se definieron importantes distribuciones de probabilidad . Gossett y Pearson trabajaron en casos específicos de pruebas de significación.
  • 1925: Fisher publicó la primera edición de Métodos estadísticos para investigadores, que definió la prueba de significación estadística y la convirtió en un método de análisis generalizado para gran parte de la ciencia experimental. El texto carecía de pruebas y carecía de explicaciones, pero estaba lleno de ejemplos reales. Colocó la práctica estadística en las ciencias mucho antes que la teoría estadística publicada.
  • 1933: En una serie de artículos (publicados durante una década a partir de 1928), Neyman & Pearson definieron la prueba de hipótesis estadística como una mejora propuesta en la prueba de Fisher. Los artículos proporcionaron gran parte de la terminología para las pruebas estadísticas, incluida la hipótesis alternativa y H 0 como hipótesis que se probará utilizando datos de observación (con H 1 , H 2 ... como alternativas). Neyman no utilizó el término hipótesis nula en escritos posteriores sobre su método.
  • 1935: Fisher publicó la primera edición del libro The Design of Experiments que introdujo la hipótesis nula (por ejemplo más que por definición) y explicó cuidadosamente la justificación de las pruebas de significancia en el contexto de la interpretación de resultados experimentales; ver El diseño de experimentos # Citas con respecto a la hipótesis nula .
  • Próximo: Fisher y Neyman se pelearon por los méritos relativos de sus formulaciones rivales hasta la muerte de Fisher en 1962. Los cambios de carrera y la Segunda Guerra Mundial terminaron la asociación de Neyman y Pearson. Las formulaciones fueron fusionadas por escritores de libros de texto relativamente anónimos, experimentadores (editores de revistas) y estadísticos matemáticos sin la participación de los directores. El tema actual combina gran parte de la terminología y el poder explicativo de Neyman & Pearson con la filosofía científica y los cálculos proporcionados por Fisher. Si las pruebas estadísticas son correctamente un tema o dos sigue siendo una fuente de desacuerdo. Muestra de dos: un texto se refiere al tema como prueba de hipótesis (sin mención de prueba de significancia en el índice) mientras que otro dice prueba de significancia (con una sección sobre inferencia como decisión). Fisher desarrolló las pruebas de significación como una herramienta flexible para que los investigadores sopesen sus pruebas. En cambio, las pruebas se han institucionalizado. La importancia estadística se ha convertido en un criterio rígidamente definido y aplicado para la publicación de resultados experimentales en muchas revistas científicas. En algunos campos, las pruebas de significación se han convertido en la forma dominante y casi exclusiva de análisis estadístico. Como consecuencia, las limitaciones de las pruebas se han estudiado exhaustivamente. Los libros se han llenado con la crítica recopilada de las pruebas de significación .

Ver también

Referencias

Otras lecturas

  • Adèr, HJ ; Mellenbergh, GJ y Hand, DJ (2007). Asesoramiento sobre métodos de investigación: acompañante de un consultor . Huizen, Países Bajos: Johannes van Kessel Publishing. ISBN 978-90-79418-01-5.
  • Efron, B. (2004). "Prueba de hipótesis simultánea a gran escala". Revista de la Asociación Estadounidense de Estadística . 99 (465): 96–104. doi : 10.1198 / 016214504000000089 . La aplicación de pruebas de significación en este documento es un caso atípico. ¿Pruebas para encontrar una hipótesis nula? ¿No tratando de mostrar significado, sino de encontrar casos interesantes?
  • Rice, William R .; Gaines, Steven D. (junio de 1994). " ' Cara yo gano, cruz tú pierdes': probar hipótesis alternativas direccionales en la investigación ecológica y evolutiva". ÁRBOL . 9 (6): 235–237. doi : 10.1016 / 0169-5347 (94) 90258-5 . PMID  21236837 . Las pruebas dirigidas combinan los atributos de las pruebas de una cola y de dos colas. "... las pruebas dirigidas deben utilizarse en prácticamente todas las aplicaciones en las que se hayan utilizado anteriormente pruebas unilaterales, excepto en aquellos casos en los que los datos sólo pueden desviarse de H 0 , en una dirección".

enlaces externos