Tasa de falsos positivos - False positive rate

En estadísticas , al realizar comparaciones múltiples , un ratio de falsos positivos (también conocido como caída de salida o relación de falsa alarma) es la probabilidad de rechazar falsamente la hipótesis nula para una determinada prueba . La tasa de falsos positivos se calcula como la relación entre el número de eventos negativos categorizados erróneamente como positivos (falsos positivos) y el número total de eventos negativos reales (independientemente de la clasificación).

La tasa de falsos positivos (o "tasa de falsas alarmas") generalmente se refiere a la expectativa de la tasa de falsos positivos .

Definición

La tasa de falsos positivos es

donde es el número de falsos positivos, es el número de verdaderos negativos y es el número total de verdaderos negativos fundamentales.

El nivel de significancia que se utiliza para probar cada hipótesis se establece en función de la forma de inferencia (inferencia simultánea versus inferencia selectiva ) y sus criterios de apoyo (por ejemplo, FWER o FDR ), que fueron predeterminados por el investigador.

Al realizar comparaciones múltiples en una estadística marco como el anterior, el ratio de falsos positivos (también conocida como la relación de falsa alarma , en contraposición a falsos positivos tasa / falsa alarma tasa ) generalmente se refiere a la probabilidad de rechazar falsamente la hipótesis nula para un particular, prueba . Usando la terminología sugerida aquí, es simple .

Dado que V es una variable aleatoria y es una constante ( ), la razón de falsos positivos también es una variable aleatoria, que varía entre 0-1. La tasa de falsos positivos (o "tasa de falsas alarmas") generalmente se refiere a la expectativa de la tasa de falsos positivos , expresada por .

Vale la pena notar que las dos definiciones ("proporción de falsos positivos" / "tasa de falsos positivos") son algo intercambiables. Por ejemplo, en el artículo de referencia sirve como "tasa" de falsos positivos en lugar de como su "proporción".

Clasificación de pruebas de hipótesis múltiples

La siguiente tabla define los posibles resultados al probar múltiples hipótesis nulas. Supongamos que tenemos un número m de hipótesis nulas, denotadas por: H 1 H 2 , ...,  H m . Utilizando una prueba estadística , rechazamos la hipótesis nula si la prueba se declara significativa. No rechazamos la hipótesis nula si la prueba no es significativa. La suma de cada tipo de resultado sobre todo H i   produce las siguientes variables aleatorias:

La hipótesis nula es verdadera (H 0 ) La hipótesis alternativa es verdadera (H A ) Total
La prueba se declara significativa V S R
La prueba se declara no significativa U T
Total metro

En m pruebas de hipótesis de las cuales son verdaderas hipótesis nulas, R es una variable aleatoria observable y S , T , U y V son variables aleatorias no observables .

Comparación con otras tasas de error

Si bien la tasa de falsos positivos es matemáticamente igual a la tasa de error de tipo I , se considera un término separado por las siguientes razones:

  • La tasa de error de tipo I a menudo se asocia con la configuración a priori del nivel de significancia por parte del investigador: el nivel de significancia representa una tasa de error aceptable considerando que todas las hipótesis nulas son verdaderas (la hipótesis "nula global"). Por tanto, la elección de un nivel de significancia puede ser algo arbitraria (es decir, establecer 10% (0,1), 5% (0,05), 1% (0,01), etc.)
A diferencia de eso, la tasa de falsos positivos se asocia con un resultado post-previo , que es el número esperado de falsos positivos dividido por el número total de hipótesis bajo la combinación real de hipótesis nulas verdaderas y no verdaderas (sin tener en cuenta la "global hipótesis nula). Dado que la tasa de falsos positivos es un parámetro que no está controlado por el investigador, no se puede identificar con el nivel de significancia.
  • Además, la tasa de falsos positivos se utiliza generalmente en relación con una prueba médica o un dispositivo de diagnóstico (es decir, "la tasa de falsos positivos de un determinado dispositivo de diagnóstico es del 1%"), mientras que el error de tipo I es un término asociado con las pruebas estadísticas, donde el significado de la la palabra "positivo" no es tan clara (es decir, "el error de tipo I de una prueba es del 1%").

La tasa de falsos positivos tampoco debe confundirse con la tasa de error familiar , que se define como . A medida que aumenta el número de pruebas, la tasa de error familiar suele converger a 1, mientras que la tasa de falsos positivos permanece fija.

Por último, es importante señalar la profunda diferencia entre la tasa de falsos positivos y la tasa de falsos descubrimientos : mientras que el primero se define como , el segundo se define como .

Ver también

Referencias

  1. ^ Burke, Donald; Brundage, John; Redfield, Robert (1988). "Medición de la tasa de falsos positivos en un programa de detección de infecciones por el virus de la inmunodeficiencia humana". La Revista de Medicina de Nueva Inglaterra . 319 (15): 961–964. doi : 10.1056 / NEJM198810133191501 . PMID   3419477 .