Rango (estadísticas) - Range (statistics)

En estadística , el rango de un conjunto de datos es la diferencia entre los valores más grandes y más pequeños. La diferencia aquí es específica, el rango de un conjunto de datos es el resultado de restar el máximo y el mínimo de la muestra .

Sin embargo, en estadística descriptiva , este concepto de rango tiene un significado más complejo. El rango es el tamaño del intervalo más pequeño (estadísticas) que contiene todos los datos y proporciona una indicación de la dispersión estadística . Se mide en las mismas unidades que los datos. Dado que solo depende de dos de las observaciones, es más útil para representar la dispersión de pequeños conjuntos de datos.

Para variables aleatorias IID continuas

Para n variables aleatorias continuas independientes e idénticamente distribuidas X 1 , X 2 , ..., X n con función de distribución acumulativa G ( x ) y función de densidad de probabilidad g ( x ). Sea T el rango de una muestra de tamaño n de una población con función de distribución G ( x ).

Distribución

El rango tiene función de distribución acumulativa

Gumbel señala que "la belleza de esta fórmula está completamente empañada por el hecho de que, en general, no podemos expresar G ( x  +  t ) por G ( x ), y que la integración numérica es larga y tediosa".

Si la distribución de cada X i está limitada a la derecha (o izquierda), entonces la distribución asintótica del rango es igual a la distribución asintótica del valor más grande (más pequeño). Para distribuciones más generales, la distribución asintótica se puede expresar como una función de Bessel .

Momentos

El rango medio viene dado por

donde x ( G ) es la función inversa. En el caso de que cada uno de los X i tenga una distribución normal estándar , el rango medio viene dado por

Para variables aleatorias continuas no IID

Para n variables aleatorias continuas independientes distribuidas no idénticamente X 1 , X 2 , ..., X n con funciones de distribución acumulativa G 1 ( x ), G 2 ( x ), ..., G n ( x ) y funciones de densidad de probabilidad g 1 ( x ), g 2 ( x ), ..., g n ( x ), el rango tiene función de distribución acumulativa

Para variables aleatorias IID discretas

Para n variables aleatorias discretas independientes e idénticamente distribuidas X 1 , X 2 , ..., X n con función de distribución acumulativa G ( x ) y función de masa de probabilidad g ( x ) el rango de X i es el rango de una muestra de tamaño n de una población con función de distribución G ( x ). Podemos suponer sin pérdida de generalidad que el soporte de cada X i es {1,2,3, ..., N } donde N es un número entero positivo o infinito.

Distribución

El rango tiene función de masa de probabilidad

Ejemplo

Si suponemos que g ( x ) = 1 / N , la distribución uniforme discreta para todo x , entonces encontramos

Derivación

La probabilidad de tener un valor de rango específico, t , se puede determinar sumando las probabilidades de tener dos muestras que difieran en t , y que todas las demás muestras tengan un valor entre los dos extremos. La probabilidad de que una muestra tenga un valor de x es . La probabilidad de que otro tenga un valor t mayor que x es:

La probabilidad de que todos los demás valores se encuentren entre estos dos extremos es:

Combinando los tres juntos se obtiene:

Cantidades relacionadas

El rango es un ejemplo específico de estadísticas de pedidos . En particular, el intervalo es una función lineal de estadísticas de orden, que lo pone en el alcance de L-estimación .

Ver también

Referencias