Media intercuartil - Interquartile mean

La media intercuartil (IQM) (o media ) es una medida estadística de tendencia central basada en la media truncada del rango intercuartílico . El IQM es muy similar al método de puntuación utilizado en los deportes que son evaluados por un panel de jueces: descartar las puntuaciones más bajas y más altas; Calcule el valor medio de las puntuaciones restantes .

Cálculo

En el cálculo del IQM, solo se utilizan los datos entre el primer y tercer cuartil y se descartan el 25% más bajo y el 25% más alto de los datos.

asumiendo que los valores han sido ordenados.

Ejemplos

Tamaño del conjunto de datos divisible por cuatro

El método se explica mejor con un ejemplo. Considere el siguiente conjunto de datos:

5, 8, 4, 38, 8, 6, 9, 7, 7, 3, 1, 6

Primero ordena la lista de menor a mayor:

1, 3, 4, 5, 6, 6, 7, 7, 8, 8, 9, 38

Hay 12 observaciones (puntos de datos) en el conjunto de datos, por lo que tenemos 4 cuartiles de 3 números. Descarte los 3 valores más bajos y más altos:

1, 3, 4 , 5, 6, 6, 7, 7, 8, 8, 9, 38

Ahora tenemos 6 de las 12 observaciones restantes; a continuación, calculamos la media aritmética de estos números:

x IQM = (5 + 6 + 6 + 7 + 7 + 8) / 6 = 6.5

Esta es la media intercuartil.

A modo de comparación, la media aritmética del conjunto de datos original es

(5 + 8 + 4 + 38 + 8 + 6 + 9 + 7 + 7 + 3 + 1 + 6) / 12 = 8.5

debido a la fuerte influencia del valor atípico, 38.

Tamaño del conjunto de datos no divisible por cuatro

El ejemplo anterior constaba de 12 observaciones en el conjunto de datos, lo que facilitó la determinación de los cuartiles. Por supuesto, no todos los conjuntos de datos tienen un número de observaciones que sea divisible por 4. Podemos ajustar el método de cálculo del IQM para adaptarlo. Entonces, idealmente, queremos tener el IQM igual a la media para distribuciones simétricas, por ejemplo:

1, 2, 3, 4, 5

tiene un valor medio x mean = 3, y dado que es una distribución simétrica, sería deseable x IQM = 3.

Podemos resolver esto utilizando un promedio ponderado de los cuartiles y el conjunto de datos intercuartiles:

Considere el siguiente conjunto de datos de 9 observaciones:

1, 3, 5, 7, 9, 11, 13, 15, 17

Hay 9/4 = 2,25 observaciones en cada cuartil y 4,5 observaciones en el rango intercuartil. Truncar el tamaño del cuartil fraccional y eliminar este número del primer y cuarto cuartiles (2,25 observaciones en cada cuartil, por lo que se eliminan los 2 más bajos y los 2 más altos).

1, 3 , (5), 7, 9, 11, (13), 15, 17

Por lo tanto, hay 3 observaciones completas en el rango intercuartílico y 2 observaciones fraccionarias. Dado que tenemos un total de 4.5 observaciones en el rango intercuartílico, las dos observaciones fraccionarias cuentan cada una para 0.75 (y por lo tanto 3 × 1 + 2 × 0.75 = 4.5 observaciones).

El IQM ahora se calcula de la siguiente manera:

x IQM = {(7 + 9 + 11) + 0,75 × (5 + 13)} / 4,5 = 9

En el ejemplo anterior, la media tiene un valor x mean = 9. Lo mismo que el IQM, como se esperaba. El método de calcular el IQM para cualquier número de observaciones es análogo; las contribuciones fraccionarias al IQM pueden ser 0, 0,25, 0,50 o 0,75.

Comparación con media y mediana

La media intercuartil comparte algunas propiedades tanto de la media como de la mediana :

  • Como la mediana , el IQM es insensible a los valores atípicos ; en el ejemplo dado, el valor más alto (38) fue un valor atípico obvio del conjunto de datos, pero su valor no se usa en el cálculo del IQM. Por otro lado, el promedio común (la media aritmética ) es sensible a estos valores atípicos: x media = 8.5.
  • Como la media , el IQM es un parámetro distinto, basado en una gran cantidad de observaciones del conjunto de datos. La mediana siempre es igual a una de las observaciones del conjunto de datos (asumiendo un número impar de observaciones). La media puede ser igual a cualquier valor entre la observación más baja y la más alta, según el valor de todas las demás observaciones. El IQM puede ser igual a cualquier valor entre el primer y tercer cuartil, dependiendo de todas las observaciones en el rango intercuartil.

Ver también

Estadísticas relacionadas

Aplicaciones