Curtosis - Kurtosis

En teoría de la probabilidad y estadísticas , kurtosis (de griego : κυρτός , kyrtos o Kürtös , que significa "curvado, arqueando") es una medida de la "tailedness" de la distribución de probabilidad de un verdadero -valued variable aleatoria . Al igual que la asimetría , la curtosis describe la forma de una distribución de probabilidad y hay diferentes formas de cuantificarla para una distribución teórica y las formas correspondientes de estimarla a partir de una muestra de una población. Las diferentes medidas de curtosis pueden tener diferentes interpretaciones .

La medida estándar de la curtosis de una distribución, que se origina con Karl Pearson , es una versión escalada del cuarto momento de la distribución. Este número está relacionado con las colas de la distribución, no con su pico; por lo tanto, la caracterización de la curtosis que a veces se ve como "pico" es incorrecta. Para esta medida, una mayor curtosis corresponde a una mayor extremidad de las desviaciones (o valores atípicos ), y no a la configuración de los datos cerca de la media .

La curtosis de cualquier distribución normal univariante es 3. Es común comparar la curtosis de una distribución con este valor. Se dice que las distribuciones con una curtosis menor de 3 son platicúrticas , aunque esto no implica que la distribución sea "plana", como a veces se dice. Más bien, significa que la distribución produce menos valores atípicos y menos extremos que la distribución normal. Un ejemplo de distribución platicúrtica es la distribución uniforme , que no produce valores atípicos. Se dice que las distribuciones con curtosis mayor de 3 son leptocurticas . Un ejemplo de una distribución leptocúrtica es la distribución de Laplace , que tiene colas que asintóticamente se acercan a cero más lentamente que una gaussiana y, por lo tanto, produce más valores atípicos que la distribución normal. También es una práctica común utilizar una versión ajustada de la curtosis de Pearson, la curtosis en exceso, que es la curtosis menos 3, para proporcionar la comparación con la distribución normal estándar . Algunos autores usan "curtosis" por sí misma para referirse al exceso de curtosis. Sin embargo, para mayor claridad y generalidad, este artículo sigue la convención de no exceso e indica explícitamente dónde se entiende el exceso de curtosis.

Las medidas alternativas de curtosis son: la L-curtosis , que es una versión escalada del cuarto momento L ; medidas basadas en cuatro cuantiles de población o muestra . Son análogas a las medidas alternativas de asimetría que no se basan en momentos ordinarios.

Momentos de Pearson

La curtosis es el cuarto momento estandarizado , definido como

donde μ 4 es el cuarto momento central y σ es la desviación estándar . En la literatura se utilizan varias letras para denotar la curtosis. Una opción muy común es κ , que está bien siempre que esté claro que no se refiere a un acumulativo . Otras opciones incluyen γ 2 , para ser similar a la notación de asimetría, aunque a veces esto se reserva para el exceso de curtosis.

La curtosis está limitada a continuación por la asimetría al cuadrado más 1:

donde μ 3 es el tercer momento central . El límite inferior se realiza mediante la distribución de Bernoulli . No existe un límite superior para la curtosis de una distribución de probabilidad general y puede ser infinito.

Una razón por la que algunos autores favorecen el exceso de curtosis es que los acumulados son extensos . Las fórmulas relacionadas con la propiedad extensiva se expresan de forma más natural en términos del exceso de curtosis. Por ejemplo, sean X 1 , ..., X n variables aleatorias independientes para las que existe el cuarto momento, y sea Y la variable aleatoria definida por la suma de X i . El exceso de curtosis de Y es

donde es la desviación estándar de . En particular, si todas las X i tienen la misma varianza, esto se simplifica a

La razón para no restar 3 es que el cuarto momento se generaliza mejor a distribuciones multivariadas , especialmente cuando no se asume la independencia. La cokurtosis entre pares de variables es un tensor de orden cuatro . Para una distribución normal bivariada, el tensor de cokurtosis tiene términos fuera de la diagonal que no son ni 0 ni 3 en general, por lo que intentar "corregir" un exceso se vuelve confuso. Sin embargo, es cierto que los acumulados conjuntos de grado mayor que dos para cualquier distribución normal multivariada son cero.

Para dos variables aleatorias, X e Y , no necesariamente independientes, la curtosis de la suma, X  +  Y , es

Tenga en cuenta que los coeficientes binomiales aparecen en la ecuación anterior.

Interpretación

La interpretación exacta de la medida de Pearson de curtosis (o exceso de curtosis) solía ser discutida, pero ahora está resuelta. Como señala Westfall en 2014, "... su única interpretación inequívoca es en términos de extremidad de la cola; es decir, valores atípicos existentes (para la curtosis de la muestra) o propensión a producir valores atípicos (para la curtosis de una distribución de probabilidad)". La lógica es simple: la curtosis es el promedio (o valor esperado ) de los datos estandarizados elevados a la cuarta potencia. Cualquier valor estandarizado que sea menor que 1 (es decir, datos dentro de una desviación estándar de la media, donde estaría el "pico"), prácticamente no contribuye en nada a la curtosis, ya que elevar un número menor que 1 a la cuarta potencia lo hace más cerca de cero. Los únicos valores de datos (observados u observables) que contribuyen a la curtosis de manera significativa son los que se encuentran fuera de la región del pico; es decir, los valores atípicos. Por lo tanto, la curtosis mide únicamente los valores atípicos; no mide nada sobre el "pico".

Se han dado muchas interpretaciones incorrectas de la curtosis que involucran nociones de punta. Una es que la curtosis mide tanto el "pico" de la distribución y el peso de su cola . Se han sugerido varias otras interpretaciones incorrectas, como "falta de hombros" (donde el "hombro" se define vagamente como el área entre el pico y la cola, o más específicamente como el área alrededor de una desviación estándar de la media) o " bimodalidad ". Balanda y MacGillivray afirman que la definición estándar de curtosis "es una mala medida de la curtosis, el pico o el peso de la cola de una distribución" y en su lugar proponen "definir la curtosis vagamente como la ubicación y el movimiento libre de escala de la masa de probabilidad desde el hombros de una distribución en su centro y colas ".

Interpretación de los moros

En 1986 Moros dio una interpretación de la curtosis. Dejar

donde X es una variable aleatoria, μ es la media y σ es la desviación estándar.

Ahora, por definición de la curtosis , y por la conocida identidad

.

La curtosis ahora puede verse como una medida de la dispersión de Z 2 alrededor de su expectativa. Alternativamente, puede verse como una medida de la dispersión de Z alrededor de +1 y -1. κ alcanza su valor mínimo en una distribución simétrica de dos puntos. En términos de la variable original X , la curtosis es una medida de la dispersión de X alrededor de los dos valores μ  ±  σ .

Los valores altos de κ surgen en dos circunstancias:

  • donde la masa de probabilidad se concentra alrededor de la media y el proceso de generación de datos produce valores ocasionales lejos de la media,
  • donde la masa de probabilidad se concentra en las colas de la distribución.

Exceso de curtosis

El exceso de curtosis se define como curtosis menos 3. Hay 3 regímenes distintos como se describe a continuación.

Mesokúrtico

Las distribuciones con cero exceso de curtosis se denominan mesocúrticas o mesocurtóticas. El ejemplo más destacado de una distribución mesocúrtica es la familia de distribución normal, independientemente de los valores de sus parámetros . Algunas otras distribuciones conocidas pueden ser mesocúrticas, dependiendo de los valores de los parámetros: por ejemplo, la distribución binomial es mesocúrtica para .

Leptokurtic

Una distribución con exceso de curtosis positiva se denomina leptocurtica o leptocurtótica. "Lepto-" significa "delgado". En términos de forma, una distribución leptocúrtica tiene colas más gruesas . Los ejemplos de distribuciones leptocúrticas incluyen la distribución t de Student , la distribución de Rayleigh , la distribución de Laplace , distribución exponencial , distribución de Poisson y la distribución logística . Estas distribuciones a veces se denominan supergaussianas .

Platykurtic

El lanzamiento de la moneda es la distribución más platicúrtica.

Una distribución con exceso de curtosis negativa se denomina platicúrtica o platicurtótica. "Platy-" significa "amplio". En términos de forma, una distribución platicúrtica tiene colas más delgadas . Ejemplos de distribuciones platicúrticas incluyen las distribuciones uniformes continuas y discretas , y la distribución de coseno elevado . La distribución más platicúrtica de todas es la distribución de Bernoulli con p = 1/2 (por ejemplo, el número de veces que se obtiene "cara" al lanzar una moneda una vez, un lanzamiento de moneda ), para la cual el exceso de curtosis es -2. Estas distribuciones a veces se denominan distribución subgaussiana , originalmente propuesta por Jean-Pierre Kahane y descrita con más detalle por Buldygin y Kozachenko.

Ejemplos gráficos

La familia Pearson tipo VII

pdf para la distribución de Pearson tipo VII con exceso de curtosis del infinito (rojo); 2 (azul); y 0 (negro)
log-pdf para la distribución de Pearson tipo VII con exceso de curtosis del infinito (rojo); 2 (azul); 1, 1/2, 1/4, 1/8 y 1/16 (gris); y 0 (negro)

Los efectos de la curtosis se ilustran usando una familia paramétrica de distribuciones cuya curtosis se puede ajustar mientras sus momentos de orden inferior y acumulados permanecen constantes. Considere la familia de Pearson tipo VII , que es un caso especial de la familia de Pearson tipo IV restringida a densidades simétricas. La función de densidad de probabilidad está dada por

donde una es un parámetro de escala y m es un parámetro de forma .

Todas las densidades de esta familia son simétricas. El k- ésimo momento existe siempre que m  > ( k  + 1) / 2. Para que exista la curtosis, requerimos m  > 5/2. Entonces existen la media y la asimetría y ambos son idénticamente cero. Establecer un 2  = 2 m  - 3 hace que la varianza sea igual a la unidad. Entonces, el único parámetro libre es m , que controla el cuarto momento (y acumulativo) y, por tanto, la curtosis. Uno puede reparametrizar con , donde está el exceso de curtosis como se definió anteriormente. Esto produce una familia leptocúrtica de un parámetro con media cero, varianza unitaria, asimetría cero y un exceso de curtosis arbitrario no negativo. La densidad reparametrizada es

En el límite a medida que se obtiene la densidad

que se muestra como la curva roja en las imágenes de la derecha.

En la otra dirección se obtiene la densidad normal estándar como distribución límite, que se muestra como la curva negra.

En las imágenes de la derecha, la curva azul representa la densidad con exceso de curtosis de 2. La imagen superior muestra que las densidades leptocúrticas en esta familia tienen un pico más alto que la densidad normal mesocúrtica, aunque esta conclusión solo es válida para esta selecta familia de distribuciones. Las colas comparativamente más gruesas de las densidades leptocúrticas se ilustran en la segunda imagen, que traza el logaritmo natural de las densidades de Pearson tipo VII: la curva negra es el logaritmo de la densidad normal estándar, que es una parábola . Se puede ver que la densidad normal asigna poca masa de probabilidad a las regiones alejadas de la media ("tiene colas delgadas"), en comparación con la curva azul de la densidad leptocúrtica de Pearson tipo VII con un exceso de curtosis de 2. Entre la curva azul y la el negro son otras densidades de Pearson tipo VII con γ 2  = 1, 1/2, 1/4, 1/8 y 1/16. La curva roja muestra nuevamente el límite superior de la familia Pearson tipo VII, con (lo que, en sentido estricto, significa que el cuarto momento no existe). La curva roja disminuye más lentamente a medida que uno se mueve hacia afuera desde el origen ("tiene colas gruesas").

Otras distribuciones conocidas

Funciones de densidad de probabilidad para distribuciones seleccionadas con media 0, varianza 1 y diferentes curtosis en exceso
Logaritmos de funciones de densidad de probabilidad para distribuciones seleccionadas con media 0, varianza 1 y diferente curtosis en exceso

Aquí se comparan varias distribuciones simétricas, unimodales y conocidas de diferentes familias paramétricas. Cada uno tiene una media y una asimetría de cero. Los parámetros se han elegido para dar como resultado una varianza igual a 1 en cada caso. Las imágenes de la derecha muestran curvas para las siguientes siete densidades, en escala lineal y escala logarítmica :

Nótese que en estos casos las densidades platicúrticas tienen soporte acotado , mientras que las densidades con curtosis en exceso positiva o cero se apoyan en toda la línea real .

No se puede inferir que las distribuciones de curtosis alta o baja tengan las características indicadas por estos ejemplos. Existen densidades platicúrticas con soporte infinito,

y existen densidades leptocúrticas con soporte finito.

  • Por ejemplo, una distribución uniforme entre −3 y −0,3, entre −0,3 y 0,3, y entre 0,3 y 3, con la misma densidad en los intervalos (−3, −0,3) y (0,3, 3), pero con 20 veces más densidad en el intervalo (−0,3, 0,3)

Además, existen densidades platicúrticas con picos infinitos,

  • por ejemplo, una mezcla igual de la distribución beta con los parámetros 0.5 y 1 con su reflexión alrededor de 0.0

y existen densidades leptocúrticas que parecen planas,

  • por ejemplo, una mezcla de distribución uniforme entre -1 y 1 con una distribución t de Student T (4,0000001) , con probabilidades de mezcla de 0,999 y 0,001.

Muestra de curtosis

Definiciones

Un estimador natural pero sesgado

Para una muestra de n valores, un método de estimador de momentos del exceso de curtosis poblacional se puede definir como

donde m 4 es el cuarto momento muestral con respecto a la media , m 2 es el segundo momento muestral con respecto a la media (es decir, la varianza muestral ), x i es el i- ésimo valor y es la media muestral .

Esta fórmula tiene la representación más simple,

donde los valores son los valores de datos estandarizados usando la desviación estándar definida usando n en lugar de n  - 1 en el denominador.

Por ejemplo, suponga que los valores de los datos son 0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999.

Entonces los valores son −0,239, −0,225, −0,221, −0,234, −0,230, −0,225, −0,239, −0,230, −0,234, −0,225, −0,230, −0,239, −0,230, −0,230, −0,225, - 0,230, −0,216, −0,230, −0,225, 4,359

y los valores son 0.003, 0.003, 0.002, 0.003, 0.003, 0.003, 0.003, 0.003, 0.003, 0.003, 0.003, 0.003, 0.003, 0.003, 0.003, 0.003, 0.002, 0.003, 0.003, 360.976.

El promedio de estos valores es 18.05 y el exceso de curtosis es 18.05 - 3 = 15.05. Este ejemplo deja en claro que los datos cerca del "medio" o "pico" de la distribución no contribuyen a la estadística de curtosis, por lo tanto, la curtosis no mide el "pico". Es simplemente una medida del valor atípico, 999 en este ejemplo.

Estimador insesgado estándar

Dado un subconjunto de muestras de una población, el exceso de curtosis muestral anterior es un estimador sesgado del exceso de curtosis de la población. Un estimador alternativo del exceso de curtosis poblacional, que es insesgado en muestras aleatorias de distribución normal, se define de la siguiente manera:

donde k 4 es el estimador insesgado simétrico único del cuarto acumulante , k 2 es la estimación insesgada del segundo acumulante (idéntica a la estimación insesgada de la varianza muestral), m 4 es el cuarto momento muestral con respecto a la media, m 2 es el segundo momento muestral alrededor de la media, x i es el i- ésimo valor, y es la media muestral. Este coeficiente de momento estandarizado de Fisher-Pearson ajustado es la versión que se encuentra en Excel y en varios paquetes estadísticos, incluidos Minitab , SAS y SPSS .

Desafortunadamente, en muestras no normales, en general, está sesgado.

Límite superior

Un límite superior para la curtosis muestral de n ( n > 2) números reales es

donde es la asimetría de la muestra correspondiente.

Varianza bajo normalidad

La varianza de la curtosis muestral de una muestra de tamaño n de la distribución normal es

Dicho de otra manera, bajo el supuesto de que la variable aleatoria subyacente se distribuye normalmente, se puede demostrar que .

Aplicaciones

La curtosis muestral es una medida útil de si existe un problema con valores atípicos en un conjunto de datos. Una curtosis más grande indica un problema atípico más serio y puede llevar al investigador a elegir métodos estadísticos alternativos.

La prueba de K-cuadrado de D'Agostino es una prueba de normalidad de bondad de ajuste basada en una combinación de la asimetría de la muestra y la curtosis de la muestra, al igual que la prueba de normalidad de Jarque-Bera .

Para muestras no normales, la varianza de la varianza muestral depende de la curtosis; para obtener más detalles, consulte la variación .

La definición de Pearson de curtosis se utiliza como indicador de intermitencia en turbulencias . También se utiliza en imágenes de resonancia magnética para cuantificar la difusión no gaussiana.

Un ejemplo concreto es el siguiente lema de He, Zhang y Zhang: Suponga que una variable aleatoria tiene expectativa , varianza y curtosis . Supongamos que tomamos muestras de muchas copias independientes. Luego

.

Esto muestra que con muchas muestras, veremos una que está por encima de la expectativa con probabilidad al menos . En otras palabras: si la curtosis es grande, es posible que veamos muchos valores por debajo o por encima de la media.

Convergencia de curtosis

Al aplicar filtros de paso de banda a imágenes digitales , los valores de curtosis tienden a ser uniformes, independientemente del rango del filtro. Este comportamiento, denominado convergencia de curtosis , se puede utilizar para detectar empalmes de imágenes en análisis forenses .

Otras medidas

Se proporciona una medida diferente de "curtosis" mediante el uso de momentos L en lugar de los momentos ordinarios.

Ver también

Referencias

Otras lecturas

enlaces externos