Profundidad simple con respecto a los seis puntos de muestra rojos, utilizando la definición modificada de Burr et al. Los números negros grandes son las profundidades dentro de cada región y los números azules pequeños son las profundidades a lo largo de los segmentos de la línea azul.
La profundidad simplicial de un punto en el espacio euclidiano -dimensional , con respecto a un conjunto de puntos muestrales en ese espacio, es el número de simplices -dimensionales (los cascos convexos de conjuntos de puntos muestrales) que contienen . La misma noción puede generalizarse a cualquier distribución de probabilidad en puntos del plano, no solo a la distribución empírica dada por un conjunto de puntos muestrales, definiendo la profundidad como la probabilidad de que una tupla de puntos elegida al azar tenga un casco convexo que contiene . Esta probabilidad se puede calcular, a partir del número de simples que contienen , dividiendo por dónde está el número de puntos muestrales.
Bajo la definición estándar de profundidad simplicial, los simplices que tienen en sus límites cuentan tanto como los simplices en sus interiores. Para evitar algún comportamiento problemático de esta definición, Burr, Rafalin y Souvaine (2004) propusieron una definición modificada de profundidad simplicial, en la que los simplices con en sus límites cuentan solo la mitad. De manera equivalente, su definición es el promedio del número de simples abiertos y el número de simples cerrados que contienen .
Propiedades
La profundidad simple es robusta contra valores atípicos: si un conjunto de puntos de muestra está representado por el punto de profundidad máxima, entonces hasta una fracción constante de los puntos de muestra puede corromperse arbitrariamente sin cambiar significativamente la ubicación del punto representativo. También es invariante bajo afines transformaciones del plano.
Sin embargo, la profundidad simplicial no tiene otras propiedades deseables para medidas robustas de tendencia central. Cuando se aplica a distribuciones centralmente simétricas, no es necesariamente el caso de que haya un punto único de profundidad máxima en el centro de la distribución. Y, a lo largo de un rayo desde el punto de profundidad máxima, no es necesariamente el caso de que la profundidad simplicial disminuya monótonamente.
Algoritmos
Para conjuntos de puntos muestrales en el plano euclidiano ( ),
la profundidad simplicial de cualquier otro punto se puede calcular en el tiempo , lo cual es
óptimo en algunos modelos de cálculo. En tres dimensiones, el mismo problema se puede resolver a tiempo .
Es posible construir una estructura de datos utilizando redes ε que pueden aproximarse a la profundidad simple de un punto de consulta (dado un conjunto fijo de muestras o un conjunto de muestras sometidas a inserciones de puntos) en un tiempo casi constante por consulta, en cualquier dimensión. , con una aproximación cuyo error es una pequeña fracción del número total de triángulos determinados por las muestras. En dos dimensiones, se conoce un algoritmo de aproximación más preciso, para el cual el error de aproximación es un pequeño múltiplo de la propia profundidad simplicial. Los mismos métodos también conducen a algoritmos de aproximación rápida en dimensiones superiores.
Profundidad esférica , se define como la probabilidad de que un punto esté contenido dentro de una hiperbola cerrada aleatoria obtenida de un par de puntos de . Mientras que la complejidad temporal de la mayoría de las otras profundidades de datos crece exponencialmente, la profundidad esférica crece solo de forma lineal en la dimensión , el algoritmo sencillo para calcular la profundidad esférica toma . La profundidad simple (SD) está limitada linealmente por la profundidad esférica ( ).
Bremner, David; Shahsavarifar, Rasoul (2017), Un algoritmo óptimo para calcular la profundidad esférica de puntos en el plano , arXiv : 1702.07399 , Bibcode : 2017arXiv170207399B
CO.
Cheng, Andrew Y .; Ouyang, Ming (2001), "Sobre algoritmos para profundidad simplicial" , Actas de la 13ª Conferencia Canadiense sobre Geometría Computacional, Universidad de Waterloo, Ontario, Canadá, 13-15 de agosto de 2001 , págs. 53–56
D.
Dümbgen, Lutz (1992), "Teoremas del límite para la profundidad simplicial", Estadística y letras de probabilidad , 14 (2): 119-128, doi : 10.1016 / 0167-7152 (92) 90075-G , MR 1173409