Ángulos entre planos - Angles between flats

El concepto de ángulos entre líneas en el plano y entre pares de dos líneas, dos planos o una línea y un plano en el espacio puede generalizarse a una dimensión arbitraria . Jordan analizó por primera vez esta generalización . Para cualquier par de pisos en un espacio euclidiano de dimensión arbitraria, se puede definir un conjunto de ángulos mutuos que son invariantes bajo la transformación isométrica del espacio euclidiano. Si los planos no se cruzan, su distancia más corta es una invariante más. Estos ángulos se denominan canónicos o principales . El concepto de ángulos se puede generalizar a pares de pisos en un espacio de producto interno de dimensión finita sobre los números complejos .

Definición de Jordan

Sean y sean planos de dimensiones y en el espacio euclidiano -dimensional . Por definición, una traducción de o no altera sus ángulos mutuos. Si y no se cruzan, lo harán en cualquier traducción de la cual los mapas apuntan a algún punto . Por tanto, se puede suponer sin pérdida de generalidad que y se cruzan.

Jordan muestra que las coordenadas cartesianas en se pueden definir de tal manera que y se describen, respectivamente, por los conjuntos de ecuaciones

y

con . Jordan llama canónicas a estas coordenadas . Por definición, los ángulos son los ángulos entre y .

Los enteros no negativos están limitados por

Para estas ecuaciones para determinar los cinco números enteros no negativos completamente, además de las dimensiones y y el número de ángulos , el número entero no negativo debe ser dada. Este es el número de coordenadas , cuyos ejes correspondientes son los que se encuentran enteramente dentro de ambos y . Por tanto, el número entero es la dimensión de . El conjunto de ángulos puede complementarse con ángulos para indicar que tiene esa dimensión.

La prueba de Jordan se aplica esencialmente inalterada cuando se reemplaza con el espacio de producto interno -dimensional sobre los números complejos. (Para ángulos entre subespacios , Galántai y Hegedũs discuten la generalización en términos de la caracterización variacional a continuación ).

Ángulos entre subespacios

Ahora sean y sean subespacios del espacio de producto interno dimensional sobre los números reales o complejos. Geométricamente, y son planos, por lo que se aplica la definición de Jordan de ángulos mutuos. Cuando por cualquier canónicas de coordenadas el símbolo denota el vector unitario del eje, los vectores forman una ortonormal base para y los vectores forman una base ortonormal para , donde

Al estar relacionados con las coordenadas canónicas, estos vectores básicos pueden llamarse canónicos .

Cuando se denotan los vectores básicos canónicos para y los vectores básicos canónicos para entonces el producto interno desaparece para cualquier par de y excepto los siguientes.

Con el orden anterior de los vectores básicos, la matriz de los productos internos es, por tanto, diagonal . En otras palabras, si y son bases ortonormales arbitrarias en y entonces las transformaciones reales, ortogonales o unitarias de la base a la base y de la base a la base realizan una descomposición de valor singular de la matriz de productos internos . Los elementos de la matriz diagonal son los valores singulares de la última matriz. Por la unicidad de la descomposición del valor singular, los vectores son entonces únicos hasta una transformación real, ortogonal o unitaria entre ellos, y los vectores y (y por tanto ) son únicos hasta transformaciones reales, ortogonales o unitarias iguales aplicadas simultáneamente a los conjuntos de los vectores asociados con un valor común de ya los correspondientes conjuntos de vectores (y por tanto a los correspondientes conjuntos de ).

Un valor singular se puede interpretar como correspondiente a los ángulos introducidos anteriormente y asociado con y un valor singular se puede interpretar como correspondiente a ángulos rectos entre los espacios ortogonales y , donde el superíndice indica el complemento ortogonal .

Caracterización variacional

La caracterización variacional de valores y vectores singulares implica como caso especial una caracterización variacional de los ángulos entre subespacios y sus vectores canónicos asociados. Esta caracterización incluye los ángulos y los introducidos anteriormente y ordena los ángulos aumentando el valor. Se le puede dar la forma de la siguiente definición alternativa. En este contexto, es habitual para hablar de principales ángulos y vectores.

Definición

Sea un espacio de producto interior. Dados dos subespacios con , existe entonces una secuencia de ángulos llamados ángulos principales, el primero definido como

donde está el producto interno y la norma inducida . Los vectores y son los vectores principales correspondientes .

Los otros ángulos y vectores principales se definen entonces de forma recursiva mediante

Esto significa que los ángulos principales forman un conjunto de ángulos minimizados entre los dos subespacios, y los vectores principales en cada subespacio son ortogonales entre sí.

Ejemplos

Ejemplo geométrico

Geométricamente, los subespacios son planos (puntos, líneas, planos, etc.) que incluyen el origen, por lo que dos subespacios cualesquiera se cruzan al menos en el origen. Dos subespacios bidimensionales y generan un conjunto de dos ángulos. En un espacio euclidiano tridimensional , los subespacios y son idénticos o su intersección forma una línea. En el primer caso, ambos . En el último caso, solo , donde los vectores y están en la línea de la intersección y tienen la misma dirección. El ángulo será el ángulo entre los subespacios y en el complemento ortogonal a . Imaginando el ángulo entre dos planos en 3D, una forma intuitiva piensa en el ángulo más grande, .

Ejemplo algebraico

En el espacio de coordenadas reales de 4 dimensiones R 4 , dejemos que el subespacio bidimensional sea ​​atravesado por y , y que el subespacio bidimensional sea ​​atravesado por y con algo real y tal que . Entonces y son, de hecho, el par de vectores principales correspondientes al ángulo con , y y son los vectores principales correspondientes al ángulo con

Para construir un par de subespacios con cualquier conjunto dado de ángulos en un espacio euclidiano dimensional (o más grande) , tome un subespacio con una base ortonormal y complételo hasta una base ortonormal del espacio euclidiano, donde . Entonces, una base ortonormal del otro subespacio es, por ejemplo,

Propiedades básicas

  • Si el ángulo más grande es cero, un subespacio es un subconjunto del otro.
  • Si el ángulo más grande es , hay al menos un vector en un subespacio perpendicular al otro subespacio.
  • Si el ángulo más pequeño es cero, los subespacios se cruzan al menos en una línea.
  • Si el ángulo más pequeño es , los subespacios son ortogonales.
  • El número de ángulos igual a cero es la dimensión del espacio donde se cruzan los dos subespacios.

Propiedades avanzadas

  • Los ángulos no triviales (diferentes de y ) entre dos subespacios son los mismos que los ángulos no triviales entre sus complementos ortogonales.
  • Los ángulos no triviales entre los subespacios y los ángulos no triviales correspondientes entre los subespacios y suman .
  • Los ángulos entre subespacios satisfacen la desigualdad del triángulo en términos de mayorización y, por lo tanto, se pueden usar para definir una distancia en el conjunto de todos los subespacios convirtiendo el conjunto en un espacio métrico .
  • El seno de los ángulos entre los subespacios satisface la desigualdad del triángulo en términos de mayorización y, por lo tanto, puede usarse para definir una distancia en el conjunto de todos los subespacios convirtiendo el conjunto en un espacio métrico . Por ejemplo, el seno del ángulo más grande se conoce como espacio entre subespacios .

Extensiones

La noción de ángulos y algunas de las propiedades variacionales pueden extenderse naturalmente a productos internos arbitrarios y subespacios con dimensiones infinitas .

Cálculo

Históricamente, los ángulos y vectores principales aparecen por primera vez en el contexto de la correlación canónica y originalmente se calcularon utilizando SVD de matrices de covarianza correspondientes . Sin embargo, como se notó por primera vez en, la correlación canónica está relacionada con el coseno de los ángulos principales, que está mal condicionado para ángulos pequeños, lo que lleva a un cálculo muy inexacto de vectores principales altamente correlacionados en aritmética informática de precisión finita . El algoritmo basado en seno soluciona este problema, pero crea un nuevo problema de cálculo muy inexacto de vectores principales altamente no correlacionados, ya que la función seno está mal acondicionada para ángulos cercanos a π / 2. Para producir vectores principales precisos en aritmética computarizada para el rango completo de los ángulos principales, la técnica combinada primero calcula todos los ángulos principales y vectores usando el método clásico basado en coseno , y luego vuelve a calcular los ángulos principales menores que π / 4 y el principal correspondiente vectores utilizando el enfoque basado en el seno . La técnica combinada se implementa en las bibliotecas de código abierto Octave y SciPy y se contribuye a MATLAB .

Ver también

Referencias

  1. a b c Jordan, C. (1875). "Essai sur la géométrie à dimensiones" . Toro. Soc. Matemáticas. Francia . 3 : 103.
  2. ^ Afriat, SN (1957). "Proyectores ortogonales y oblicuos y caracterización de pares de espacios vectoriales". Matemáticas. Proc. Cambridge Philos. Soc . 53 (4): 800. doi : 10.1017 / S0305004100032916 .
  3. ^ a b c d e Björck, Å .; Golub, GH (1973). "Métodos numéricos para calcular ángulos entre subespacios lineales". Matemáticas. Comp . 27 (123): 579. doi : 10.2307 / 2005662 . JSTOR  2005662 .
  4. Galántai, A .; Hegedũs, Cs. J. (2006). "Ángulos principales de Jordan en espacios vectoriales complejos". Numer. Álgebra Lineal Appl . 13 (7): 589–598. CiteSeerX  10.1.1.329.7525 . doi : 10.1002 / nla.491 .
  5. ^ Halmos, PR (1969), "Dos subespacios", Trans. Amer. Matemáticas. Soc. , 144 : 381–389, doi : 10.1090 / S0002-9947-1969-0251519-5
  6. ^ a b c Knyazev, AV; Argentati, ME (2006), "Mayorización por cambios en ángulos entre subespacios, valores de Ritz y espectros laplacianos de gráficos", SIAM J. Matrix Anal. Apl. , 29 (1): 15–32, CiteSeerX  10.1.1.331.9770 , doi : 10.1137 / 060649070 , S2CID  16987402
  7. ^ a b c Knyazev, AV; Jujunashvili, A .; Argentati, ME (2010), "Ángulos entre subespacios dimensionales infinitos con aplicaciones al método Rayleigh-Ritz y proyectores alternos", Journal of Functional Analysis , 259 (6): 1323-1345, arXiv : 0705.1023 , doi : 10.1016 / j. jfa.2010.05.018 , S2CID  5570062
  8. ^ Qiu, L .; Zhang, Y .; Li, C.-K. (2005), "Métricas unitariamente invariantes en el espacio Grassmann" (PDF) , SIAM Journal on Matrix Analysis and Applications , 27 (2): 507–531, doi : 10.1137 / 040607605
  9. ^ Kato, DT (1996), Teoría de la perturbación para operadores lineales , Springer, Nueva York
  10. ^ a b c Knyazev, AV; Argentati, ME (2002), "Ángulos principales entre subespacios en un producto escalar basado en A: algoritmos y estimaciones de perturbación", SIAM Journal on Scientific Computing , 23 (6): 2009-2041, CiteSeerX  10.1.1.73.2914 , doi : 10.1137 / S1064827500377332
  11. ^ Subespacio de función de octava
  12. ^ Función de álgebra lineal de SciPy subspace_angles
  13. ^ Subespacio de la función MATLAB FileExchange
  14. ^ Subespacio de la función MATLAB FileExchangea