Teorema del eje principal - Principal axis theorem

En los campos matemáticos de la geometría y el álgebra lineal , un eje principal es una cierta línea en un espacio euclidiano asociado con un elipsoide o hiperboloide , generalizando los ejes mayor y menor de una elipse o hipérbola . El teorema del eje principal establece que los ejes principales son perpendiculares y proporciona un procedimiento constructivo para encontrarlos.

Matemáticamente, el teorema del eje principal es una generalización del método de completar el cuadrado a partir del álgebra elemental . En álgebra lineal y análisis funcional , el teorema del eje principal es una contraparte geométrica del teorema espectral . Tiene aplicaciones a las estadísticas de análisis de componentes principales y la descomposición de valores singulares . En física , el teorema es fundamental para los estudios del momento angular y la birrefringencia .

Motivación

Las ecuaciones en el plano cartesiano R 2 :

definir, respectivamente, una elipse y una hipérbola. En cada caso, la x y Y ejes son los ejes principales. Esto se ve fácilmente, dado que no hay términos cruzados que involucren productos xy en ninguna de las expresiones. Sin embargo, la situación es más complicada para ecuaciones como

Aquí se requiere algún método para determinar si se trata de una elipse o una hipérbola . La observación básica es que si, al completar el cuadrado, la expresión cuadrática se puede reducir a una suma de dos cuadrados, entonces la ecuación define una elipse, mientras que si se reduce a una diferencia de dos cuadrados, entonces la ecuación representa una hipérbola:

Por lo tanto, en nuestra expresión de ejemplo, el problema es cómo absorber el coeficiente del término cruzado 8 xy en las funciones u y v . Formalmente, este problema es similar al problema de la diagonalización de la matriz , donde se intenta encontrar un sistema de coordenadas adecuado en el que la matriz de una transformación lineal sea diagonal. El primer paso es encontrar una matriz en la que se pueda aplicar la técnica de diagonalización.

El truco consiste en escribir la forma cuadrática como

donde el término cruzado se ha dividido en dos partes iguales. La matriz A en la descomposición anterior es una matriz simétrica . En particular, según el teorema espectral , tiene valores propios reales y es diagonalizable por una matriz ortogonal ( ortogonalmente diagonalizable ).

Para diagonalizar ortogonalmente A , primero se deben encontrar sus valores propios y luego encontrar una base propia ortonormal . El cálculo revela que los valores propios de A son

con los vectores propios correspondientes

Dividir estos por sus respectivas longitudes produce una base propia ortonormal:

Ahora la matriz S = [ u 1 u 2 ] es una matriz ortogonal, ya que tiene columnas ortonormales, y A está diagonalizada por:

Esto se aplica al problema actual de "diagonalizar" la forma cuadrática mediante la observación de que

Por tanto, la ecuación es la de una elipse, ya que el lado izquierdo se puede escribir como la suma de dos cuadrados.

Es tentador simplificar esta expresión extrayendo factores de 2. Sin embargo, es importante no hacerlo. Las cantidades

tienen un significado geométrico. Determinan un sistema de coordenadas ortonormal en R 2 . En otras palabras, se obtienen a partir de las coordenadas originales mediante la aplicación de una rotación (y posiblemente una reflexión). En consecuencia, se pueden usar las coordenadas c 1 y c 2 para hacer afirmaciones sobre la longitud y los ángulos (particularmente la longitud), que de otro modo serían más difíciles en una elección diferente de coordenadas (reescalando, por ejemplo). Por ejemplo, la distancia máxima desde el origen en la elipse c 1 2 + 9 c 2 2 = 1 ocurre cuando c 2 = 0, entonces en los puntos c 1 = ± 1. Del mismo modo, la distancia mínima es donde c 2 = ± 1/3.

Ahora es posible leer los ejes mayor y menor de esta elipse. Estos son precisamente los espacios propios individuales de la matriz A , ya que estos son donde c 2 = 0 o c 1 = 0. Simbólicamente, los ejes principales son

Para resumir:

  • La ecuación es para una elipse, ya que ambos valores propios son positivos. (De lo contrario, si uno fuera positivo y el otro negativo, sería una hipérbola).
  • Los ejes principales son las líneas abarcadas por los vectores propios.
  • Las distancias mínima y máxima al origen se pueden leer en la ecuación en forma diagonal.

Con esta información, es posible obtener una imagen geométrica clara de la elipse: graficarla, por ejemplo.

Declaración formal

El teorema del eje principal se refiere a las formas cuadráticas en R n , que son polinomios homogéneos de grado 2. Cualquier forma cuadrática puede representarse como

donde A es una matriz simétrica.

La primera parte del teorema está contenida en los siguientes enunciados garantizados por el teorema espectral:

  • Los valores propios de A son reales.
  • A es diagonalizable y los espacios propios de A son mutuamente ortogonales.

En particular, A es diagonalizable ortogonalmente , ya que se puede tomar una base de cada espacio propio y aplicar el proceso de Gram-Schmidt por separado dentro del espacio propio para obtener una base propia ortonormal.

Para la segunda parte, suponga que los valores propios de A son λ 1 , ..., λ n (posiblemente repetidos de acuerdo con sus multiplicidades algebraicas ) y la base propia ortonormal correspondiente es u 1 , ..., u n . Luego

donde c i son las coordenadas con respecto a la base propia dada. Es más,

El i -ésimo eje principal es la línea determinada por las n - 1 ecuaciones c j = 0, ji . Este eje es el lapso del vector u i .

Ver también

Referencias

  • Strang, Gilbert (1994). Introducción al álgebra lineal . Prensa de Wellesley-Cambridge. ISBN 0-9614088-5-5.