Teorema de Hahn-Banach - Hahn–Banach theorem

El teorema de Hahn-Banach es una herramienta central en el análisis funcional . Permite la extensión de funcionales lineales acotados definidos en un subespacio de algún espacio vectorial a todo el espacio, y también muestra que hay "suficientes" funcionales lineales continuos definidos en cada espacio vectorial normalizado para hacer que el estudio del espacio dual sea "interesante ". Otra versión del teorema de Hahn-Banach se conoce como teorema de separación de Hahn-Banach o teorema de separación de hiperplano , y tiene numerosos usos en geometría convexa .

Historia

El teorema lleva el nombre de los matemáticos Hans Hahn y Stefan Banach , quienes lo demostraron de forma independiente a finales de la década de 1920. El caso especial del teorema para el espacio de funciones continuas en un intervalo fue probado anteriormente (en 1912) por Eduard Helly , y un teorema de extensión más general, el teorema de extensión de M. Riesz , del cual se puede derivar el teorema de Hahn-Banach , fue probado en 1923 por Marcel Riesz .

El primer teorema de Hahn-Banach fue probado por Eduard Helly en 1921, quien demostró que ciertos funcionales lineales definidos en un subespacio de un cierto tipo de espacio normado ( ) tenían una extensión de la misma norma. Helly hizo esto a través de la técnica de probar primero que existe una extensión unidimensional (donde el funcional lineal tiene su dominio extendido en una dimensión) y luego usando inducción . En 1927, Hahn definió los espacios de Banach generales y utilizó la técnica de Helly para probar una versión que conserva la norma del teorema de Hahn-Banach para los espacios de Banach (donde un funcional lineal acotado en un subespacio tiene una extensión lineal acotada de la misma norma a todo el espacio). En 1929, Banach, que desconocía el resultado de Hahn, lo generalizó reemplazando la versión que conserva las normas por la versión de extensión dominada que usa funciones sublineales . Mientras que la prueba de Helly usaba inducción matemática, tanto Hahn como Banach usaban inducción transfinita .

El teorema de Hahn-Banach surgió de los intentos de resolver sistemas infinitos de ecuaciones lineales. Esto es necesario para resolver problemas como el problema del momento, por el cual, dados todos los momentos potenciales de una función, uno debe determinar si existe una función que tenga estos momentos y, de ser así, encontrarla en términos de esos momentos. Otro de estos problemas es el problema de la serie del coseno de Fourier , por el cual, dados todos los coeficientes de coseno de Fourier potenciales, uno debe determinar si existe una función que tenga esos coeficientes y, nuevamente, encontrarla si es así.

Riesz y Helly resolvieron el problema para ciertas clases de espacios (como L p ([0, 1]) y C ([ a , b ])) donde descubrieron que la existencia de una solución era equivalente a la existencia y continuidad de ciertos funcionales lineales. En efecto, necesitaban resolver el siguiente problema:

( El problema vector ) Dada una colección de funcionales lineales delimitadas en un espacio normado X y una colección de escalares , determinar si hay un xX tal que f i ( x ) = c i para todos los iI .

Para resolver esto, si X es reflexivo, entonces basta con resolver el siguiente problema dual:

( El problema funcional ) Dada una colección de vectores en un espacio normado X y una colección de escalares , determinar si hay una acotada funcional lineal f en X tal que f ( x i ) = c i para todos los iI .

Riesz pasó a definir L p ([0, 1]) ( 1 < p <∞ ) en 1910 y los espacios l p en 1913. Mientras investigaba estos espacios, demostró un caso especial del teorema de Hahn-Banach. Helly también demostró un caso especial del teorema de Hahn-Banach en 1912. En 1910, Riesz resolvió el problema funcional para algunos espacios específicos y en 1912, Helly lo resolvió para una clase de espacios más general. No fue hasta 1932 que Banach, en una de las primeras aplicaciones importantes del teorema de Hahn-Banach, resolvió el problema funcional general. El siguiente teorema establece el problema funcional general y caracteriza su solución.

Teorema  (El problema funcional)  -  Sea X un espacio normado real o complejo, I un conjunto no vacío, ( c i ) iI una familia de escalares, y ( x i ) iI una familia de vectores en X .

Existe una función lineal continua f en X tal que f ( x i ) = c i para todo iI si y solo si existe un K > 0 tal que para cualquier elección de escalares ( s i ) iI donde todos pero un número finito de s i es 0, necesariamente tenemos

Se puede utilizar el teorema anterior para deducir el teorema de Hahn-Banach. Si X es reflexivo, entonces este teorema resuelve el problema del vector.

Teorema de Hahn-Banach

Teorema (Hahn-Banach)  :  establezca K para que sea R o C y sea X un espacio de vector K. Si f  : MK es un K -linear funcional en una K -linear subespacio M y p  : XR una función no negativa, de tal manera que sublineal

| f ( m ) | ≤ p ( m )     para todos mM .

entonces existe un K- lineal F  : XK tal que

F ( m ) = f ( m )     para todo mM ,
| F ( x ) | ≤ p ( x )     para todo xX .

La extensión F es, en general, no se especifica de forma única por f y la prueba da ningún método explícito en cuanto a cómo encontrar F .

Es posible relajar ligeramente la condición subaditividad de p , que sólo requiere que para todo x , yX y todos los escalares a y b que satisface | a | + | b | ≤ 1 ,

p ( ax + por ) ≤ | a | p ( x ) + | b | p ( y ) .

Además, es posible relajar la homogeneidad positiva y las condiciones de subaditividad en p , requiriendo solo que p sea ​​convexo.

El proyecto Mizar ha formalizado por completo y comprobado automáticamente la prueba del teorema de Hahn-Banach en el archivo HAHNBAN.

Prueba

En el caso complejo, los C supuestos -linearity exigen que M = N + Ni por algún espacio real vector N . Además, para cada vector xN , f ( ix ) = if ( x ) . Así, la parte real de un funcional lineal determina ya el comportamiento del funcional lineal como un todo, y será suficiente probar el caso real.

Primero, notamos el resultado inicial de Helly: si M tiene codimensión 1, entonces Hahn-Banach es fácil.

Lema  (Teorema de extensión dominado unidimensional)  -  Sea X un espacio vectorial real, p  : XR una función sublineal, f  : MR una funcional lineal en un subespacio vectorial propio MX tal que fp en M (es decir, f ( m ) ≤ p ( m ) para todos mm ), y xX un vector no en m . Existe una extensión lineal F  : MR xR de f a MR x = span { M , x } tal que Fp en MR x .

Prueba  -

Para demostrar este lema, y mucho m , nM . Por las propiedades de linealidad de nuestras funciones,

- p (- x - norte ) - f ( norte ) ≤ p ( metro + x ) - f ( metro ) .

En particular, dejemos

y
Luego concluimos "la desigualdad decisiva" que para cualquier ab . Así que sea c ∈ [ a , b ] y defina F ( m + rx ) = f ( m ) + rc ; luego
F ( m + rx ) ≤ p ( m ) + rcp ( m + rx )

La desigualdad inversa es similar.

Ahora aplicar lema de Zorn : las posibles extensiones de f están parcialmente ordenados por extensión uno del otro, por lo que no es una extensión máxima F . Por el resultado de la codimensión-1, si F no se define en todo X , entonces se puede ampliar aún más. Por tanto, F debe definirse en todas partes, como se afirma.

En espacios localmente convexos

En la forma anterior, el funcional que se va a ampliar ya debe estar delimitado por una función sublineal. En algunas aplicaciones, esto podría cerrar la pregunta . Sin embargo, en espacios localmente convexos , cualquier funcional continuo ya está limitado por la norma , que es sublineal. Uno así tiene

Extensiones continuas en espacios localmente convexos  -  Let X sean localmente convexa topológica vector de espacio de más de K (ya sea R o C ), M un subespacio vectorial de X , y f un funcional lineal continua en M . Entonces f tiene una extensión lineal continuo a todos X . Si la topología en X surge de una norma , entonces la norma de f es preservada por esta extensión.

En términos de teoría de categorías , el campo K es un objeto inyectivo en la categoría de espacios vectoriales localmente convexos.

Relación con el axioma de elección

La prueba anterior usa el lema de Zorn, que es equivalente al axioma de elección . Ahora se sabe (ver más abajo) que el lema del ultrafiltro (o de manera equivalente, el teorema del ideal booleano primo ), que es un poco más débil que el axioma de elección, es en realidad lo suficientemente fuerte.

El teorema de Hahn-Banach es equivalente a lo siguiente:

(∗): En cada álgebra de Boole B existe una "carga de probabilidad", es decir: un mapa no constante y finitamente aditivo de B a [0, 1] .

(El teorema del ideal primo de Boole es equivalente a la afirmación de que siempre hay cargas de probabilidad no constantes que toman solo los valores 0 y 1).

En la teoría de conjuntos de Zermelo-Fraenkel , se puede demostrar que el teorema de Hahn-Banach es suficiente para derivar la existencia de un conjunto medible que no es de Lebesgue. Además, el teorema de Hahn-Banach implica la paradoja de Banach-Tarski .

Para espacios de Banach separables , DK Brown y SG Simpson demostraron que el teorema de Hahn-Banach se deriva de WKL 0 , un subsistema débil de aritmética de segundo orden que toma una forma del lema de Kőnig restringido a árboles binarios como axioma. De hecho, prueban que bajo un conjunto débil de supuestos, los dos son equivalentes, un ejemplo de matemática inversa .

"Geometric Hahn-Banach" (los teoremas de separación de Hahn-Banach)

El elemento clave del teorema de Hahn-Banach es fundamentalmente un resultado sobre la separación de dos conjuntos convexos: {- p (- x - n ) - f ( n ): nM }, y { p ( m + x ) - f ( m ): mM }. Este tipo de argumento aparece ampliamente en la geometría convexa , la teoría de la optimización y la economía . Los lemas con este fin derivados del teorema de Hahn-Banach original se conocen como teoremas de separación de Hahn-Banach .

Teorema  -  Sea X un espacio vectorial topológico real localmente convexo y sean A y B subconjuntos convexos no vacíos. Si Int A ≠ ∅ y B ∩ Int A = ∅ entonces existe un funcional lineal continua f en X tal que sup f ( A ) ≤ inf f ( B ) y f ( a ) <inf f ( B ) para todos un ∈ Int A (tal f es necesariamente distinta de cero).

A menudo se supone que los conjuntos convexos tienen una estructura adicional; es decir, que sean abiertos o compactos . En ese caso, la conclusión se puede fortalecer sustancialmente:

Teorema  -  Let X sea un verdadero espacio vectorial topológico y seleccione A , B convexa subconjuntos disjuntos no vacíos de X .

  • Si A está abierto, A y B están separados por un hiperplano (cerrado) . Explícitamente, esto significa que no existe un mapa lineal continua f  : XK y sR tal que f ( un ) < sf ( b ) para todos unA , bB . Si tanto A como B están abiertos, el lado derecho también puede tomarse estricto.
  • Si X es localmente convexa, A es compacto, y B cerrados, entonces A y B están estrictamente separado : existe un mapa lineal continua f  : XK y s , tR tal que f ( un ) < t < s < f ( b ) para todos una , bB .

Si X es complejo, entonces se mantienen las mismas afirmaciones, pero para la parte real de f .

Un corolario importante se conoce como el teorema geométrico de Hahn-Banach o el teorema de Mazur .

Teorema (Mazur)  -  Let M un subespacio vectorial del espacio vectorial topológico X . Suponga que K es un subconjunto abierto convexo no vacío de X con KM = ∅ . Entonces hay una cerrada hiperplano (codimensión-1 subespacio vectorial) NX que contiene M , pero queda disjunta de K .

Para ver que el teorema de Mazur se deriva de los teoremas de separación de Hahn-Banach, observe que M es convexo y aplique la primera viñeta. El teorema de Mazur aclara que los subespacios vectoriales (incluso los que no están cerrados) pueden caracterizarse por funcionales lineales.

Corolario  (Separación de un subespacio y un conjunto convexo abierto)  -  Let X un espacio vectorial localmente convexo, M un subespacio vectorial, y U un abierto no vacío convexa subconjunto disjunta de M . Entonces existe una función lineal continua f en X tal que f ( m ) = 0 para todo mM y Re f > 0 en U

Apoyando hiperplanos

Dado que los puntos son trivialmente convexos , la geometría de Hahn-Banach implica que los funcionales pueden detectar el límite de un conjunto. En particular, sea X un espacio vectorial topológico real y AX convexo con Int A ≠ ∅ . Si entonces hay una funcional que se desvanece en un 0 , pero admite en el interior de una .

Llame a un espacio normado X suave si en cada punto x de su bola unitaria existe un hiperplano cerrado único para la bola unitaria en x . Köthe demostró en 1983 que un espacio normado es uniforme en un punto x si y solo si la norma es Gateaux diferenciable en ese punto.

Barrios equilibrados o con disco

Vamos U sea una convexa equilibrada entorno de 0 en un localmente convexa topológica del espacio vectorial X y supongamos xX no es un elemento de U . Entonces existe un funcional lineal continuo f en X tal que

sup | f ( U ) | ≤ | f ( x ) | .

Aplicaciones

El teorema de Hahn-Banach es el primer signo de una filosofía importante en el análisis funcional : para comprender un espacio, uno debe comprender sus funcionales continuos .

Por ejemplo, los subespacios lineales se caracterizan por funcionales: si X es un espacio vectorial normalizado con subespacio lineal M (no necesariamente cerrado) y si z es un elemento de X que no está en el cierre de M , entonces existe un mapa lineal continuo f  : XK con f ( x ) = 0 para todo x en M , f ( z ) = 1 y || f || = dist ( z , M ) -1 . (Para ver esto, observe que dist (·, M) es una función sublineal.) Además, si z es un elemento de X , entonces existe un mapa lineal continuo f  : XK tal que f ( z ) = || z || y || f || ≤ 1 . Esto implica que la inyección natural J de un espacio normado X en su doble dual V ′ ′ es isométrica.

Ese último resultado también sugiere que el teorema de Hahn-Banach a menudo se puede utilizar para localizar una topología "más agradable" en la que trabajar. Por ejemplo, muchos resultados del análisis funcional suponen que un espacio es de Hausdorff o localmente convexo . Sin embargo, suponga que X es un espacio vectorial topológico, no necesariamente de Hausdorff o localmente convexo , pero con un conjunto abierto M no vacío, adecuado, convexo . Entonces, el Hahn-Banach geométrico implica que hay un hiperplano que separa a M de cualquier otro punto. En particular, debe existir un funcional distinto de cero en X , es decir, el espacio dual continuo X * no es trivial. Considerando X con la topología débil inducida por X * , entonces X se vuelve localmente convexo; por la segunda viñeta geométrica de Hahn-Banach, la topología débil en este nuevo espacio separa puntos . Por tanto, X con esta topología débil se convierte en Hausdorff . A veces, esto permite que algunos resultados de espacios vectoriales topológicos localmente convexos se apliquen a espacios que no son de Hausdorff ni localmente convexos.

Ecuaciones diferenciales parciales

El teorema de Hahn-Banach suele ser útil cuando se desea aplicar el método de estimaciones a priori . Supongamos que deseamos resolver la ecuación diferencial lineal Pu = f de U , con f dada en un espacio de Banach X . Si tenemos un control del tamaño de u en términos de y podemos pensar en u como un delimitado lineal funcional en un espacio adecuado de la prueba de las funciones g , entonces podemos ver f como funcional lineal por adjunción: . Al principio, esto funcionales sólo se define en la imagen de P , pero usando el teorema de Hahn-Banach, podemos tratar de extender a toda la codomain X . El funcional resultante a menudo se define como una solución débil de la ecuación .

Caracterización de espacios reflexivos de Banach

Teorema  :  un espacio de Banach real es reflexivo si y solo si cada par de subconjuntos convexos cerrados, separados y no vacíos, uno de los cuales está acotado, puede estar estrictamente separado por un hiperplano.

Ejemplo de la teoría de Fredholm

Para ilustrar una aplicación real del teorema de Hahn-Banach, probaremos ahora un resultado que se deriva casi por completo del teorema de Hahn-Banach.

Propuesta  -  Supongamos que X es un Hausdorff localmente convexa TVS sobre el campo K y Y es un subespacio vectorial de X que es TVS-isomorfo a K I para algún conjunto I . Entonces Y es un cerrado y complementada subespacio vectorial de X .

Prueba  -

Desde K I es un TVS completa, de modo que es Y , y desde cualquier subconjunto completo de un Hausdorff TVS está cerrado, Y es un subconjunto cerrado de X . Sea f = ( f i ) iI  : YK I un isomorfismo TVS, de modo que cada f i  : YK es una funcional lineal sobreyectiva continua. Por el teorema de Hahn-Banach, podemos extender cada f i a un funcional lineal continua F i  : XK en X . Sea F  : = ( F i ) iI  : XK I entonces F es una sobreyección lineal continua tal que su restricción a Y es F | Y = ( F yo | Y ) yoyo = ( f yo ) yoyo = f . De ello se deduce que si definimos P  : = f −1F  : XY entonces la restricción a Y de este mapa lineal continuo P | Y  : YY es el mapa de identidad 1 Y en Y , para P | Y = f −1F | Y = f -1f = 1 Y . Entonces, en particular, P es una proyección lineal continua sobre Y (es decir, PP = P ). Por tanto, Y se complementa en X y X = Y ⊕ ker P en la categoría de TVS. ∎

Uno puede utilizar el resultado anterior para mostrar que cada subespacio vectorial cerrado de R N se complementa y, o bien TVS-isomorfos dimensionales o de lo finitos para R N .

Generalizaciones

Plantilla general

Ahora existen muchas otras versiones del teorema de Hahn-Banach. La plantilla general para las diversas versiones del teorema de Hahn-Banach que se presentan en este artículo es la siguiente:

X es un espacio vectorial, p es una función sublineal en X (posiblemente una seminorma ), M es un subespacio vectorial de X (posiblemente cerrado) yf es una funcional lineal en M que satisface | f | ≤ p en M (y posiblemente algunas otras condiciones). Entonces se concluye que existe una extensión lineal F de f a X tal que | F | ≤ p en X (posiblemente con propiedades adicionales).

Para seminarios

Hahn-Banach para seminormas  :  si M es un subespacio vectorial de X , p es una seminorma en M y q es una seminorma en X tal que pq | M , entonces existe una seminorma P en X tal que P | M = p y Pq .

Una prueba se ejecuta de la siguiente manera:

Lema  -  Sea M un subespacio vectorial de un espacio vectorial real o complejo X , sea D un disco absorbente en X y sea f un funcional lineal en M tal que | f | ≤ 1 en MD . Entonces existe un funcional lineal F en X que se extiende f tal que | F | ≤ 1 en D .

sea S el casco convexo de { mM  : p ( x ) ≤ 1} ∪ { xX  : q ( x ) ≤ 1} . Tenga en cuenta que S es un disco absorbente en X , y llame a su función de Minkowski q . Entonces p = P en M y Pq en X .

Separación geométrica

Hahn-Banach teorema del sándwich  -  Let S ser cualquier subconjunto de un espacio vectorial real X , dejó p sea una función sublinear en X , y dejar que f  : SR sea cualquier mapa. Si existen números positivos a y b tales que para todo x , yS ,

entonces existe un funcional lineal F en X tal que Fp en X y fF en S .

Extensión lineal máxima

Teorema  (Andenaes, 1970)  -  Sea M un subespacio vectorial de un espacio vectorial real X , p una función sublineal en X , f una funcional lineal en M tal que fp en M , y sea S cualquier subconjunto de X . Entonces existe un funcional lineal F en X que extiende f , satisface F ≤ p en X , y es (puntualmente) máximo en el siguiente sentido: si G es un funcional lineal en X que extiende f y satisface Gp en X , entonces GF implica que G = F en S .

Hahn – Banach valorado por vectores

Teorema  -  Sean X e Y espacios vectoriales sobre el mismo campo, M sea ​​un subespacio vectorial de X y f  : MY sea ​​un mapa lineal. Entonces existe un mapa lineal F  : XY que se extiende f .

Para funciones no lineales

El siguiente teorema de Mazur-Orlicz (1953) es equivalente al teorema de Hahn-Banach.

Mazur-Orlicz teorema  -  Let T ser cualquier conjunto, r  : TR ser cualquier valor real-mapa, X un espacio vectorial real o complejo, v  : TX ser cualquier mapa, y p sea una función sublineal en X . Entonces los siguientes son equivalentes:

  1. existe una F funcional lineal de valor real en X tal que Fp en X y rFv en T ;
  2. para cualquier entero positivo n , cualquier secuencia s 1 , ..., s n de números reales no negativos, y cualquier secuencia t 1 , ..., t n de elementos de T ,

El siguiente teorema caracteriza cuando cualquier función escalar en X (no necesariamente lineal) tiene una extensión lineal continuo a todos X .

Teorema  (El principio de extensión)  -  Deje f una función escalar de valor en un subconjunto S de un espacio vectorial topológico X . Entonces existe una función lineal continua F en X que se extiende f si y sólo si existe una seminorma continua p en X tal que

para todos los enteros positivos ny todas las secuencias finitas ( a i )n
yo = 1
de escalares y elementos ( s i )n
yo = 1
de S .

Conversar

Sea X un espacio vectorial topológico. Un subespacio vectorial M de X tiene la propiedad de extensión si cualquier funcional lineal continuo en M puede extenderse a un funcional lineal continuo en X , y decimos que X tiene la propiedad de extensión de Hahn-Banach ( HBEP ) si cada subespacio vectorial de X tiene la propiedad de extensión.

El teorema de Hahn-Banach garantiza que cada espacio localmente convexo de Hausdorff tiene el HBEP. Para espacios vectoriales topológicos metrizables completos , existe lo contrario, debido a Kalton: cada TVS metrizable completo con la propiedad de extensión de Hahn-Banach es localmente convexo. Por otro lado, un espacio vectorial X de dimensión incontable, dotado de la topología vectorial más fina , entonces este es un espacio vectorial topológico con la propiedad de extensión de Hahn-Banach que no es ni localmente convexa ni metrizable.

Un subespacio vectorial M de un TVS X tiene la propiedad de separación si para cada elemento de X tal que xM , existe un funcional lineal continuo f en X tal que f ( x ) ≠ 0 y f ( m ) = 0 para todos mm . Claramente, el espacio dual continuo de un TVS X separa puntos en X si y solo si {0} tiene la propiedad de separación. En 1992, Kąkol demostró que cualquier infinito dimensional espacio vectorial X , no existe TV de topologías en X que no tienen la HBEP a pesar de tener suficientes funcionales lineales continuas para el espacio dual continuo a puntos separados en X . Sin embargo, si X es un TVS, entonces cada subespacio vectorial de X tiene la propiedad de extensión si y solo si cada subespacio vectorial de X tiene la propiedad de separación.

Ver también

Referencias

Bibliografía