Ecuación de Dirac - Dirac equation

En la física de partículas , la ecuación de Dirac es una ecuación de onda relativista derivada por el físico británico Paul Dirac en 1928. En su forma libre , o incluyendo interacciones electromagnéticas , que describe todas las spin- 1 / 2 partículas masivas tales como electrones y quarks para los que la paridad es una simetría . Es consistente tanto con los principios de la mecánica cuántica como con la teoría de la relatividad especial , y fue la primera teoría en explicar completamente la relatividad especial en el contexto de la mecánica cuántica . Fue validado contabilizando los detalles finos del espectro de hidrógeno de una manera completamente rigurosa.

La ecuación también implicaba la existencia de una nueva forma de materia, la antimateria , previamente insospechada y no observada y que fue confirmada experimentalmente varios años después. También proporcionó una justificación teórica para la introducción de varias funciones de onda componentes en la teoría fenomenológica del espín de Pauli . Las funciones de onda en la teoría de Dirac son vectores de cuatro números complejos (conocidos como bispinores ), dos de los cuales se asemejan a la función de onda de Pauli en el límite no relativista, en contraste con la ecuación de Schrödinger que describía funciones de onda de un solo valor complejo. Además, en el límite de masa cero, la ecuación de Dirac se reduce a la ecuación de Weyl .

Aunque Dirac no apreció al principio completamente la importancia de sus resultados, la explicación implícita del espín como consecuencia de la unión de la mecánica cuántica y la relatividad —y el eventual descubrimiento del positrón— representa uno de los grandes triunfos de la física teórica . Este logro ha sido descrito como completamente a la par con los trabajos de Newton , Maxwell y Einstein antes que él. En el contexto de la teoría cuántica de campos , la ecuación de Dirac se reinterpreta para describir los campos cuánticos correspondientes a partículas de espín 12 .

La ecuación de Dirac aparece en el suelo de la Abadía de Westminster en la placa que conmemora la vida de Paul Dirac, que se dio a conocer el 13 de noviembre de 1995.

Formulación matemática

La ecuación de Dirac en la forma propuesta originalmente por Dirac es:

donde ψ ( x , t ) es la función de onda para el electrón de masa en reposo m con coordenadas espaciotemporales x , t . Los p 1 , p 2 , p 3 son los componentes de la cantidad de movimiento , entendido como el operador de la cantidad de movimiento en la ecuación de Schrödinger . Además, c es la velocidad de la luz y ħ es la constante de Planck reducida . Estas constantes físicas fundamentales reflejan la relatividad especial y la mecánica cuántica, respectivamente.

El propósito de Dirac al formular esta ecuación era explicar el comportamiento del electrón que se mueve relativistamente y, por lo tanto, permitir que el átomo sea tratado de una manera consistente con la relatividad. Su esperanza más bien modesta era que las correcciones introducidas de esta manera pudieran tener relación con el problema de los espectros atómicos .

Hasta ese momento, los intentos de hacer compatible la vieja teoría cuántica del átomo con la teoría de la relatividad, que se basaban en discretizar el momento angular almacenado en la órbita posiblemente no circular del electrón del núcleo atómico , habían fracasado, y la nueva La mecánica cuántica de Heisenberg , Pauli , Jordan , Schrödinger y el propio Dirac no se había desarrollado lo suficiente para tratar este problema. Aunque las intenciones originales de Dirac fueron satisfechas, su ecuación tuvo implicaciones mucho más profundas para la estructura de la materia e introdujo nuevas clases matemáticas de objetos que ahora son elementos esenciales de la física fundamental.

Los nuevos elementos de esta ecuación son las cuatro matrices de 4 × 4 α 1 , α 2 , α 3 y β , y la función de onda de cuatro componentes ψ . Hay cuatro componentes en ψ porque su evaluación en cualquier punto dado del espacio de configuración es un bispinor . Se interpreta como una superposición de un electrón de spin-up , un electrón de spin-down, un positrón de spin-up y un positrón de spin-down (ver más abajo para una discusión más detallada).

Las matrices de 4 × 4 α k y β son todas hermitianas y son involutivas :

y todos se anticonmutan mutuamente :

Estas matrices y la forma de la función de onda tienen un profundo significado matemático. La estructura algebraica representada por las matrices gamma había sido creada unos 50 años antes por el matemático inglés WK Clifford . A su vez, las ideas de Clifford habían surgido del trabajo de mediados del siglo XIX del matemático alemán Hermann Grassmann en su Lineale Ausdehnungslehre ( Teoría de las extensiones lineales ). Este último había sido considerado casi incomprensible por la mayoría de sus contemporáneos. La aparición de algo tan aparentemente abstracto, en una fecha tan tardía y de una manera física tan directa, es uno de los capítulos más notables de la historia de la física.

La ecuación simbólica única se descompone así en cuatro ecuaciones diferenciales parciales de primer orden lineales acopladas para las cuatro cantidades que componen la función de onda. La ecuación se puede escribir más explícitamente en unidades de Planck como:

lo que deja más claro que es un conjunto de cuatro ecuaciones diferenciales parciales con cuatro funciones desconocidas.

Haciendo relativista la ecuación de Schrödinger

La ecuación de Dirac es superficialmente similar a la ecuación de Schrödinger para una partícula libre masiva :

El lado izquierdo representa el cuadrado del operador de momento dividido por el doble de la masa, que es la energía cinética no relativista. Debido a que la relatividad trata el espacio y el tiempo como un todo, una generalización relativista de esta ecuación requiere que las derivadas de espacio y tiempo deben entrar simétricamente como lo hacen en las ecuaciones de Maxwell que gobiernan el comportamiento de la luz; las ecuaciones deben ser diferencialmente del mismo orden en el espacio. y tiempo. En relatividad, el momento y las energías son las partes de espacio y tiempo de un vector espacio-tiempo, el cuatro-momento , y están relacionados por la relación relativista invariante

lo que dice que la longitud de este cuatro-vector es proporcional a la masa en reposo m . Sustituyendo los equivalentes de operador de la energía y el momento de la teoría de Schrödinger, obtenemos la ecuación de Klein-Gordon que describe la propagación de ondas, construida a partir de objetos relativísticamente invariantes,

siendo la función de onda ϕ un escalar relativista: un número complejo que tiene el mismo valor numérico en todos los marcos de referencia. Las derivadas espaciales y temporales entran en segundo orden. Esto tiene una consecuencia reveladora para la interpretación de la ecuación. Debido a que la ecuación es de segundo orden en la derivada del tiempo, se deben especificar valores iniciales tanto de la función de onda como de su primera derivada del tiempo para resolver problemas definidos. Dado que ambos pueden especificarse más o menos arbitrariamente, la función de onda no puede mantener su papel anterior de determinar la densidad de probabilidad de encontrar el electrón en un estado de movimiento dado. En la teoría de Schrödinger, la densidad de probabilidad viene dada por la expresión definida positiva

y esta densidad se convecta de acuerdo con el vector de corriente de probabilidad

con la conservación de la corriente de probabilidad y la densidad a partir de la ecuación de continuidad:

El hecho de que la densidad sea positiva definida y convendida de acuerdo con esta ecuación de continuidad implica que podemos integrar la densidad sobre un cierto dominio y establecer el total en 1, y esta condición será mantenida por la ley de conservación . Una teoría relativista adecuada con una corriente de densidad de probabilidad también debe compartir esta característica. Ahora bien, si deseamos mantener la noción de densidad convectiva, entonces debemos generalizar la expresión de Schrödinger de la densidad y la corriente para que las derivadas de espacio y tiempo entren nuevamente simétricamente en relación con la función de onda escalar. Se nos permite mantener la expresión de Schrödinger para la corriente, pero debemos reemplazar la densidad de probabilidad por la expresión formada simétricamente

que ahora se convierte en el cuarto componente de un vector espaciotemporal, y toda la densidad de corriente de probabilidad 4 tiene la expresión covariante relativista

La ecuación de continuidad es como antes. Todo es compatible con la relatividad ahora, pero vemos de inmediato que la expresión para la densidad ya no es positiva definida : los valores iniciales de ψ y t ψ pueden elegirse libremente y, por lo tanto, la densidad puede volverse negativa, algo que es imposible. para una densidad de probabilidad legítima. Por lo tanto, no podemos obtener una generalización simple de la ecuación de Schrödinger bajo el supuesto ingenuo de que la función de onda es un escalar relativista y la ecuación que satisface es de segundo orden en el tiempo.

Aunque no es una generalización relativista exitosa de la ecuación de Schrödinger, esta ecuación resucita en el contexto de la teoría cuántica de campos , donde se conoce como la ecuación de Klein-Gordon , y describe un campo de partículas sin espinas (por ejemplo, mesón pi o bosón de Higgs ) . Históricamente, el propio Schrödinger llegó a esta ecuación antes que la que lleva su nombre, pero pronto la descartó. En el contexto de la teoría cuántica de campos, se entiende que la densidad indefinida corresponde a la densidad de carga , que puede ser positiva o negativa, y no a la densidad de probabilidad.

Golpe de Dirac

Dirac pensó entonces en probar una ecuación de primer orden tanto en el espacio como en el tiempo. Se podría, por ejemplo, tomar formalmente (es decir, abusando de la notación ) la expresión relativista de la energía

reemplace p por su operador equivalente, expanda la raíz cuadrada en una serie infinita de operadores derivados, establezca un problema de valor propio y luego resuelva la ecuación formalmente mediante iteraciones. La mayoría de los físicos tenían poca fe en tal proceso, incluso si fuera técnicamente posible.

Según cuenta la historia, Dirac estaba mirando fijamente a la chimenea en Cambridge, reflexionando sobre este problema, cuando se le ocurrió la idea de tomar la raíz cuadrada del operador de onda así:

Al multiplicar el lado derecho, vemos que, para que todos los términos cruzados como xy desaparezcan, debemos asumir

con

Dirac, que en ese momento había estado intensamente involucrado en la elaboración de los fundamentos de la mecánica matricial de Heisenberg , comprendió de inmediato que estas condiciones podrían cumplirse si A , B , C y D son matrices , con la implicación de que la función de onda tiene múltiples componentes . Esto explicó de inmediato la aparición de funciones de onda de dos componentes en la teoría fenomenológica del giro de Pauli , algo que hasta entonces se había considerado misterioso, incluso para el propio Pauli. Sin embargo, se necesitan al menos matrices 4 × 4 para configurar un sistema con las propiedades requeridas, por lo que la función de onda tenía cuatro componentes, no dos, como en la teoría de Pauli, o uno, como en la teoría de Schrödinger. La función de onda de cuatro componentes representa una nueva clase de objeto matemático en las teorías físicas que hace su primera aparición aquí.

Dada la factorización en términos de estas matrices, ahora se puede escribir inmediatamente una ecuación

con por determinar. Aplicando nuevamente el operador matricial en ambos lados se obtiene

Al tomar , encontramos que todos los componentes de la función de onda satisfacen individualmente la relación relativista energía-momento. Así, la ecuación buscada que es de primer orden tanto en el espacio como en el tiempo es

Configuración

y porqué

obtenemos la ecuación de Dirac como se escribió arriba.

Forma covariante e invariancia relativista

Para demostrar la invariancia relativista de la ecuación, es ventajoso plasmarla en una forma en la que las derivadas de espacio y tiempo aparezcan en pie de igualdad. Las nuevas matrices se introducen de la siguiente manera:

y la ecuación toma la forma (recordando la definición de los componentes covariantes del gradiente 4 y especialmente que 0 = 1/Ct )

Ecuación de Dirac

donde hay una suma implícita sobre los valores del índice repetido dos veces μ = 0, 1, 2, 3 y μ es el gradiente 4. En la práctica, a menudo se escriben las matrices gamma en términos de submatrices de 2 × 2 tomadas de las matrices de Pauli y la matriz de identidad de 2 × 2 . Explícitamente, la representación estándar es

El sistema completo se resume utilizando la métrica de Minkowski sobre el espacio-tiempo en la forma

donde la expresión de corchetes

denota el anticonmutador . Estas son las relaciones definitorias de un álgebra de Clifford sobre un espacio de 4 dimensiones pseudo-ortogonal con firma métrica (+ - - -) . El álgebra de Clifford específica empleada en la ecuación de Dirac se conoce hoy como álgebra de Dirac . Aunque Dirac no lo reconoció como tal en el momento en que se formuló la ecuación, en retrospectiva, la introducción de este álgebra geométrica representa un enorme avance en el desarrollo de la teoría cuántica.

La ecuación de Dirac ahora puede interpretarse como una ecuación de valor propio , donde la masa en reposo es proporcional a un valor propio del operador de 4 momentos , siendo la constante de proporcionalidad la velocidad de la luz:

Usando ( se pronuncia "d-slash"), de acuerdo con la notación de barra de Feynman , la ecuación de Dirac se convierte en:

En la práctica, los físicos suelen utilizar unidades de medida tales que ħ = c = 1 , conocidas como unidades naturales . La ecuación luego toma la forma simple

Ecuación de Dirac (unidades naturales)

Un teorema fundamental establece que si se dan dos conjuntos distintos de matrices que ambos satisfacen las relaciones de Clifford , entonces están conectados entre sí por una transformación de similitud :

Si además las matrices son todas unitarias , como lo es el conjunto de Dirac, entonces S es unitario ;

La transformación U es única hasta un factor multiplicativo de valor absoluto 1. Imaginemos ahora que se ha realizado una transformación de Lorentz en las coordenadas de espacio y tiempo, y en los operadores derivados, que forman un vector covariante. Para que el operador γ μμ permanezca invariante, los gammas deben transformarse entre sí como un vector contravariante con respecto a su índice de espacio-tiempo. Estos nuevos gammas satisfarán por sí mismos las relaciones de Clifford, debido a la ortogonalidad de la transformación de Lorentz. Por el teorema fundamental, podemos reemplazar el nuevo conjunto por el antiguo sujeto a una transformación unitaria. En el nuevo marco, recordando que la masa en reposo es un escalar relativista, la ecuación de Dirac tomará la forma

Si ahora definimos el spinor transformado

luego tenemos la ecuación de Dirac transformada de una manera que demuestra invariancia relativista manifiesta :

Así, una vez que nos decidimos por cualquier representación unitaria de los gammas, es definitiva siempre que transformemos el espinor según la transformación unitaria que corresponda a la transformación de Lorentz dada.

Las diversas representaciones de las matrices de Dirac empleadas enfocarán aspectos particulares del contenido físico en la función de onda de Dirac (ver más abajo). La representación que se muestra aquí se conoce como la representación estándar : en ella, los dos componentes superiores de la función de onda pasan a la función de onda de 2 espinor de Pauli en el límite de bajas energías y pequeñas velocidades en comparación con la luz.

Las consideraciones anteriores revelan el origen de los gammas en geometría , siguiendo la motivación original de Grassmann: representan una base fija de vectores unitarios en el espacio-tiempo. De manera similar, los productos de gammas como γ μ γ ν representan elementos de superficie orientados , y así sucesivamente. Con esto en mente, podemos encontrar la forma del elemento de volumen unitario en el espacio-tiempo en términos de gammas de la siguiente manera. Por definicin, es

Para que sea invariante, el símbolo épsilon debe ser un tensor y, por lo tanto, debe contener un factor de g , donde g es el determinante del tensor métrico . Dado que esto es negativo, ese factor es imaginario . Por lo tanto

A esta matriz se le asigna el símbolo especial γ 5 , debido a su importancia cuando se considera transformaciones impropias del espacio-tiempo, es decir, aquellas que cambian la orientación de los vectores base. En la representación estándar, es

También se encontrará que esta matriz anticonmuta con las otras cuatro matrices de Dirac:

Asume un papel de liderazgo cuando surgen cuestiones de paridad porque el elemento de volumen como magnitud dirigida cambia de signo bajo una reflexión espacio-temporal. Sacar la raíz cuadrada positiva anterior equivale a elegir una convención de mano sobre el espacio-tiempo.

Conservación de la corriente de probabilidad

Definiendo el espinor adjunto

donde ψ es la transposición conjugada de ψ , y notando que

obtenemos, tomando el conjugado hermitiano de la ecuación de Dirac y multiplicando desde la derecha por γ 0 , la ecuación adjunta:

donde se entiende que μ actúa hacia la izquierda. Multiplicando la ecuación de Dirac por ψ desde la izquierda, y la ecuación adjunta por ψ desde la derecha, y sumando, se obtiene la ley de conservación de la corriente de Dirac:

Ahora vemos la gran ventaja de la ecuación de primer orden sobre la que había intentado Schrödinger: esta es la densidad de corriente conservada requerida por la invariancia relativista, solo que ahora su cuarto componente es positivo definido y, por lo tanto, adecuado para el papel de una densidad de probabilidad:

Debido a que la densidad de probabilidad ahora aparece como el cuarto componente de un vector relativista y no como un escalar simple como en la ecuación de Schrödinger, estará sujeta a los efectos usuales de las transformaciones de Lorentz como la dilatación del tiempo. Así, por ejemplo, los procesos atómicos que se observan como tasas, necesariamente serán ajustados de manera consistente con la relatividad, mientras que aquellos que involucran la medición de energía y momento, que a su vez forman un vector relativista, sufrirán un ajuste paralelo que preserva la covarianza relativista. de los valores observados. La corriente de Dirac en sí misma es entonces el cuatro vector covariante espacio-tiempo:

Soluciones

Consulte el espinor de Dirac para obtener detalles de las soluciones de la ecuación de Dirac. Tenga en cuenta que, dado que el operador de Dirac actúa sobre 4 tuplas de funciones cuadradas integrables , sus soluciones deben ser miembros del mismo espacio de Hilbert . El hecho de que las energías de las soluciones no tengan un límite inferior es inesperado; consulte la sección de teoría de agujeros a continuación para obtener más detalles.

Comparación con la teoría de Pauli

La necesidad de introducir espín medio entero se remonta experimentalmente a los resultados del experimento de Stern-Gerlach . Un haz de átomos pasa a través de un fuerte campo magnético no homogéneo , que luego se divide en N partes dependiendo del momento angular intrínseco de los átomos. Se encontró que para los átomos de plata , el haz se dividió en dos; por lo tanto, el estado fundamental no podría ser un número entero , porque incluso si el momento angular intrínseco de los átomos fuera lo más pequeño posible, 1, el haz se dividiría en tres partes. , correspondiente a átomos con L z = −1, 0, +1 . La conclusión es que los átomos de plata tienen un momento angular intrínseco neto de 12 . Pauli estableció una teoría que explicaba esta división introduciendo una función de onda de dos componentes y un término de corrección correspondiente en el hamiltoniano , que representa un acoplamiento semiclásico de esta función de onda a un campo magnético aplicado, como en unidades SI : (Nota que los caracteres en negrita implican vectores euclidianos en 3  dimensiones , mientras que el A μ de cuatro vectores de Minkowski se puede definir como .)

Aquí A y representan los componentes de los cuatro potenciales electromagnéticos en sus unidades SI estándar, y los tres sigmas son las matrices de Pauli . Al cuadrar el primer término, se encuentra una interacción residual con el campo magnético, junto con el hamiltoniano clásico habitual de una partícula cargada que interactúa con un campo aplicado en unidades SI :

Este hamiltoniano es ahora una matriz de 2 × 2 , por lo que la ecuación de Schrödinger basada en él debe usar una función de onda de dos componentes. Al introducir el potencial electromagnético externo de 4 vectores en la ecuación de Dirac de una manera similar, conocida como acoplamiento mínimo , toma la forma:

Una segunda aplicación del operador de Dirac reproducirá ahora el término de Pauli exactamente como antes, porque las matrices espaciales de Dirac multiplicadas por i tienen las mismas propiedades de cuadratura y conmutación que las matrices de Pauli. Es más, el valor de la relación giromagnética del electrón, frente al nuevo término de Pauli, se explica desde los primeros principios. Este fue un logro importante de la ecuación de Dirac y dio a los físicos una gran fe en su corrección general. Sin embargo, hay más. La teoría de Pauli puede verse como el límite de baja energía de la teoría de Dirac de la siguiente manera. Primero, la ecuación se escribe en forma de ecuaciones acopladas para 2 espinores con las unidades SI restauradas:

asi que

Suponiendo que el campo es débil y el movimiento del electrón no relativista, tenemos la energía total del electrón aproximadamente igual a su energía en reposo , y el momento pasa al valor clásico,

y entonces la segunda ecuación puede escribirse

que es de orden v/C- así, a energías y velocidades típicas, los componentes inferiores del espinor de Dirac en la representación estándar están muy suprimidos en comparación con los componentes superiores. Sustituir esta expresión en la primera ecuación da después de algún reordenamiento

El operador de la izquierda representa la energía de la partícula reducida por su energía en reposo, que es solo la energía clásica, por lo que recuperamos la teoría de Pauli si identificamos su 2-espinor con las componentes superiores del espino de Dirac en la aproximación no relativista. Una aproximación adicional da la ecuación de Schrödinger como el límite de la teoría de Pauli. Por lo tanto, la ecuación de Schrödinger puede verse como la aproximación no relativista lejana de la ecuación de Dirac cuando uno puede descuidar el giro y trabajar solo a bajas energías y velocidades. Esto también fue un gran triunfo para la nueva ecuación, ya que trazó la misteriosa i que aparece en ella, y la necesidad de una función de onda compleja, de regreso a la geometría del espacio-tiempo a través del álgebra de Dirac. También destaca por qué la ecuación de Schrödinger, aunque superficialmente en forma de ecuación de difusión , en realidad representa la propagación de ondas.

Se debe enfatizar fuertemente que esta separación del espino de Dirac en componentes grandes y pequeños depende explícitamente de una aproximación de baja energía. Todo el espinor de Dirac representa un todo irreductible , y los componentes que acabamos de descuidar para llegar a la teoría de Pauli traerán nuevos fenómenos al régimen relativista: la antimateria y la idea de creación y aniquilación de partículas.

Comparación con la teoría de Weyl

En el límite m → 0 , la ecuación de Dirac se reduce a la ecuación de Weyl , que describe partículas relativistas sin espín - 12 .

Dirac Lagrangiano

Tanto la ecuación de Dirac como la ecuación de Dirac adjunta se pueden obtener (variando) la acción con una densidad lagrangiana específica que viene dada por:

Si se varía esto con respecto a ψ, se obtiene la ecuación de Dirac adjunta. Mientras tanto, si se varía esto con respecto a ψ, se obtiene la ecuación de Dirac.

Interpretación física

Identificación de observables

La pregunta física crítica en una teoría cuántica es la siguiente: ¿cuáles son las cantidades físicamente observables definidas por la teoría? Según los postulados de la mecánica cuántica, tales cantidades son definidas por operadores hermitianos que actúan sobre el espacio de Hilbert de posibles estados de un sistema. Los valores propios de estos operadores son entonces los posibles resultados de medir la correspondiente cantidad física. En la teoría de Schrödinger, el objeto más simple es el hamiltoniano general, que representa la energía total del sistema. Si deseamos mantener esta interpretación al pasar a la teoría de Dirac, debemos tomar el hamiltoniano como

donde, como siempre, hay una suma implícita sobre el índice repetido dos veces k = 1, 2, 3 . Esto parece prometedor, porque vemos al inspeccionar la energía en reposo de la partícula y, en el caso de A = 0 , la energía de una carga colocada en un potencial eléctrico cqA 0 . ¿Qué pasa con el término que involucra el potencial vectorial? En electrodinámica clásica, la energía de una carga que se mueve en un potencial aplicado es

Por lo tanto, el Hamiltoniano de Dirac se distingue fundamentalmente de su contraparte clásica, y debemos tener mucho cuidado para identificar correctamente lo que es observable en esta teoría. Gran parte del comportamiento aparentemente paradójico implícito en la ecuación de Dirac equivale a una identificación errónea de estos observables.

Teoría del agujero

Las soluciones E negativas de la ecuación son problemáticas, ya que se asumió que la partícula tiene una energía positiva. Sin embargo, matemáticamente hablando, no parece haber ninguna razón para que rechacemos las soluciones de energía negativa. Dado que existen, no podemos simplemente ignorarlos, porque una vez que incluimos la interacción entre el electrón y el campo electromagnético, cualquier electrón colocado en un estado propio de energía positiva se desintegraría en estados propios de energía negativa de energía sucesivamente más baja. Los electrones reales, obviamente, no se comportan de esta manera, o desaparecerían emitiendo energía en forma de fotones .

Para hacer frente a este problema, Dirac introdujo la hipótesis, conocida como teoría del agujero , de que el vacío es el estado cuántico de muchos cuerpos en el que están ocupados todos los estados propios de los electrones de energía negativa. Esta descripción del vacío como un "mar" de electrones se denomina mar de Dirac . Dado que el principio de exclusión de Pauli prohíbe que los electrones ocupen el mismo estado, cualquier electrón adicional se vería obligado a ocupar un estado propio de energía positiva, y los electrones de energía positiva tendrían prohibido desintegrarse en estados propios de energía negativa.

Si un electrón tiene prohibido ocupar simultáneamente estados propios de energía positiva y negativa, entonces la característica conocida como Zitterbewegung , que surge de la interferencia de estados de energía positiva y negativa, debería considerarse una predicción no física de teoría de Dirac dependiente del tiempo. Esta conclusión puede inferirse de la explicación de la teoría de huecos dada en el párrafo anterior. Se han publicado resultados recientes en Nature [R. Gerritsma, G. Kirchmair, F. Zaehringer, E. Solano, R. Blatt y C. Roos, Nature 463, 68-71 (2010)] en el que se simuló la característica Zitterbewegung en un experimento de iones atrapados. Este experimento impacta la interpretación del agujero si se infiere que el experimento de laboratorio de física no es simplemente una verificación de la corrección matemática de una solución de la ecuación de Dirac, sino la medición de un efecto real cuya detectabilidad en la física de electrones aún está fuera de alcance.

Dirac razonó además que si los autoestados de energía negativa se llenan de manera incompleta, cada autoestado desocupado, llamado agujero , se comportaría como una partícula cargada positivamente. El agujero posee una energía positiva porque se requiere energía para crear un par partícula-agujero a partir del vacío. Como se señaló anteriormente, Dirac inicialmente pensó que el agujero podría ser el protón, pero Hermann Weyl señaló que el agujero debería comportarse como si tuviera la misma masa que un electrón, mientras que el protón es 1800 veces más pesado. El agujero fue finalmente identificado como el positrón , descubierto experimentalmente por Carl Anderson en 1932.

No es del todo satisfactorio describir el "vacío" utilizando un mar infinito de electrones de energía negativa. Las contribuciones infinitamente negativas del mar de electrones de energía negativa tienen que ser canceladas por una energía "desnuda" positiva infinita y la contribución a la densidad de carga y la corriente proveniente del mar de electrones de energía negativa es exactamente cancelada por un positivo infinito " gelatina ", de modo que la densidad de carga eléctrica neta del vacío sea cero. En la teoría cuántica de campos , una transformación de Bogoliubov en los operadores de creación y aniquilación (convirtiendo un estado de electrón de energía negativa ocupado en un estado de positrón de energía positiva desocupado y un estado de electrón de energía negativa desocupado en un estado de positrón de energía positiva ocupado) nos permite evitar el formalismo del mar de Dirac aunque, formalmente, es equivalente a él.

En ciertas aplicaciones de la física de la materia condensada , sin embargo, los conceptos subyacentes de la "teoría de los agujeros" son válidos. El mar de electrones de conducción en un conductor eléctrico , llamado mar de Fermi , contiene electrones con energías hasta el potencial químico del sistema. Un estado vacío en el mar de Fermi se comporta como un electrón cargado positivamente, aunque se lo conoce como un "agujero" en lugar de un "positrón". La carga negativa del mar de Fermi se equilibra con la red iónica cargada positivamente del material.

En la teoría cuántica de campos

En las teorías cuánticas de campos , como la electrodinámica cuántica , el campo de Dirac está sujeto a un proceso de segunda cuantificación , que resuelve algunas de las características paradójicas de la ecuación.

Covarianza de Lorentz de la ecuación de Dirac

La ecuación de Dirac es covariante de Lorentz . Articular esto ayuda a iluminar no solo la ecuación de Dirac, sino también el espinor de Majorana y el espinor de Elko , que aunque están estrechamente relacionados, tienen diferencias sutiles e importantes.

La comprensión de la covarianza de Lorentz se simplifica teniendo en cuenta el carácter geométrico del proceso. Sea un único punto fijo en la variedad del espacio-tiempo . Su ubicación se puede expresar en múltiples sistemas de coordenadas . En la literatura de física, estos se escriben como y , con el entendimiento de que ambos y describen el mismo punto , pero en diferentes marcos de referencia locales (un marco de referencia sobre un pequeño parche extendido de espacio-tiempo). Uno puede imaginar que tiene una fibra de diferentes marcos de coordenadas encima. En términos geométricos, se dice que el espacio-tiempo se puede caracterizar como un haz de fibras , y específicamente, el haz de tramas . La diferencia entre dos puntos y en la misma fibra es una combinación de rotaciones y refuerzos de Lorentz . Una opción de marco de coordenadas es una sección (local) a través de ese paquete.

Acoplado al paquete de cuadros hay un segundo paquete, el paquete de espinor . Una sección a través del haz de espinor es solo el campo de partículas (el espinor de Dirac, en el presente caso). Diferentes puntos en la fibra espinorl corresponden al mismo objeto físico (el fermión) pero expresados ​​en diferentes marcos de Lorentz. Claramente, el paquete de marcos y el paquete de espinas deben estar unidos de manera consistente para obtener resultados consistentes; formalmente, se dice que el paquete de espinor es el paquete asociado ; está asociado a un paquete principal , que en el presente caso es el paquete de tramas. Las diferencias entre los puntos de la fibra corresponden a las simetrías del sistema. El haz de espinas tiene dos generadores distintos de sus simetrías: el momento angular total y el momento angular intrínseco . Ambos corresponden a transformaciones de Lorentz, pero de diferentes formas.

La presentación aquí sigue a la de Itzykson y Zuber. Es casi idéntico al de Bjorken y Drell. Una derivación similar en un contexto relativista general se puede encontrar en Weinberg. Bajo una transformación de Lorentz, el espinor de Dirac se transforma como

Se puede demostrar que una expresión explícita para viene dada por

donde parametriza la transformación de Lorentz, y es la matriz 4 × 4

Esta matriz se puede interpretar como el momento angular intrínseco del campo de Dirac. Que merece esta interpretación surge al contrastarlo con el generador de transformaciones de Lorentz , que tiene la forma

Esto se puede interpretar como el momento angular total . Actúa sobre el campo de espinor como

Tenga en cuenta que lo anterior no tiene un primo: lo anterior se obtiene transformando la obtención del cambio y luego regresando al sistema de coordenadas original .

La interpretación geométrica de lo anterior es que el campo de la trama es afín y no tiene un origen preferido. El generador genera las simetrías de este espacio: proporciona un reetiquetado de un punto fijo El generador genera un movimiento de un punto a otro en la fibra: un movimiento desde ambos y todavía correspondiente al mismo punto espaciotemporal Estas observaciones quizás obtusas pueden ser aclarado con álgebra explícita.

Sea una transformación de Lorentz. La ecuación de Dirac es

Si la ecuación de Dirac va a ser covariante, entonces debería tener exactamente la misma forma en todos los marcos de Lorentz:

Los dos espinores y deben tanto describir el mismo campo físico, y así deben estar relacionados por una transformación que no cambia ninguna observables físicos (carga, corriente, masa, etc. ) La transformación debe codificar sólo el cambio de marco de coordenadas. Se puede demostrar que tal transformación es una matriz unitaria de 4 × 4 . Por tanto, se puede suponer que la relación entre los dos marcos se puede escribir como

Insertando esto en la ecuación transformada, el resultado es

La transformación de Lorentz es

La ecuación de Dirac original se recupera si

Se puede obtener una expresión explícita para (igual a la expresión dada arriba) considerando una transformación de Lorentz infinitesimal.

donde es el tensor métrico y es antisimétrico. Después de enchufar y tragar, se obtiene

que es la forma (infinitesimal) de arriba. Para obtener el reetiquetado afín, escriba

Después de una adecuada antisimetrización, se obtiene el generador de simetrías dado anteriormente. Por lo tanto, se puede decir que ambos y son los "generadores de transformaciones de Lorentz", pero con una distinción sutil: el primero corresponde a un reetiquetado de puntos en el haz de marcos afines , lo que fuerza una traslación a lo largo de la fibra del espinor en el espín. haz , mientras que el segundo corresponde a traslaciones a lo largo de la fibra del haz de espín (tomado como un movimiento a lo largo del haz de estructura, así como un movimiento a lo largo de la fibra del haz de espín). Weinberg proporciona argumentos adicionales para la interpretación física de estos como Momento angular total e intrínseco.

Otras formulaciones

La ecuación de Dirac se puede formular de muchas otras formas.

Espacio-tiempo curvo

Este artículo ha desarrollado la ecuación de Dirac en el espacio-tiempo plano según la relatividad especial. Es posible formular la ecuación de Dirac en un espacio-tiempo curvo .

El álgebra del espacio físico

Este artículo desarrolló la ecuación de Dirac utilizando cuatro vectores y operadores de Schrödinger. La ecuación de Dirac en el álgebra del espacio físico usa un álgebra de Clifford sobre los números reales, un tipo de álgebra geométrica.

Ver también

Referencias

Citas

Artículos seleccionados

Libros de texto

enlaces externos