Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y...

180
Sobre la teoría especial de la relatividad Juan Manuel Tejeiro Sarmiento Profesor Titular Observatorio Astronómico Nacional Facultad de Ciencias Universidad Nacional de Colombia 2004

Transcript of Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y...

Page 1: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

Sobre la teoría especial de la relatividad

Juan Manuel Tejeiro SarmientoProfesor Titular

Observatorio Astronómico NacionalFacultad de Ciencias

Universidad Nacional de Colombia

2004

Page 2: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

ii

Page 3: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

Índice general

Introducción VII

I Cinemática relativista 1

1. Modelo mecánico del mundo 31.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.2. Leyes de Newton y principio de relatividad . . . . . . . . . . 41.3. Luz y éter: El retorno al espacio absoluto . . . . . . . . . . . 9

1.3.1. Un experimento crucial . . . . . . . . . . . . . . . . . 14

2. Fundamentos de la relatividad especial 192.1. Postulados de la relatividad especial . . . . . . . . . . . . . . 192.2. Transformaciones de Lorentz . . . . . . . . . . . . . . . . . . 242.3. Propiedades de las TL . . . . . . . . . . . . . . . . . . . . . . 312.4. Consecuencias de las TL . . . . . . . . . . . . . . . . . . . . . 40

3. La estructura causal del espacio-tiempo 473.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473.2. Rotaciones en el plano euclideano . . . . . . . . . . . . . . . . 473.3. Cuadri-vectores y el grupo de Lorentz . . . . . . . . . . . . . 513.4. Conos de luz y relaciones de causalidad . . . . . . . . . . . . 553.5. Algebra de cuadri-vectores . . . . . . . . . . . . . . . . . . . . 59

4. Cinemática relativista 654.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 654.2. Cuadri-vector velocidad . . . . . . . . . . . . . . . . . . . . . 654.3. Cuadri-vector aceleración . . . . . . . . . . . . . . . . . . . . 69

4.3.1. Viaje interestelar . . . . . . . . . . . . . . . . . . . . . 704.4. Cuadri-vector de onda . . . . . . . . . . . . . . . . . . . . . . 75

iii

Page 4: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

iv ÍNDICE GENERAL

II Dinámica relativista 79

5. Dinámica relativista 815.1. Ecuaciones de movimiento . . . . . . . . . . . . . . . . . . . . 815.2. Leyes de conservación . . . . . . . . . . . . . . . . . . . . . . 845.3. Propiedades del c-momentun . . . . . . . . . . . . . . . . . . 875.4. Sistema centro de masa . . . . . . . . . . . . . . . . . . . . . 905.5. Energía umbral . . . . . . . . . . . . . . . . . . . . . . . . . . 935.6. Fotones y partículas de masa en reposo cero . . . . . . . . . . 96

6. Aplicaciones de la dinámica relativista 1016.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1016.2. Colisiones elásticas . . . . . . . . . . . . . . . . . . . . . . . . 101

6.2.1. Efecto Compton . . . . . . . . . . . . . . . . . . . . . 1026.2.2. Efecto Compton inverso . . . . . . . . . . . . . . . . . 105

6.3. Colisiones inelásticas . . . . . . . . . . . . . . . . . . . . . . . 1076.3.1. Absorción de un fotón por un átomo . . . . . . . . . . 1086.3.2. Emisión de un fotón por un átomo exitado . . . . . . 111

6.4. Sistemas de masa variable . . . . . . . . . . . . . . . . . . . . 1136.5. Creación y aniquilación de partículas . . . . . . . . . . . . . . 115

III Electrodinámica relativista 117

7. Tensores 1197.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1197.2. Definiciones fundamentales . . . . . . . . . . . . . . . . . . . 120

7.2.1. Componentes covariantes . . . . . . . . . . . . . . . . 1227.2.2. Algebra tensorial . . . . . . . . . . . . . . . . . . . . . 1257.2.3. Propiedades de simetría de tensores . . . . . . . . . . 130

7.3. Transformación general de coordenadas . . . . . . . . . . . . 1367.4. Operadores vectoriales . . . . . . . . . . . 138

8. Electrodinámica 1438.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1438.2. Ecuaciones de Maxwell . . . . . . . . . . . . . . . . . . . . . . 1448.3. Campo magnético como un efecto relativista . . . . . . . . . . 1468.4. Ecuaciones de Maxwell covariantes . . . . . . . . . . . . . . . 1548.5. Transformaciones Gauge . . . . . . . . . . . . . . . . . . . . . 163

9. Bibliografía 169

Page 5: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

Prefacio

Segunda edición de las notas de clase sobre relatividad especial.

v

Page 6: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

vi PREFACE

Page 7: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

Introducción

La teoría de la relatividad (especial y general) es considerada como unode los más grandes logros de la mente humana y forma parte, de lo quepodemos llamar la cultura del hombre del siglo XX. A pesar del estigmade incomprensibilidad que siempre ha rodeado a la teoría de la relatividad,en el sentido que su comprensión está al alcance solamente de unos pocosespecialistas, esta teoría científica ha sido la de mayor impacto y difusión anivel de divulgación y ha tenido influencia definitiva sobre nuestra imagendel mundo.

El desarrollo de la teoría de la relatividad ha estado marcado por cir-cunstancias particulares que la diferencian de otros desarrollos de la físicacontemporánea, a las cuales me referiré en esta introducción, con el fin demostrar, por una parte el estado actual de la teoría y por otra, el papelfundamental que ha jugado y juega esta teoría en el desarrollo de la físicaactual.

La formulación de la Teoría Especial de la Relatividad dada por Einsteinen 1905 es completa, es decir, a parte de ejemplos y aplicaciones de la teoría,o de su reformulación en términos de modelos matemáticos más sofisticados,todo los elementos básicos que hoy conocemos de la teoría especial de la rel-atividad están contenidos en los trabajos originales de Einstein. Además, elestilo del primer trabajo publicado por Einstein sobre el tema, a diferenciade otros trabajos en física teórica, se caracterizó por su sencillez en la ex-posición, con muy poco contenido matemático y la ausencia de referencias aartículos y trabajos anteriores. Su conclusión fundamental, la necesidad dereformular el concepto absoluto de simultaneidad y con él, el concepto detiempo en física, muestra la genialidad de Einstein, no por la complejidad desus razonamientos ni la complejidad en los cálculos, sino por la profundidadde sus conclusiones, las cuales modificaron de manera radical e irreversiblenuestros conceptos básicos de espacio y tiempo. No es cierto, como sostienenvarios historiadores de la física, que el trabajo de Einstein no fue compren-dido en su tiempo, pues pocos meses después de su publicación físicos de

vii

Page 8: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

viii INTRODUCCIÓN

Cracovia afirmaban que había nacido un nuevo Copernico y ya para 1909,los principales físicos de esa época tales como Planck, von Laue y otros,reconocieron la genialidad de Einstein y la importancia de sus trabajos.

Es importante resaltar en este punto que de hecho todas las ecuacionesbásicas de la teoría especial de la relatividad, tales como la contracciónde longitudes, aumento de la masa con la velocidad, la equivalencia masa-energía, etc., ya eran conocidas en la literatura y por lo tanto, la física siestaba preparada para entender y asimilar las ideas de Einstein. Para com-prender esto, basta con recordar que la teoría electromagnética de Maxwelles una teoría relativista y por lo tanto era de esperar que un estudio minu-cioso de las ecuaciones de Maxwell (recordemos el excelente trabajo realiza-do por Lorentz sobre el electrón, el cual fue publicado en 1904) condujera atodas estas ecuaciones relativistas, aun cuando su interpretación estuvierafuertemente influenciada por el concepto del éter.

Claramente, el impacto de la teoría especial de la relatividad de Einsteinno se podía esperar que fuera muy grande a nivel experimental y tecnológi-co, pues de hecho la posibilidad de probar experimentalmente la teoría enforma directa era muy difícil y más significativo aún, era su escasa o prác-ticamente nula aplicabilidad. Esto, debido a que los fenómenos relativistasson relevantes en situaciones que involucren velocidades comparables a lavelocidad de la luz en el vacío (aproximadamente 300,000km/s), lo cual solovino a ser posible con el desarrollo de los grandes aceleradores de partículasa mediados del siglo XX.

En 1916 Einstein publica la Teoría General de la Relatividad, la cualcorresponde a la formulación relativista de la ley de gravitación universal deNewton. Estos trabajos, a diferencia de sus primeras publicaciones sobre lateoría especial de la relatividad, si requirieron de una estructura matemáticamuy compleja: la geometría diferencial y el cálculo tensorial. Dos predic-ciones fundamentales surgen de estos trabajos, el corrimiento del periheliode Mercurio, efecto que ya había sido observado, más no explicado por losastrónomos y la desviación de la luz por el sol, cuya corroboración se da en1919, aprovechando un eclipse total de sol que tuvo lugar el 29 de Mayo.Más significativo aún para el desarrollo de la teoría general de la relativi-dad, puede ser el descubrimiento de Hubble de la expansión del universo en1929, si bien Einstein no había predicho este efecto, si estaba contenido ensus ecuaciones de la relatividad general. Este punto de la historia marca elcomienzo de la cosmología actual, la cual es una de las áreas de investigaciónmás activas que tenemos hoy día.

Retomando de nuevo el desarrollo de la teoría especial de la relatividad,el papel fundamental que ella juega en la física se comienza a reconocer

Page 9: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

ix

y a explotar tan solo con el desarrollo de la mecánica cuántica relativistaformulada por Dirac en 1925. En efecto, hasta 1925 se conocían solamentedos partículas elementales: el electrón y el protón. Como una consecuenciafundamental de su recién desarrollada teoría relativista del electrón, Diracpredice la existencia del positrón, que es una partícula fundamental de lamisma masa del electrón pero de carga opuesta. Este hecho es posterior-mente generalizado y se establece un resultado general de la naturaleza yes que a toda partícula fundamental le corresponde una antipartícula. Estosdesarrollos condujeron entonces a la teoría cuántica de campos, que consti-tuye el marco teórico para entender las interacciones fundamentales de lanaturaleza (electromagnética, fuerte y débil), que rigen el comportamientode la materia a escala microscópica.

Hoy día la teoría especial de la relatividad es reconocida como una teoríafundamental de la física, cuyo alcance va más allá de sus posibles aplica-ciones experimentales o tecnológicas, pues ella se enmarca en el contexto delas propiedades fundamentales del espacio-tiempo, independientemente decualquier modelo físico utilizado para describir los fenómenos. En general,las leyes físicas que rigen el comportamiento de los sistemas se formulan entérminos de relaciones (ecuaciones diferenciales) entre las variables físicasnecesarias para describir un sistema. Estas variables físicas se describen porfunciones del espacio y el tiempo (posición, momentun, energía, etc.), cuyocomportamiento está regido por los principios de la teoría especial de larelatividad.

El objetivo fundamental de este libro es presentar los principios bási-cos y los resultados fundamentales de la teoría especial de la relatividad,con énfasis en una formulación covariante, es decir una formulación que nospermite desde un principio, exhibir en forma explícita el carácter relativistade una teoría. Para este fin se han organizado los temas en tres grupos: Elprimer grupo lo conforman los tres primeros capítulos, la presente introduc-ción, un capítulo sobre los fundamentos de la mecánica Newtoniana, conuna breve discusión sobre el problema del éter, esto con el fin de motivar lospostulados básicos de la teoría especial de la relatividad y sus principalesconsecuencias, desarolladas en el tercer capítulo. El segundo grupo lo consti-tuye el cuerpo central del libro, comenzando con una formulación exhaustivadel concepto de cuadri-vector y la estructura causal del espacio-tiempo paraformular los principios y leyes de la dinámica relativista, dedicando un capí-tulo a sus principales aplicaciones. El último tema está destinado a formularla teoría electromagnética (ecuaciones de Maxwell) en forma explícita rel-ativista, para lo cual se dedica un capítulo a la formulación y álgebra detensores sobre el espacio de Minkowski en forma sencilla, es decir sin re-

Page 10: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

x INTRODUCCIÓN

currir a todo el formalismo matemático de las variedades y la geometríadiferencial, pero manteniendo la validéz general, tanto en la notación comoen los resultados fundamentales.

Page 11: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

Parte I

Cinemática relativista

1

Page 12: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma
Page 13: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

Capítulo 1

Modelo mecánico del mundo

1.1. Introducción

En este capítulo presentaremos en forma resumida la situación de lafísica a comienzos del siglo XX, destacando los hechos más relevantes, quenos permitan motivar y entender mejor los conceptos y postulados funda-mentales, sobre los cuales está basada la teoría especial de la relatividad,formulada en 1905 por el físico alemán Albert Einstein.

En la primera sección revisaremos las leyes y conceptos fundamentalesde la mecánica Newtoniana, dedicando el resto del capítulo a presentar unabreve descripción de algunas de las teorías del éter, con el fín de entender elproblema central que se debatía en la física en la segunda mitad del sigloXIX,en cuanto a la aparente inconsistencia entre la mecánica Newtoniana y larecién desarrollada teoría electromagnética.

La teoría de la mecánica formulada por Newton en el siglo XVI y en-riquecida por la contribución de muchos físicos y matemáticos a lo largo delos dos siglos siguientes, se constituyó en la teoría fundamental que permitíaentender, explicar y predecir todos los fenómenos físicos conocidos. Fue enla primera mitad del siglo XIX que aparecieron fenómenos relacionados conel electromagnetismo y con la luz que comenzaron a complicar la imágen(explicación) mecánica del mundo. Esta situación se tornó más crítica en lasegunda mitad del siglo con el desarrollo de la teoría de la electrodinámicade Maxwell, pues su aparente incompatibilidad con la mecánica newtoni-ana, reflejada no sólo en consideraciones teóricas sino también en resultadosexperimentales, hacían pensar que alguna de las dos teorías, la mecánica o laelectrodinámica, debería ser abandonada o revisada, lo cual no era un prob-lema fácil, pues ambas teorías presentaban una enorme cantidad de pruebas

3

Page 14: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

4 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO

experimentales y desarrollos tecnológicos que sustentaban su validez.

1.2. Leyes de Newton y principio de relatividad

Para comprender mejor los problemas que se le planteaban a la físicaen el siglo XIX y preparar el terreno para entender los cambios de inter-pretación necesarios que se dieron con el desarrollo de la teoría especial dela relatividad, en esta sección revisaremos brevemente algunos conceptosfundamentales de la mecánica newtoniana, cuyo punto de partida son lastres leyes de Newton:

Ley de la inercia- Toda partícula permanece en estado de reposo omovimiento rectilíneo uniforme respecto a cualquier sistema de referenciainercial, mientras no actúen fuerzas externas sobre él, o equivalentemente elmomentum de una partícula libre de fuerzas permanece constante, en dondela cantidad dinámica de momentum se define como

p = mv (1.1)

siendo m la masa inercial de la partícula y v su velocidad.Ecuación de movimiento- La fuerza aplicada sobre la partícula es

igual a la rata de cambio de su momentum

F =dp

dt= m

dv

dt(1.2)

en donde la última igualdad se deduce del hecho que la masa inercial de unapartícula puntual es constante e independiente de su estado de movimiento.

Interacción entre partículas- La fuerza que una partícula A ejercesobre otra partícula B es igual en magnitud y en sentido opuesto a la fuerzaque la partícula B ejerce sobre A.

Para la formulación de estas leyes hay toda una serie de supuestos básicosnecesarios, tales como la estructura geométrica del espacio, el concepto detiempo, observador y sistema de referencia, magnitudes físicas y el conceptode medida. Sin embargo, no es objeto del presente libro entrar a discutirexhaustivamente estos conceptos, sino nos centraremos únicamente en aque-llos aspectos que son relevantes para plantear y motivar la formulación dela teoría especial de la relatividad.

Definamos, en primer lugar, el concepto de observador como un sistemafísico (reglas o patrón de medida espacial y relojes o patrón de medida tem-poral), que permite determinar la posición y el instante de tiempo respectoa un origen arbitrario, de un fenómeno físico (que en lo sucesivo llamaremos

Page 15: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

1.2. LEYES DE NEWTON Y PRINCIPIO DE RELATIVIDAD 5

evento). A este conjunto de reglas y relojes lo denominaremos sistema dereferencia, cuya representación matemática se puede realizar por el espacioR × R3, con R los números reales que representa el tiempo y R3 el espacioeuclidiano tridimensional que representa el espacio físico. Dotar al espacioy al tiempo con esta estructura matemática supone (como lo asumió ex-plícitamente Newton) que el espacio es absoluto, homogéneo e isotrópico yobedece la geometría euclideana y el tiempo es absoluto y homogéneo y porlo tanto son conceptos independientes del observador.

En segundo lugar, Newton asumió que sus leyes se cumplen en el espacioabsoluto, es decir que sus leyes son válidas para un observador, cuyo sistemade coordenadas esté fijo respecto al espacio absoluto. A este observador par-ticular se le llama ”sistema de referencia inercial” y lo denotaremos por Σ.Elegir un sistema de referencia inercial es, en principio, escoger una coor-denada temporal t y un sistema de coordenadas cartesianas (x, y, z) paradeterminar el instante y la posición de un evento. Que el origen de la coor-denada temporal es arbitrario, refleja el hecho que el tiempo es homogéneo,mientras que el origen y la orientación arbitrarias de las coordenadas es-paciales ponen de manifiesto la homogeneidad e isotropía del espacio. Si laprimera ley de Newton es válida en Σ, entonces una partícula P , sobre lacual no actúan fuerzas, debe viajar en una línea recta respecto al sistemaΣ. Así por ejemplo, si elegimos el origen del tiempo y los ejes espaciales detal manera, que la partícula pase por el origen espacial en el instante t = 0y se mueva en la dirección del eje x positivo, entonces su posición, en uninstante de tiempo cualquiera t,está dada por

x = uxt ; y = 0 ; z = 0 (1.3)

conu = (ux, uy, uz) = (ux, 0, 0) (1.4)

la velocidad de la partícula.Consideremos otro sistema de referencia Σ0, con respecto al cual la

partícula P permanece en reposo en su origen de coordenadas espaciales,y elijamos los ejes espaciales de Σ0 paralelos a los del sistema de referen-cia inercial Σ y el origen del tiempo de tal manera los relojes comiencena contar el tiempo, t = t0 = 0, cuando los orígenes de los dos sistemas secruzan. Entonces, podemos determinar las coordenadas espaciales y el tiem-po de cualquier evento físico, bien sea con respecto al sistema inercial Σ ocon respecto al sistema de referencia Σ0. Si llamamos (t, x, y, z) las coorde-nadas de un evento físico cualquiera, medidas respecto a Σ y (t0, x0, y0, z0) lascorrespondientes coordenadas, medidas respecto a Σ0, podemos encontrar la

Page 16: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

6 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO

Figura 1.1: Transformaciones de Galileo

relación entre las coordenadas del evento, medidas por los dos sistemas dereferencia Σ0 y Σ. Estas relaciones son llamadas ecuaciones de transforma-ción de Galileo.

Es fácil encontrar las ecuaciones de transformación de Galileo (Figura1.1), pues teniendo encuenta que las ecuaciones (1.3) nos dan la posición,respecto al sistema inercial Σ, del origen de coordenadas del sistema Σ0,entonces, las coordenadas (t0, x0, y0, z0) de cualquier evento medidas por Σ0,están relacionadas con las coordenadas (t, x, y, z) del mismo evento medidaspor Σ, por las ecuaciones:

t0 = t x0 = x− vt y0 = y z0 = z (1.5)

en donde se ha hecho el cambio ux = v, para rescatar la notación usualutilizada en la literatura.

Así, en lo sucesivo v denotará la velocidad del sistema de referencia Σ0

respecto a Σ. La elección de los dos sistemas coordenados de Σ y Σ0 conlos ejes coordenados paralelos y la misma orientación, así como la velocidadrelativa de los dos sistemas a lo largo de los ejes x, x0 no representa pérdi-da alguna de generalidad y su justificación se encuentra en la hipótesis deisotropía del espacio, la cual implica que la física no depende de la orientaciónde los ejes coordenados, o equivalentemente, que el espacio es isotrópico.

Page 17: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

1.2. LEYES DE NEWTON Y PRINCIPIO DE RELATIVIDAD 7

Además, en las ecuaciones de tranformación de Galileo está implícita, tam-bién, la hipótesis de homogeneidad del espacio y el tiempo, pues la eleccióndel origen del tiempo para los dos sistemas, en el instante en que los orí-genes espaciales coinciden, es arbitraria, indicando que cualquier instantede tiempo y todos los puntos del espacio son equivalentes para describir losfenómenos físicos. La primera ecuación de transformación, t0 = t, representael carácter absoluto del tiempo, y significa que (salvo la elección arbitrariadel origen) el instante en el cual ocurre un evento físico es independiente delobservador y además, esta ecuación lleva también la hipótesis implícita, queexiste algún mecanismo físico apropiado que permite transmitir informacióninstantáneamente. Otra forma de expresar este carácter absoluto del tiempo,es a través del concepto de simultaneidad: Si dos eventos, que ocurren enpuntos diferentes del espacio para un observador, son simultáneos, entoncesestos dos eventos son también simultáneos para cualquier otro observador,sin importar su estado de movimiento relativo respecto al primer observador.Como veremos más adelante, la simultaneidad es uno de los conceptos fun-damentales que debe ser cuestionado y se torna en un punto muy importantepara la formulación de la teoría de la relatividad.

Una primera consecuencia de las transformaciones de Galileo, es que lasleyes de la mecánica son válidas en todos los sistemas de referencia que semuevan con respecto al sistema de referencia inercial, el cual se encuentra enreposo con respecto al espacio absoluto. La demostración de este resultadoes directa, pues, si una partícula libre posee una velocidad

u = (ux, uy, uz) = (dx

dt,dy

dt,dz

dt) (1.6)

respecto al sistema de referencia inercial Σ, entonces, se obtiene de las ecua-ciones de transformación de Galileo (1.5), que las componentes de la ve-locidad de la partícula, medidas en el sistema de referencia Σ0 están dadaspor:

ux0 =dx0

dt0= ux − v uy0 = uy uz0 = uz (1.7)

Este resultado se conoce con el nombre de teorema de adición de veloci-dades de Galileo. Así, puesto que la velocidad relativa v entre los sistemas dereferencia Σ y Σ0es constante, entoces, la partícula libre también se muevecon velocidad constante u0 = (u0x0 , uy0 , uz0) respecto al sistema Σ

0. De man-era similar, se deduce que la segunda ley de Newton también se satisface,pues, utilizando el resultado anterior (ecuación (1.7)), tenemos que

F 0 =dp0

dt0= m

du0

dt= m

du

dt=

dp

dt= F (1.8)

Page 18: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

8 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO

con el resultado adicional, que no sólo la forma de la segunda ley de NewtonF = dp

dt es la misma, como queríamos probar, sino que tanto la fuerza queactúa sobre la partícula, como su aceleración, toman el mismo valor en losdos sistemas de referencia. Que la tercera ley de Newton también se cumplepara el sistema de referencia Σ, se obtiene de este resultado y del carácterabsoluto de la simultaneidad, pues, la igualdad de las fuerzas de acción yreacción es instantánea, independiente de la posición relativa de los puntosde aplicación de las fuerzas.

Esta invarianza de las leyes de la mecánica bajo transformaciones deGalileo, constituye el Principio de Relatividad Galileano. En la formulacióninicial de las leyes de Newton, se postuló que ellas eran válidas para unobservador en reposo con respecto al espacio absoluto, que lo llamamos ob-servador inercial o sistema de referencia inercial, y mostramos, que si estepostulado se cumplía, entonces las leyes de Newton también eran válidasen cualquier sistema de referencia que se moviera con velocidad constanterespecto al observador inercial. Esto justifica extender el nombre de sistemade referencia inercial, para todos los observadores con movimiento relativoconstante, respecto al observador inercial inicialmente en reposo relativo alespacio absoluto. Así, podemos dar otras formas equivalentes de enunciar elprincipio de relatividad galileano: Las leyes de la mecánica son las mismasen todos los sistemas de referencia inerciales, o también, no es posible, através de experimentos mecánicos, determinar la velocidad del sistema dereferencia inercial con respecto al espacio absoluto.

Esta última forma equivalente de enunciar el principio de relatividadGalileano, le quita todo el sentido físico al espacio absoluto, pues eliminasu estatus privilegiado de ser el único sistema de referencia con respectoal cual se cumplen las leyes de la mecánica y por lo tanto, el espacio ab-soluto queda como un concepto empíricamente vacío, por lo menos en loque a fenómenos mecánicos se refiere. Esta situación, reconocida desde unprincipio por Newton, lo condujo a buscar experimentos alternativos que lepermitieran determinar el movimiento con respecto al espacio absoluto. Elejemplo más conocido en la literatura lo constituye su experimento del balderotante, en el cual, la curvatura que toma la superficie del agua del balde,cuando éste se encuentra en rotación, se la atribuye a su movimiento derotación respecto al espacio absoluto, pues este fenómeno, sostenía Newton,tenía lugar aún en el caso que el balde se encontrara solo en el universo.Críticas a este análisis son igualmente abundantes en la literatura, siendola de Mach la más conocida, pues parte del análisis que llevó a Einstein aformular los principios de la Teoría General de la Relatividad está basadosobre los trabajos de Mach.

Page 19: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO 9

No es objeto de la presente sección profundizar más sobre este tema,pues volveremos sobre el problema del espacio absoluto, cuando discutamoslas teorias del eter y los fenómenos electromagnéticos. Sin embargo, es im-portante dejar claro un aspecto referente a este tema: Dada la imposibilidadde determinar el movimiento absoluto (a velocidad constante) a través defenómenos mecánicos, Newton recurrió, entonces, a sistemas de referenciaacelerados, para los cuales las leyes de la mecánica ya no permanecen invari-antes y claramente, los efectos de la aceleración si son detectables (las, nobien llamadas fuerzas ficticias, tales como la fuerza centrífuga o la fuerza decoriolis, que surgen en sistemas de referencia acelerados), pero aún, en estecaso de sistemas de referencia no inerciales, cualquier referencia al espacioabsoluto sigue siendo superflua.

1.3. Luz y éter: El retorno al espacio absoluto

Hasta comienzos del siglo XIX todos los fenómenos físicos, incluidos losde la óptica, admitían una explicación mecánica. Esto nos permite compren-der, en gran parte, por qué esta imágen mecánica del mundo se extendióhasta finales del siglo XIX, tratando de explicar fenómenos tales como lapropagación de las ondas de luz, y todos aquellos fenómenos relacionadoscon la teoría electromagnética de Maxwell. Un ejemplo, que ilustra muy bi-en esta concepción, lo podemos encontrar en la siguiente cita debida a LordKelvin: ”No estaré contento hasta que pueda construir un modelo mecáni-co del objeto que estoy estudiando. Si lo puedo lograr significa que lo heentendido, de lo contrario no.”.

En este parágrafo describiremos brevemente dos desarrollos de la físicadel siglo XIX, el carácter ondulatorio de la luz descubierto por Young yFresnel y la electrodinámica de Maxwell, que constituyen, en mi opinión, elpunto de partida más directo para formular los principios y conceptos de lateoría especial de la relatividad.

El sonido es la propagación de ondas longitudinales en un medio material,en donde la velocidad de propagación está dada por la ecuación debida aNewton:

v =

sYρ

(1.9)

en donde Y es el módulo de elasticidad del medio y ρ la densidad del medio.Además, la velocidad del sonido es independiente de la fuente, pero de-

pende de la velocidad del medio en el cual se transmite. De manera similar,

Page 20: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

10 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO

se trabajaron modelos para explicar los fenómenos de la luz, como los desar-rollados por Hook y Huygens, en donde la luz se consideraba como algunaforma de onda longitudinal, que se propagaba a través del espacio. Newtontrabajó este modelo por algún tiempo, pero dada la imposibilidad de ex-plicar la polarización de la luz, desarrolló el modelo corpuscular, capaz deexplicar este efecto y de dar cuenta de otras propiedades conocidas de la luz,desplazando al modelo ondulatorio de Huygens.

La teoría corpuscular de la luz permaneció vigente hasta comienzos delsiglo XIX, cuando Young y Fresnel explicaron los nuevos fenómenos de in-terferencia y difracción, con base en la teoría ondulatoria, relegando a lateoría corpuscular Newtoniana, a un capítulo más de la historia de la físi-ca. Sin embargo, de la misma manera que el sonido necesita de un mediopara propagarse, se vió la física avocada a postular un medio material parala propagación de las ondas de luz. Este medio material, que optaron porllamar éter, debería ser de naturaleza diferente a la materia conocida has-ta entonces. Es importante anotar, que el éter en la física no era una ideacompletamente original, pues ya había sido usado antes para ”explicar” mu-chos otros fenómenos. Por ejemplo, Newton, sugiere que el éter puede estarasociado con la gravitación, con los fenómenos eléctricos y magnéticos, conla propagación del calor etc.. A este respecto, Young aclara, que el éter através del cual se propaga la luz no necesariamente es el mismo que el étereléctrico, y por esta razón Young propone llamarlo éter lumínico.

Una vez aceptado que la luz es un fenómeno ondulatorio, comenzaron adesarrollarse teorías y modelos mecánicos del éter, para explicar el mecan-ismo de propagación de las ondas de luz en este medio. Young y Fresnelfueron los primeros en encontrar que las ondas de luz deben ser transver-sales, para poder explicar el fenómeno de polarización. Este hecho exigía,entonces, un esfuerzo teórico muy grande para comprender el mecanismode transmisión de ondas transversales en un medio elástico, dado que és-to requería que el medio de transmisión, el éter, tuviera un coeficiente derigidez muy grande, pues, como lo demostró Poisson, ondas longitudinalesy transversales se podían propagar en un sólido, con

v⊥ = (η/ρ)1/2 (1.10)

la velocidad de las ondas transversales y

vk = ([k + 4η/3]/ρ)1/2 (1.11)

la velocidad de las ondas longitudinales, siendo η el módulo de rigidez, k elmódulo de elasticidad volumétrico y ρ la densidad del sólido. Una dificultad,

Page 21: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO 11

de este modelo mecánico del éter, era la ausencia de componente longitudi-nal de las ondas de luz, lo que llevó a Cauchy a sugerir, que el eter debíatener una compresibilidad negativa, de tal manera que el factor k + 4η/3,en la ecuación (1.11), se anulara. Estas teorías estaban basadas sobre laspropiedades conocidas de los medios elásticos, pero la combinación tan inusu-al de las propiedades que debería tener el éter, condujeron a MacCullagh apostular, que este medio era un nuevo tipo de sustancia elástica, diferentea las conocidas y asociándole otras propiedades desarrolló una teoría mássofisticada, con un sistema de ecuaciones, muy parecido a las ecuaciones deMaxwell, que fue intensamente trabajado en la segunda mitad del siglo XIX.

A diferencia de las propiedades mecánicas del éter, anteriormente dis-cutidas, para las cuales era difícil proponer experimentos directos que lasverificaran, el teorema de adición de velocidades de Galileo, que se cumpletambién para las ondas en un medio mecánico, permitió proponer y realizartoda una serie de experimentos para medir la velocidad de la luz, desdeun sistema de referencia móvil respecto al éter. La situación se plantea dela siguiente forma: De la teoría de propagación de las ondas en un medioelástico, sabemos que:

u0 = u− v (1.12)

en donde u es la velocidad de propagación de las ondas, medida en sistemade referencia inercial Σ, el cual está en reposo con respecto al medio depropagación (el éter para el caso de ondas de luz), u0 es la velocidad de lasondas, medida por un observador en un sistema de referencia inercial Σ0,que se mueve con velocidad v respecto a Σ.

En 1728 Bradley descubrió el fenómeno de aberración de la luz, que con-siste en el cambio aparente de posición de las estrellas en diferentes épocasdel año (Figura 1.2). Este efecto se explica fácilmente, si se supone que eléter está en reposo respecto al sol, pues, dado que la tierra se mueve conuna velocidad aproximada de 30km/s en su órbita alrededor del sol y, porlo tanto, si tomamos una estrella colocada perpendicularmente al plano detranslación de la tierra, el telescopio debe inclinarse un ángulo adicional da-do por v

c sin θ, en donde v es la velocidad orbital de la tierra, c la velocidadde la luz respecto al éter y θ mide la posición angular instántanea de laestrella respecto a la tierra. Esta interpretación fue capaz de dar el valorcorrecto de la aberración observada, a primer orden en v/c.

Es de anotar, que los experimentos de aberración de la luz estelar noeran capaces de dar el valor de la velocidad absoluta de la tierra respecto aléter, sino solamente cambios de la velocidad relativa de la tierra respecto aléter. Arago en 1810 propuso una modificación al experimento de aberración,

Page 22: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

12 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO

Figura 1.2: Aberración de la luz estelar

que sí permitiría medir la velocidad absoluta de la tierra respecto al éter,pues de acuerdo con la teoría clásica, si la luz atravesaba un medio refractivo(como el agua o un vidrio), el cual estuviera moviéndose respecto al éter,entonces la velocidad de la luz respecto a este medio variaba, dependiendo dela dirección relativa de movimiento del medio y el éter, es decir, el índice derefración del medio dependería de la dirección relativa de movimiento. Aragocolocó un prisma en el telescopio y observó diferentes estrellas, esperandoencontrar variaciones del ángulo de aberración. El resultado negativo de suexperimento, condujo a Fresnel a proponer la teoría del arrastre parcial deléter por los medios materiales en movimiento y mostró que este arrastreparcial del éter hacía inobservable el efecto del viento de éter en mediosmateriales, en órdenes de magnitud de v/c.

Basados sobre este mismo principio, se realizaron toda una serie de exper-imentos como los de Hoek, de Mascart y Jamin, Airy, Fizeau, etc, obtenién-dose también resultados negativos. Sin embargo, no se podía estar seguroque las condiciones experimentales fueran lo suficientemente adecuadas paramedir los pequeños efectos que se estaban buscando. Además se agregabala dificultad que al utilizar luz blanca, el índice de refración de la luz en unmedio dependía de la frecuencia y por tanto cada color (frecuencia) sufría unarrastre diferente. Los problemas de la teoría del éter no se centraban úni-

Page 23: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO 13

camente en la determinación de la velocidad absoluta de la tierra respectoal éter, sino también tenían que dar cuenta de los demás efectos conocidos,tales como las leyes de reflexión, refracción, polarización, cristales ópticos,etc, lo cual conducía a complicar cada vez más el modelo mecánico del éter.

Un elemento adicional que se sumaba a esta historia del éter, lo cons-tituye el desarrollo de las teorías de la electricidad y el magnetismo, queculminan hacia mediados del siglo XIX con las ecuaciones de Maxwell y conel descubrimiento, tal vez el más importante de ese siglo, que la luz son ondaselectromagnéticas. A partir de este momento el éter se asoció como el mediode propagación de los campos eléctricos y magnéticos. Pero un punto másimportante para nuestra discusión de los orígenes de la teoría especial dela relatividad, lo constituye el hecho de que las leyes del electromagnetismode Maxwell no satisfacen el principio de relatividad de Galileo. Lo que restade esta sección lo dedicaremos a explicar el significado de este hecho y susimplicaciones.

Que las leyes del electromagnetismo de Maxwell no satisfacen el prin-cipio de relatividad de Galileo significa que las ecuaciones de Maxwell nopermanecen invariantes, cuando se realiza una transformación de Galileoentre dos sistemas de referencia inerciales, o en otros términos equivalentes,si suponemos que las ecuaciones de Maxwell son válidas en un sistema de ref-erencia inercial Σ, entonces ellas cambiarán para cualquier otro observadorinercial Σ0, que se mueva con respecto a Σ. Este cambio se refleja en que alas ecuaciones de Maxwell le aparecen nuevos términos, que van a dependerde la velocidad relativa de los sistemas. Estos nuevos términos dependientesde la velocidad en las leyes de la electrodinámica deben producir efectos ob-servables y por tanto, deben permitir determinar la velocidad del sistema dereferencia Σ0 del observador, respecto al único sistema de referencia inercialpara el cual las ecuaciones de Maxwell toman su forma más simple.

Esta situación de las leyes del electromagnetismo rescataba entonces elconcepto de espacio absoluto, identificado a su vez con el sistema de reposodel éter, pero ahora y a diferencia del caso de la mecánica de Newton, dándoleun significado físico: Las leyes de la electrodinámica son válidas solamenteen el sistema de referencia en reposo con respecto al espacio absoluto.

Para ilustrar esta situación, consideremos dos cargas +q y −q, unidaspor una varilla rígida aislante (Figura 1.3). Si este sistema está en reposorespecto al espacio absoluto Σ, la única fuerza entre las cargas es la eléctrica,dada por la ley de Coulomb. Pero si estas cargas se encuentran en reposo enotro sistema de referencia inercial Σ0que se mueva respecto Σ a una veloci-dad v, entonces aparecerá un campo magnético y así, una fuerza, adicionala la fuerza eléctrica, debida al movimiento de las cargas, que producirá, por

Page 24: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

14 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO

Figura 1.3: Experimento de Truton-Noble

lo tanto, un par de fuerzas que tenderá a hacer girar el sistema. Este ex-perimento, con resultado negativo, fue llevado a cabo por Trouton y Noble,esperando encontrar una fuerza magnética que dependía de la relación v2

c2 ,siendo v la velocidad de la tierra. Es de anotar, que el diseño experimen-tal utilizado para realizar este experimento, permitía medir cantidades delorden de magnitud de v2/c2 ∼ 10−8.

1.3.1. Un experimento crucial

El experimento más notable, y de referencia obligada en todo tratado derelatividad, lo constituye el realizado por Michelson y Morley en 1887. Esinteresante notar, que Einstein no hace referencia alguna a este experimentoen sus primeros artículos, en donde desarrolla la teoría especial de la rela-tividad, y de hecho, varios historiadores de la ciencia afirman que ni siquieralo conocía. La importancia histórica de este experimento y su obligatoriareferencia, la podemos entender por dos aspectos: primero, el diseño delexperimento permitía medir, con una precisión suficiente (corrimientos delpatrón de interferencia menores a 1/100 de franja), evitando así, el problemaque se presentaba en todos los otros experimentos realizados hasta entonces,en cuanto a que, el orden de magnitud de los efectos esperados, eran siempremenores o del mismo orden que el error experimental, dejando siempre un

Page 25: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO 15

velo de duda sobre los resultados obtenidos. Segundo, el resultado negativodel experimento de Michelson y Morley generó toda una serie de trabajosteóricos, que impulsaron el desarrollo de la física y abrieron el camino parala formulación de la teoría de la relatividad. Tal vez, el más importante deestos trabajos fue el realizado por Lorentz, que culminó con su libro sobre lateoría del electrón publicado en 1905. Es interesante, más no sorprendente,anotar como, en este libro, se encuentran todas las ecuaciones que describenlos fenómenos más significativos que predice la relatividad, como por ejemp-lo, las transformaciones entre sistemas de referencia inerciales (llamadas hoytransformaciones de Lorentz), las ecuaciones de contracción de longitudes ydilatación del tiempo, la equivalencia masa-energía, la variación de la masainercial con la velocidad, etc, solamente que su interpretación, en términosde las propiedades del éter, era incorrecta, en cuanto a que, estos efectosesperados, siempre se compensaban con otros debidos al éter, de tal man-era que ninguno de ellos resultaba ser observable. Este trabajo teórico deLorentz resolvía, así, la aparente inconsistencia entre los dos grandes pilaresde la física conocidos hasta entoces, la mecánica de Newton y la electrod-inámica de Maxwell, pero dejaba el problema fundamental sin resolver: elespacio absoluto y la indetectabilidad del éter.

Anotábamos en el parágrafo anterior, que no es una sorpresa que el tra-bajo de Lorentz contenga todas las ecuaciones relativistas, pues está basa-do sobre la electrodinámica de Maxwell, que como veremos en un capítuloposterior, es una teoría relativista. Igualmente, esta anotación nos permitetambién entender, por qué no era necesario que Einstein conociera el exper-imento de Michelson y Morley para desarrollar la teoría de la relatividad.En efecto, basta con recordar el título del primer artículo publicado porEinstein sobre el tema:“Zur Elektrodinamik der bewegten Körper” (Sobrela electrodinámica de los cuerpos en movimiento).

El experimento de Michelson-Morley fue realizado en 1887, utilizandocomo principio físico el fenómeno de interferencia de la luz. El diseño ex-perimental es bosquejado en la (Figura 1.4). De la fuente S sale un haz deluz que incide sobre un espejo semitransparente A, el cual divide al haz endos rayos mutuamente perpendiculares, los cuales se reflejan en los espejosplanos B y C, retornando al espejo A, en donde, el rayo proveniente delespejo C es desviado hacia el objetivo O, mientras que el rayo reflejado enB atraviesa el espejo A y llega al objetivo O, donde se observan franjas deinterferencia, las cuales dependen de la diferencia de caminos ópticos entrelos dos rayos de luz.

Supongamos, sin pérdida de generalidad y para simplicar el análisis, que

Page 26: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

16 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO

Figura 1.4: Experimento de Michelson y Morley

los caminos AB y AC de los dos haces de luz son iguales. Sea v la velocidadde la tierra respecto al éter y paralela al brazo AC del interferómetro. Así,la velocidad del viento del éter respecto al interferómetro, fijo a la tierra,está en la dirección de CA (ver Figura 1.4), suponiendo que no hay arrastreparcial del éter. De acuerdo con las teorías del éter, la velocidad de la luzrelativa al laboratorio es c−v, cuando va de A hacia C y c+v cuando regresade C hacia A, mientras que la velocidad del otro rayo de luz es (c2 − v2)

12

en la dirección de A hacia B y de B hacia A.Entonces, si la longitud de cada uno de los brazos del interferómetro es

L, la diferencia de tiempos de llegada de los dos rayos está dada por:

∆t = tACA − tABA =2Lc

c2 − v2− 2L√

c2 − v2

=2L

c(

1

1− v2/c2− 1p

1− v2/c2) (1.13)

Utilizando la expansión en serie

(1 + x)r = 1 + rx+1

2!r(r − 1)x2 + · · · (1.14)

la cual es convergente para |x| < 1, se desarrolla cada fracción hasta términos

Page 27: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO 17

del orden de v2/c2, obteniendo:

∆t ' Lv2

c2(1.15)

Si rotamos el interferómetro 90◦, el tiempo para recorrer el camino ABAserá ahora mayor que el tiempo para el camino ACA, y la diferencia detiempos ∆t estará dada por ∆t ' −Lv2

c2 . Por lo tanto, el cambio total en la

diferencia de tiempos al rotar el interferómetro es igual a 2Lv2

c2. Si λ es la

longitud de onda de la luz utilizada, entonces la rotación del interferómetroda lugar a un corrimiento de n franjas, dado por:

n =2L

λ

v2

c2(1.16)

Michelson y Morley utilizaron en su experimento luz de longitud de ondade 5,9× 10−7m y un camino de L = 11m, logrado por múltiples reflexiones.Tomando para la velocidad de la tierra alrededor del sol 30km/s, se esperabaun corrimiento de aproximadamente 0,37 franjas, el cual, como ya se ha dichono fue observado.

Page 28: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

18 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO

Page 29: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

Capítulo 2

Fundamentos de larelatividad especial

En este capítulo formularemos los postulados fundamentales sobre loscuales está basada la teoría especial de la relatividad y obtendremos las ecua-ciones de transformación entre sistemas de referencia inerciales (transforma-ciones de Lorentz). Concluiremos el capítulo estudiando las propiedades delas transformaciones de Lorentz y sus consecuencias sobre la medida de in-tervalos temporales y espaciales.

2.1. Postulados de la relatividad especial

Como fue anotado en el capítulo anterior, la teoría desarrollada porLorentz solucionaba la aparente inconsistencia de la mecánica Newtoniana yla electrodinámica de Maxwell, manteniendo inmodificados los principios ypostulados físicos sobre los cuales se basaban estas teorias. La aproximaciónde Einstein a este problema es diferente, pues está basada sobre dos postula-dos de carácter fundamental, en el sentido de que estos postulados deben sersatisfechos por cualquier teoría física que se proponga, independientementede las leyes y principios que se postulen para describir esta teoría.

Postulado 1: Las leyes físicas son independientes del sistema de refe-rencia inercial, con respecto al cual se midan las variables que describen alsistema físico considerado.

Postulado 2: La velocidad de la luz en el vacío es la misma para todoslos observadores inerciales, independiente de la dirección de propagación yde la velocidad de la fuente emisora.

El primer postulado propuesto por Einstein es conocido también como

19

Page 30: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

20 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

el Principio de Relatividad, el cual generaliza el principio de relatividadGalileano a todas las leyes de la física. El costo de aceptar este postuladoes el de abandonar las transformaciones de Galileo, que relacionan las coor-denadas de los eventos medidas por diferentes observadores inerciales, y depaso, se hace necesario revisar las leyes de la mecánica Newtoniana. Pues,como vimos en la parte final del capítulo anterior, las ecuaciones de Maxwellno eran invariantes bajo transformaciones de Galileo, indicando que las leyesdel electromagnetismo no obedecían el principio de relatividad de Galileo.Sin embargo, los experimentos realizados para demostrar este hecho dabantodos resultados negativos, y no es aventurado pensar que fue esta situaciónla que llevó a Einstein a postular, que las leyes de la electrodinámica sí sat-isfacían el principio de relatividad, pero entonces ésto exigía abandonar lasecuaciones de transformación de Galileo, como la forma correcta de expresarlas transformaciones entre sistemas de referencia inerciales. Esto implicabatambién que deberían ser modificadas las leyes de la mecánica de Newton,las cuales sí permanecen invariantes bajo transformaciones de Galileo.

El segundo postulado de la Teoría de la Relatividad establece que lavelocidad de la luz en el vacío es constante, independiente del sistema dereferencia inercial desde el cual ésta sea medida. Cómo llegó Einstein a esteresultado, es un problema que ha sido objeto permanente de debate en lahistoria de la ciencia. Ninguno de los experimentos realizados en el siglo XIXse puede considerar como evidencia directa de la constancia de la velocidadde la luz en el vacío. Es claro a la luz de este postulado, el resultado negativodel experimento de Michelson y Morley y podría pensarse, como lo afirmaGrünbaum, que Einstein incorpora este resultado nulo como un axióma, através del principio de la constancia de la velocidad de la luz. Aun cuandoen una entrevista realizada por Shankland a Einstein en 1950, le afirma queél no estaba familiarizado con el experimento de Michelson y Morley cuandoescribió su artículo en 1905, Shankland hace notar que en este artículo Ein-stein hace referencia a ”intentos fallidos para detectar cualquier movimientode la tierra respecto al éter lumínico”, lo que indica según Shankland, queEinstein tenía referencia de los diferentes experimentos ópticos realizados,pero no de los detalles própios de cada experimento.

Una aproximación alternativa para buscar los orígenes de este segun-do postulado, la podemos encontrar en la teoría de la electrodinámica deMaxwell, pues, si aceptamos su validez y el principio de relatividad, podemosencontrar el principio de la constancia de la velocidad de la luz, así comotambién el postulado de la constancia de la carga eléctrica, el cual juega unpapel igualmente importante en física.

Las ecuaciones de Maxwell, en el sistema M.K.S. racionalizado, para un

Page 31: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

2.1. POSTULADOS DE LA RELATIVIDAD ESPECIAL 21

observador inercial Σ toman la forma

∇ ·E = ρ/ε0 (2.1)

∇ ·B = 0 (2.2)

∇×B = µ0J + µ0ε0∂E

∂t(2.3)

∇×E = −∂B∂t

(2.4)

con µ0 = 4π × 10−7Nw/(amp)2 la permeabilidad magnética del vacío yε0 = 8, 854× 10−12coulomb2/Nw ·m2 la constante dieléctrica del vacío. Laprimera ecuación corresponde a la ley de Gauss, y establece que las cargasson fuente del campo eléctrico, siendo ρ la densidad de carga. La segundaecuación afirma que no existen cargas magnéticas aisladas. El primer términode la tercera ecuación corresponde a la ley de Ampère y significa que lascorrientes eléctricas son fuente del campo magnético, con J la densidadde corriente, mientras que el último término, conocido como corriente dedesplazamiento de Maxwell, establece que variaciones temporales del campoeléctrico son también fuente del campo magnético. La última ecuación es laley de inducción de Faraday, en la cual variaciones temporales del campomagnético producen campos eléctricos. Las ecuaciones de campo de Maxwellse completan con una ecuación de movimiento, la cual establece que la fuerzasobre una partícula de carga q en presencia de un campo electromagnéticoestá dada por :

F = qE + qu×B (2.5)

conocida como la fuerza de Lorentz.Si tomamos la divergencia de la tercera ecuación de Maxwell, haciendo

uso de la ley de Gauss (primera ecuación) y del hecho que la divergenciadel rotacional siempre es cero, obtenemos la ecuación de continuidad parala carga eléctrica

∂ρ

∂t+∇ · J = 0 (2.6)

Integrando en todo el espacio y aplicando el teorema de Gauss, se llegaal principio de conservación de la carga:

d

dt

ZρdV =

dQ

dt= 0 (2.7)

Este resultado es independiente del estado de movimienento de la cargay existe muchísima evidencia experimental que lo corrobora. Por ejemplo,

Page 32: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

22 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

si la carga dependiera de la velocidad, el átomo de hidrógeno podría no sereléctricamente neutro, ya que en promedio, la velocidad del electrón en elátomo es mayor que la velocidad del protón.

Considerando otro sistema de referencia inercial Σ0 y asumiendo el prin-cipio de relatividad, las ecuaciones de Maxwell en este nuevo sistema estándadas por:

∇0 ·E0 = ρ0/ε0 (2.8)

∇0 ·B0 = 0 (2.9)

∇0 ×B0 = µ0J0 + µ0ε0

∂E0

∂t0(2.10)

∇0 ×E0 = −∂B0

∂t0(2.11)

en donde las cantidades primadas se refieren a sus valores medidos por elobservador Σ0. Siguiendo los mismos pasos anteriores, obtenemos la ecuaciónde continuidad en el sistema de referencia Σ0

∂ρ0

∂t0+∇0 · J 0 = 0 (2.12)

y el principio de la invarianza de la carga, que para el caso de una partículaelemental su valor invariante corresponde al valor medido de la carga, cuan-do ésta se encuentra en reposo respecto al sistema de referencia inercial Σ0.Una suposición fundamental que está implícita en el principio de relatividad,es que parámetros tales como la carga , la masa, etc., de una partícula fun-damental, cuando son medidos respecto a un sistema de referencia Σ para elcual la partícula está en reposo, toman el mismo valor numérico cuando semiden con respecto a otro sistema de referencia inercial Σ0 cuando la partícu-la se encuentra en reposo relativo respecto a este sistema Σ0. Si aceptamosesta suposición, entonces el principio de la constacia de la carga eléctrica, seobtiene de las ecuaciones de Maxwell y del principio de relatividad.

Consideremos, ahora, las ecuaciones de Maxwell en el vacío (ρ = 0,J = 0), en un sistema de referencia inercial Σ y tomemos el rotacional dela última ecuación de Maxwell (la ley de inducción de Faraday), entonces,teniendo en cuenta la identidad vectorial

∇×∇×E = ∇(∇ ·E)−∇2E (2.13)

y la primera ecuación de Maxwell en el vacío ∇ ·E = 0, obtenemos

∇2E − µ0ε0∂2E

∂t2= 0 (2.14)

Page 33: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

2.1. POSTULADOS DE LA RELATIVIDAD ESPECIAL 23

Esta relación corresponde a la ecuación de ondas electromagnéticas (conuna ecuación similar para el vector campo magnético), y describe la ra-diación electromagnética producida por algún sistema de cargas aceleradas,y cuya velocidad de propagación en el vacío, viene dada por:

c = 1/√µ0ε0 (2.15)

siendo esta velocidad de propagación, independiente de la velocidad de lafuente (sistema de cargas aceleradas). Si ahora asumimos de nuevo la validezdel principio de relatividad y consideramos otro sistema de referencia inercialΣ0, obtenemos, siguiendo un razonamiento similar, la ecuación de ondas enel sistema de referencia Σ0 :

∇02E0 − µ00ε00

∂2E0

∂t02= 0 (2.16)

Esta ecuación describe la propagación de las ondas electromanéticas conuna velocidad (µ00ε00)−1/2 en el vacío, la cual, como para el caso del sistema dereferencia Σ, es también independiente del movimiento de las cargas fuente.

Si definimos el amperio a través de la ley de Biot-Savart, como la corri-ente que circula por dos hilos paralelos infinitos, separados por una distanciade un metro en el vacío, para que sobre cada hilo se experimente una fuerzapor unidad de longitud de 2 × 10−7Nw, entonces el valor de la constantepermeabilidad magnética del vacío es:

µ00 = µ0 = 4π × 10−7Nw/m (2.17)

Por otra parte, si suponemos que la ley de Coulomb es válida en los dossistemas de referencia inerciales Σ y Σ0, y que la fuerza de Coulomb, entre dospartículas iguales en reposo relativo, por ejemplo dos electrones o protones,es la misma en ambos sistemas de referencia inerciales, entonces ε00 = ε0 ypor lo tanto la velocidad de la luz es independiente del sistema de referenciainercial desde el cual ésta sea medida e independiente del movimiento de lasfuentes.

Si aceptamos ahora, que el postulado de la constancia de la velocidad dela luz es válido, y las ecuaciones de Maxwell son correctas, entonces ε00 = ε0 ytambién µ00 = µ0. Esto implica que las unidades fundamentales de longitud,tiempo, masa y carga eléctrica deben ser definidas en la misma forma entodos los sistemas de referencia inerciales, así como también las constantesfundamentales de la física: la constante de Planck h = 6, 626× 10−34J · s, laconstante de gravitación universal de Newton G = 6, 670× 10−11Nw ·m2 ·kg−2 y la velocidad de la luz en el vacío c = 2, 998× 108m · s−1.

Page 34: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

24 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

Como fue originalmente propuesto por Planck, estas constantes funda-mentales c, G y ~ = h/2π, pueden ser conbinadas para dar las unidadesfundamentales de longitud, tiempo y masa:

Lp := (G~/c3)1/2 = 1, 616× 10−35m (2.18)

Tp := (G~/c5)1/2 = 5, 39× 10−44s (2.19)

Mp := (~c/G)1/2 = 2, 18× 10−8kg (2.20)

llamadas longitud, tiempo y masa de Planck respectivamente. Actualmentees práctica usual en la física trabajar con unidades de c = ~ = G = 1, lascuales son llamadas unidades fundamentales o naturales.

2.2. Transformaciones de Lorentz

De lo discutido en la sección anterior, las leyes de la electrodinámicason físicamente compatibles con el principio de la constancia de la veloci-dad de la luz, pero a diferencia de las leyes de Newton, las ecuaciones deMaxwell no permanecen invariantes bajo las transformaciones de Gelileo.Esta situación nos conduce al problema de encontrar un conjunto de trans-formaciones de coordenadas compatibles con los postulados de la relativi-dad especial. Lorentz a finales del sigloXIX, encontró las transformacionesde coordenadas que dejaban invariante a las ecuaciones de Maxwell, pero enningún momento las consideró como las ecuaciones de transformación entresistemas de referencia inerciales, pues ellas claramente, no eran compatiblescon las leyes de la mecánica Newtoniana. Estas transformaciones se conocenhoy día como las transformaciones de Lorentz.

En esta sección mostraremos, que las transformaciones de Lorentz, con-stituyen el conjunto de ecuaciones de transformación de coordenadas entresistemas de referencia inerciales, deduciéndolas a partir de los postuladosfundamentales de la relatividad especial, junto con algunas suposiciones gen-erales sobre homogeneidad e isotropía del espacio y del tiempo.

Antes de abordar el problema de obtener las ecuaciones de transforma-ción de coordenadas, es importante aclarar algunos conceptos sobre la formacomo se definen y miden las coordenadas del espacio y del tiempo, y sobrelos postulados de homogeneidad e isotropía.

Al igual que en la mecánica Newtoniana, asumiremos que el espacio físi-co es homogéneo e isotrópico, lo cual implica que todos los puntos y todaslas direcciones espaciales son equivalentes para describir los fenómenos físi-cos. Esto significa, en términos más precisos, que las leyes fundamentales

Page 35: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

2.2. TRANSFORMACIONES DE LORENTZ 25

de la física no deben depender de la posición y de la dirección espacial, locual energía se traduce en la arbitrariedad para elegir el origen y la direc-ción de los ejes espaciales. Adicionalmente se postula que el espacio físicoes tridimensional y obedece los postulados de la geometría euclideana. Lahomogeneidad e isotropía del tiempo, significan que las leyes de la físicano deben depender de un instante particular ni de la dirección del tiempoelegida, es decir, la elección del origen y la escala para medir el tiempo esarbitraria (homogeneidad) y que las leyes de la física son invariantes bajouna transformación de la forma t → −t (isotropía). Estas propiedades delespacio y el tiempo deben quedar reflejadas en el sistema de coordenadasespacio-temporales elegido, así como la forma en que se miden las distanciasespaciales y el intervalo temporal entre eventos físicos.

Un evento es un fenómeno físico independiente del observador (tal comola colisión entre dos partículas, o la emisión de un fotón por un átomo), elcual ocurre en un punto del espacio y en un instante de tiempo y puede sermedido por instrumentos físicos adecuados.

Adicional a los postulados anteriores sobre la estructura del espacio y eltiempo, suponemos que se puede definir una escala de medida de longitudes,igual para todos los observadores inerciales, la cual nos permite medir inter-valos espaciales utilizando un sistema de reglas rígidas. Este procedimientodefine una métrica para el espacio, que cumple con las propiedades de ho-mogeneidad e isotropía y que obedece la geometría euclideana. El sistemade coordenadas cartesianas espaciales R3 con la métrica usual, esto es lamétrica euclideana

x ∈ R3 ⇒ |x|2 = x21 + x22 + x23 (2.21)

nos ofrece el modelo matemático natural para describir el espacio físico.Uno de los aspectos cruciales de la teoría de la relatividad lo constituye el

problema de la medida del tiempo. En efecto, Einstein en su primer artículo,dedica una buena parte de él a definir la forma como se miden los intervalostemporales entre eventos físicos. Definida ya la estructura métrica del espacioy el proceso de medida de intervalos espaciales, podemos utilizar el postuladode la constancia de la velocidad de la luz para definir el concepto de tiempofísico, es decir, el método operacional para la medida del tiempo que estéde acuerdo con los postulados fundamentales de la física y que refleje laspropiedades de homogeneidad e isotropía del tiempo.

En primer lugar se asume, que si dos eventos físicos ocurren en el mismopunto del espacio y simultáneamente (en el mismo instante de tiempo) paraun observador inercial, entonces estos dos eventos físicos serán simultáneos

Page 36: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

26 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

Figura 2.1: Sincronización de relojes

para todos los observadores inerciales y ocurrirán también en el mismo pun-to del espacio. En otras palabras, la simultáneidad de eventos en un mismopunto del espacio es un hecho físico absoluto, i.e., independiente del obser-vador. Supongamos además, que se dispone de un conjunto de relojes idealese idénticos, es decir, algún dispositivo o fenómeno físico reproducible, quenos permita determinar una escala de tiempo y situemos uno de estos relojesen el origen de coordenadas espaciales escogido por un observador inercial.De acuerdo con la suposición sobre el caracter absoluto de la simultáneidadpara eventos que tienen lugar en el mismo punto del espacio, el observadordeterminará un tiempo, el marcado por el reloj situado en su origen, paracada evento que ocurra en el origen de coordenadas. Este tiempo marcadopor el reloj supone haber elegido un instante inicial, t = 0, el cual es ar-bitrario, de acuerdo con la hipótesis de homogeneidad del tiempo. Ahora,coloquemos en cada punto del espacio y en reposo relativo al reloj del origen,uno de estos relojes idénticos, y determinemos que el instante de tiempo enque un evento físico sucede, es el marcado por el reloj situado en el puntodel espacio donde el evento tiene lugar.

Hasta este momento se ha definido la medida del tiempo local y faltaentonces “sincronizar” todos los relojes del observador inercial, para que este

Page 37: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

2.2. TRANSFORMACIONES DE LORENTZ 27

observador asigne un único tiempo y así, una única coordenada temporal acada evento físico, independiente de la posición espacial en la cual sucedadicho evento. Para sincronizar los relojes seguiremos el método expuesto porEinstein en su primer artículo.

Para el reloj situado en el origen de coordenadas, elijamos un instantecualquiera como el tiempo t = 0. Consideremos un segundo reloj situado auna distancia d del origen y enviemos, desde el origen y en la dirección de estesegundo reloj, un rayo de luz en en el instante en que el reloj del origen marcat1 (Figura 2.1). Este segundo reloj marcará un tiempo t2 cuando el rayo deluz lo alcanza, y se define entonces que los dos relojes están sincronizados,si se cumple que

t2 = t1 +d

c(2.22)

Con estas definiciones de medida de la distancia y del intervalo tem-poral, un observador inercial construye su sistema de coordenadas espacio-temporal. Este procedimiento es consistente y válido para todos los obser-vadores inerciales, puesto que la distancia d para puntos en reposo relativoestá bien definida y es por su definición independiente del observador, así co-mo la velocidad de la luz en el vacío c es una constante universal, de acuerdocon el segundo postulado.

La coordenada temporal para un evento, se le define, entonces, como lalectura del reloj que está situado en el punto del espacio donde el eventoocurre, y de acuerdo con la hipótesis del caracter absoluto de la simultánei-dad, para eventos que suceden en el mismo punto del espacio, este proced-imiento es independiente del observador.

Habiendo definido la forma como un observador inercial construye susistema de coordenadas espacio-temporales, abordemos, ahora, el problemade encontrar las ecuaciones que relacionan las coordenadas de un evento,asignadas por dos observadores inerciales.

Sea p un evento físico, y séan (t, x, y, z) y (t0, x0, y0, z0) las coordenadasdel evento, medidas por los dos observadores inerciales Σ y Σ0. De acuerdocon la homogéneidad e isotropía del espacio y el tiempo, supongamos, sinpérdida de generalidad, que los dos observadores eligen los ejes coordenadosespaciales paralelos, con v, la velocidad del sistema Σ0 respecto a Σ, enla dirección positiva de los ejes x, x0, y además, define cada observador, elorigen de la coordenada temporal t = t0 = 0, en el instante en que losorígenes espaciales de los sistemas coinciden (Figura 2.2).

El conjunto de transformaciones de coordenadas, que estamos buscando,

Page 38: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

28 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

Figura 2.2: Transformaciones de Lorentz

lo podemos escribir en la forma general como:

t0 = f1(t, x, y, z) (2.23)

x0 = f2(t, x, y, z) (2.24)

y0 = f3(t, x, y, z) (2.25)

z0 = f4(t, x, y, z) (2.26)

con la condición que las funciones fi séan invertibles, es decir, que se puedandespejar las coordenadas (t, x, y, z) en función de las coordenadas primadas(t0, x0, y0, z0).

Otra condición general sobre las funciones fi la impone la primera ley deNewton la cual implica que una partícula libre debe moverse con velocidadconstante para todos los observadores inerciales. Esta exigencia implica quelas ecuaciones de transformación deben ser lineales en las coordenadas. Así,el sistema de ecuaciones de transformación (2.23), (2.24), (2.25) y (2.26) lopodemos escribir como:

t0 = a00t+ a01x+ a02y + a03z (2.27)

x0 = a10t+ a11x+ a12y + a13z (2.28)

Page 39: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

2.2. TRANSFORMACIONES DE LORENTZ 29

y0 = a20t+ a21x+ a22y + a23z (2.29)

z0 = a30t+ a31x+ a32y + a33z (2.30)

en donde los coeficientes ai,j son constantes independientes de las coorde-nadas. Estos coeficientes ai,j son funciones, a lo sumo, de la velocidad delsistema de referencia Σ0 respecto a Σ, pues se supone que todos los ob-servadores eligen las mismas escalas para medir distancias y tiempos. Lalinealidad implica también que los ejes espaciales de Σ0 permanecen siempreparalelos a si mismos y así a los ejes espaciales de Σ. Además, la velocidaddel sistema Σ respecto a Σ0 es igual a −v (igual en magnitud y opuesta ala velocidad de Σ0 respecto a Σ), y por lo tanto la transformación inversadebe tener la misma forma cambiando v por −v. Para el caso cuando v = 0,la transformación se reduce a la identidad. La condición de existencia de latransformación inversa, por otra parte, queda garantizada exigiendo que eldeterminante de los coeficientes aij sea diferente de cero.

De la escogencia de los ejes espaciales se obtiene que los planos y = 0y y0 = 0 coinciden permanentemente (todos los ejes espaciales de los dossistemas de referencia permanecen paralelos) y por lo tanto la ecuación detransformación para la coordenada y0 debe reducirse a:

y0 = a22y (2.31)

Si invertimos las direcciones de los ejes x y z de Σ no se debe afectar larelación anterior, y por lo tanto la transformación inversa de Σ0 a Σ, parala coordenada y, toma la forma

y = a022y0 = a22y

0 (2.32)

Esto implica, por lo tanto que se debe cumplir que a22 = ±1. Por otraparte, dado que para v → 0 se cumple que y0 → y, entonces

a22 = 1 (2.33)

Un argumento similar vale para la coordenada z, entonces

y0 = y ; z0 = z (2.34)

Puesto que la transformación de coordenadas es lineal y las coordenadasdel origen del sistema de referencia Σ0, medidas por el observador Σ, estándadas por x = vt, entonces x0 debe ser de la forma

x0 = γ(x− vt) (2.35)

Page 40: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

30 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

donde γ es un parámetro que, en general, depende de la velocidad. Porsimetría, la transformación inversa para la coordenada x tendrá la mismaforma (con v cambiada por −v), entonces

x = γ0(x0 + vt0) (2.36)

siendo γ0 otra constante dependiente de v. Si invertimos las direcciones delos ejex x y z en Σ y Σ0, entonces las relaciones (2.35) y (2.36) se siguencumpliendo, es decir si cambiando x→ −x y x0 → −x0 tenemos que

−x0 = γ(−x− vt) =⇒x0 = γ(x+ vt) (2.37)

y

−x = γ0(−x0 + vt0) =⇒x = γ0(x0 − vt0) (2.38)

de donde se obtiene que γ = γ0, pues, del principio de relatividad la físicano debe depender de la dirección elegida para los ejes espaciales. Además,el parámetro γ debe ser positivo dado que para t = 0, x0 > 0 si x > 0.Para encontrar una expresión explícita para γ y la forma como la coorde-nada temporal se transforma, apliquemos ahora el segundo postulado de laconstancia de la velocidad de la luz en el vacío. Si en el instante t = 0 = t0,cuando los orígenes coinciden, se emite un pulso de luz en la dirección del ejex positivo, entonces se debe satisfacer que al cabo de un tiempo t, medido enΣ, el pulso de luz esté en un punto del espacio cuya coordenada x, medidaen Σ, cumpla x = ct. De acuerdo con el postulado de la constancia de lavelocidad de la luz en el vacío, para el observador Σ0 se debe cumplir queel pulso de luz llega al punto del espacio de coordenada x0, en un instantet0, tal que x0 = ct0. Substituyendo estas dos relaciones, x = ct y x0 = ct0,en las ecuaciones (2.35) y (2.36), multiplicando las ecuaciones resultantes yeliminando el término tt0, obtenemos

γ = γ(v) =1p

1− v2/c2(2.39)

conocido como el factor gamma de Lorentz. A partir de esta expresión yeliminando la coordenada x0 entre las ecuaciones (2.35) y (2.36), obtenemosla ecuación de transformación para la coordenada temporal:

t0 = γ(t− vx/c2) (2.40)

Page 41: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

2.3. PROPIEDADES DE LAS TL 31

Resumiendo, el conjunto de transformaciones de coordenadas, llamadastransformaciones de Lorentz (TL), que relacionan las coordenadas espacio-temporales de un evento físico medidas por dos observadores inerciales, estándadas por:

t0 = γ(t− vx/c2)x0 = γ(x− vt)

y0 = yz0 = z

(2.41)

Así, el principio de relatividad exige que las leyes de la física deben sertales que ellas permanezcan invariantes bajo las tranformaciones de Lorentz(ecuaciones (2.41)), pues, como veremos en la siguiente sección donde sediscutirán algunas propiedades de las TL, éllas contienen implícitamenteal postulado de la constancia de la velocidad de la luz. Para encontrar lastransfomaciones de Lorentz inversas, es decir, las transformaciones de co-ordenadas para pasar del sistema Σ0 al sistema Σ, basta con invertir lasecuaciones (2.41), o en forma equivalente, cambiando v por −v en las TL(2.41) y las coordenadas primadas por las no primadas (por la simetría entrelos sistemas Σ y Σ0):

t = γ(t0 + vx0/c2)x = γ(x0 + vt0)

y = y0

z = z0(2.42)

2.3. Propiedades de las TL

Las ecuaciones de transformación de Lorentz encontradas en la secciónanterior, corresponden a un caso particular de un conjunto de transforma-ciones más general, que constituyen la expresión matemática del principiode relatividad y de las propiedades de homogeneidad e isotropía del espacioy el tiempo. En efecto, el conjunto de transformaciones de coordenadas másgeneral se puede escribir en la forma:

x0µ =3X

ν=0

Λ µν x

ν + aµ ; µ, ν = 0, 1, 2, 3 (2.43)

con Λ µν y aµ constantes independientes de las coordenadas. Para simplificar

las expresiones hemos introducido la notación

ct ≡ x0 ; x ≡ x1 ; y ≡ x2 ; z ≡ x3 (2.44)

Page 42: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

32 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

de tal manera que la coordenada temporal la medimos en unidades de longi-tud, dado el carácter de constante universal de la velocidad de la luz c. Estaredefinición de la coordenada temporal nos permite, como veremos más ade-lante, escribir las transformaciones de Lorentz en una forma más simétricay resaltar en forma explícita el papel de la coordenada temporal en la teoríade la relatividad. En lo sucesivo utilizaremos índices griegos, que recorrende 0 a 3, para describir las coordenadas de un evento y dejaremos los índiceslatinos para describir solamente las coordenadas espaciales.

Las ecuaciones de transformación (2.43) constituyen un conjunto detransformaciones lineales no homogéneas, en donde las cuatro constantesaµ corresponden a la arbitrariedad para elegir el origen de las coordenadasespaciales (µ = 1, 2, 3) y de la coordenada temporal (µ = 0), y así represen-tan la homogeneidad del espacio-tiempo. Esta propiedad de homogeneidaddel espacio y el tiempo, en términos más formales, se traduce en el princi-pio de invarianza de la física bajo translaciones espaciales (ai; i = 1, 2, 3) ytranslaciones temporales (a0).

De sta forma, la invarianza de las leyes de la física bajo translacionesespacio-temporales, nos permiten elegir las coordenadas de los dos sistemasde referencia inerciales de tal manera que coincidan sus orígenes espacialespara t = t0 = 0, haciendo que el término inhomogéneo del sistema de ecua-ciones (2.43) se anula, y en este caso las ecuaciones de transformación sereducen al sistema lineal homogéneo

x0µ =3X

ν=0

Λµνxν ; µ, ν = 0, 1, 2, 3 (2.45)

Este conjunto de transformaciones, contiene dos casos especiales: Por unaparte están las rotaciones de los ejes espaciales, las cuales reflejan la isotropíadel espacio, es decir, que la leyes físicas no deben depender de la orientaciónde los ejes espaciales. Una rotación de los ejes espaciales queda determinadapor tres parámetros, por ejemplo, los tres ángulos de Euler. Por otra parte,están las llamadas transformaciones de Lorentz puras, caracterizadas porlas tres componentes de la velocidad relativa de los sistemas de referenciainerciales.

Así, las transformaciones de Lorentz deducidas en la sección anterior,constituyen un caso particular del conjunto de transformaciones (2.43), endonde el movimiento relativo entre los sistemas de referencia es a lo largode un eje coordenado, con ejes espaciales paralelos (no hay rotación de ejes)y sin translación de los orígenes espacial y temporal (Figura 2.3). En estecaso basta con un solo parámetro, la magnitud de la velocidad relativa, para

Page 43: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

2.3. PROPIEDADES DE LAS TL 33

Figura 2.3: Transformación general de coordenadas

determinar completamente la transformación.

En el caso de general de una transformación de coordenadas que in-volucre movimiento relativo, cambio de orientación de los ejes espacialesy translación del origen de coordenadas espacial y temporal, se requierenentonces 10 parámetros para determinar completamente la transformación:Los tres parámetros ai, i = 1, 2, 3 que determinan el cambio del origen es-pacial, un parámetro a0 para el desplazamiento del origen temporal, tresparámetros (e.g. los ángulos de Euler) para determinar una rotación de losejes espaciales y tres parámetros (e.g. las tres componentes de la veloci-dad relativa) para determinar una transformación pura de Lorentz. Para losobjetivos del presente libro, salvo se especifique lo contrario, es suficienteconsiderar solamente transformaciones de Lorentz puras con los ejes xx0 enla dirección de la velocidad relativa de los sistemas de referencia y supon-dremos además, que los orígenes de los sistemas coinciden para el tiempocero en ambos sistemas.

Antes de continuar con la discusión de algunas propiedades de las trans-formaciones de Lorentz, reescribamos las ecuaciones de transformación (2.41)

Page 44: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

34 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

Figura 2.4: Composición de transformaciones de Lorentz

en la notación introducida en la ecuación (2.44):

x00 = γ(x0 − βx1)x01 = γ(x1 − βx0)

x02 = x2

x03 = x3

(2.46)

en donde se ha definido el parámetro adimensional β = v/c y así γ(v) =(1−β2)−1/2. Como se mencionó al comienzo de esta sección, las ecuaciones detransformación de Lorentz adquieren una forma simétrica en las coordenadasespaciales y la temporal. Así, los coeficientes de la transformación de LorentzΛ µν , llamados también elementos de la matriz de transformación de Lorentz,en la ecuación (2.45) están dados por:

Λ00 = Λ11 = γ

Λ01 = Λ10 = −βγ

Λ22 = Λ33 = 1

(2.47)

siendo los demás coeficientes cero.

Consideremos ahora tres sistemas de referencia inerciales Σ, Σ0 y Σ00, conejes paralelos, movimiento relativo a lo largo del eje espacial x1, y orígenes

Page 45: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

2.3. PROPIEDADES DE LAS TL 35

espaciales coincidentes para t = t0 = t00 = 0 (Figura 2.4). Sea v la velocidaddel sistema de referencia Σ0 respecto a Σ y w la velocidad del sistema Σ00

respecto a Σ0, y sean (x0, x1, x2, x3), (x00, x01, x02, x03) y (x000, x001, x002, x003) lascoordenadas de un evento físico medidas por los tres observadores Σ, Σ0 y Σ00,respectivamente. La relación entre las coordenadas del evento medidas porΣ y Σ0 están dadas por la ecuación (2.46) y la relación entre las coordenadasmedidas por Σ0 y Σ00 están dadas por las ecuaciones:

x000 = γ(w)(x00 − β0x01)x001 = γ(w)(x01 − β0x00)

x002 = x02

x003 = x03(2.48)

en donde β0 = w/c. Las ecuaciones de transformación que relacionan lascoordenadas medidas por Σ y Σ00 se obtienen entonces, componiendo lasdos transformaciones, es decir, remplazando las coordenadas del sistema Σ0

de la ecuación (2.46), en esta última ecuación (2.48). Despues de reagrupartérminos, las ecuaciones de transformación finales, como era de esperarse,toman la misma forma:

x000 = γ(u)(x0 − β00x1)x001 = γ(u)(x1 − β00x0)

x002 = x2

x003 = x3

(2.49)

en donde β00 = u/c y u es la velocidad relativa del sistema de referencia Σ00

respecto a Σ, la cual está dada por la ecuación

u =w + v

1 + wv/c2(2.50)

Esta ecuación corresponde a la versión relativista del teorema de adiciónde velocidades de Galileo. Notemos si v < c y w < c entonces u < c.

Notemos que las ecuaciones de transformación de Lorentz y el teoremade adición de velocidades se reducen a las ecuaciones de transformación deGalileo y al teorema de adición de velocidades Galileano cuando c → ∞.Este límite formal, sin embargo, carece de significado físico en la medidaque la velocidad de la luz en el vacío es una constante universal y por lotanto este límite debe entenderse mejor en el siguiente sentido.

Para velocidades pequeñas comparadas con la velocidad de la luz v ¿ c,tanto las ecuaciones de transformación de Lorentz, como el teorema de adi-ción de velociades, se reducen a las ecuaciones de transformación de Galileo

Page 46: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

36 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

y al teorema de adición de velocidades galileano, respectivamente. Para veresto, es suficiente recordar la expansión en serie de Taylor de la función

(1 + xr) = 1 + rx+r (r − 1)2!

x2 + · · · (2.51)

la cual converge para |x| < 1. Si aplicamos esta expansión al factor γ (v)tenemos

γ (v) =

µ1− v2

c2

¶−1/2= 1 +

1

2

v2

c2+ · · · (2.52)

Remplazando esta expansión en las ecuaciones de transformación deLorentz 2.41 obtenemos

x =

µ1 +

1

2

v2

c2+ · · ·

¶(x− vt)

= x− vt+Oµv2

c2

¶(2.53)

t =

µ1 +

1

2

v2

c2+ · · ·

¶³t− v

c2x´

= t+Oµv2

c2

¶(2.54)

en donde O ¡v2/c2¢ representa términos del orden de v2/c2, los cuales sonmuy pequeños si v/c << 1 y por lo tanto las ecuaciones de transforma-ción de Galileo corresponden a una aproximación a vajas velocidades de lasecuaciones de Lorentz. Un resultado similar se obtiene pata el teorema deadición de velociades.

Este límite de bajas velocidades juega el papel de un principio de corre-spondencia, en el sentido de que la “física Newtoniana es una teoría válida”para describir los fenómenos, cuando las velocidades típicas involucradas enlos procesos bajo consideración son bajas comparadas con la velocidad dela luz y por lo tanto, las ecuaciones de la relatividad deben reducirse a lascorrespondientes relaciones clásicas, en este límite de velocidades bajas. Esimportante aclarar el significado de la frase “validez de la física Newtonianaspara velocidades v << c”. Dado que toda medida experimental de una can-tidad física, lleva consigo un error experimental, entonces las predicciones

Page 47: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

2.3. PROPIEDADES DE LAS TL 37

de la mecánica clásica para los diferentes observables de un sistema dado,están en concordancia con los resultados experimentales, dentro del rangode error experimental. Así, el límite clásico, o el rango de velocidades para elcual la mecánica clásica es aplicable, depende de la precisión experimental.

El límite formal c→∞ se puede entender fícamente en el sentido que crepresenta la vélocidad máxima de propagación de señales físicas, indepen-dientemente que esta constante corresponda a la velocidad de la luz en elvacío, y por lo tanto si c → ∞ esto significaría que podemos enviar infor-mación a velocidad infinita, lo que implicaría que tendríamos a disposiciónun mecanismo instantáneo para calibrar relojes, lo que implicaría que todoslos observadores inerciales medirían la misma coordenada temporal para unevento dado. Así podemos entender la hipótesis de Newton de un tiempouniversal independiente del observador, como la hipótesis de una velocidadinfinita para transmitir información. Notemos además que en efecto la ter-cera ley de Newton requiere de esta hipótesis, pues esta ley exige que lasfuerzas de acción y reacción sean iguales en todo instante, independiente-mente de la posición de los cuerpos que están en interacción.

Retomando las ecuaciones de transformación (2.49), vemos que dos trans-formaciones de Lorentz sucesivas, conducen a una nueva transformación deLorentz, cuyo parámetro (la velocidad relativa) está dado por la ecuación(2.50). Por otra parte, la transformación de Lorentz inversa, es decir, lasecuaciones de transformación de coordenadas del sistema Σ0 al Σ, tienenla misma forma (ecuación (2.46)), pero cambiando el parámetro v por −v.Además, la transformación identidad, esto es, del sistema Σ sobre el mismo,corresponde a una transformación de Lorentz con parámetro v = 0, trivial-mente. Si escribimos formalmente una transformación de Lorentz entre Σ yΣ0, como

L(v) : Σ −→ Σ0x −→ x0 = L(v)x

(2.55)

entonces, las propiedades encontradas, las podemos fresumir formalmentede la siguiente manera:

L(w) ◦ L(v) = L(u) (2.56)

u =w + v

1 +wv/c2(2.57)

L(v = 0) = id⇒ L(0) ◦ L(v) = L(v) ◦ L(0) = L(v) (2.58)

L−1(v) = L(−v) (2.59)

L(v) ◦ L(−v) = L(−v) ◦ L(v) = id (2.60)

Page 48: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

38 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

en donde id significa la transformación identidad, L−1(v) la transformacióninversa, y el producto L(w) ◦ L(v) representa la composición de dos trans-formaciones sucesivas.

Un grupo matemático es un conjunto de elementos G, con una opera-ción interna llamada producto, es decir, el producto de dos elementos de Ges de nuevo un elemento del conjunto y esta operación debe satisfacer lassiguientes propiedades:

i.-Existe un elemento del grupo G, llamado la identidad, tal que la iden-tidad por cualquier elemento del grupo es el mismo elemento del grupo.

ii.-Para todo elemento del grupo, existe otro elemento en el grupo, talque su producto es la identidad.

Un grupo se llama abeliano, si la operación producto es conmutativa. Lasrelaciones simbólicas representadas en las ecuaciones (2.56), (2.58), (2.59)y (2.60), muestran que las transformaciones de Lorentz forman un grupomatemático, llamado el grupo de Lorentz. Para el caso particular que esta-mos considerando, esto es, de transformaciones entre sistemas de referenciacon ejes paralelos y movimiento relativo a lo largo del eje x, el grupo esclaramente abeliano, y cada elemento del grupo corresponde, o está carac-terizado por el valor de la velocidad. Puesto que la velocidad puede tomarcualquier valor entre −c < v < c, el grupo contiene un número infinito nonumerable de elementos, y así este grupo es conocido en la literatura comoun grupo de Lie de un parámetro o grupo continuo, en contraposición conlos grupos finitos o discretos, tales como por ejemplo, los números enteroscon la operación suma. El caso de las transformaciones generales, ecuación(2.43), energía forman un grupo, llamado el grupo de Poincaré, el cual esenergía un grupo de Lie pero de diez parámetros, pues como vimos, unatransformación general requiere de 10 parámetros para caracterizarla.

Otra propiedad muy importante de las TL, la cual va a jugar un papelfundamental en el problema de la causalidad en física, es que las TL dejaninvariante una cantidad, que la llamaremos intervalo o distancia espacio-temporal entre eventos. Sean ℘1 y ℘2 dos eventos físicos cualesquiera y sean(x01, x

11, x

21, x

31) y (x

02, x

12, x

22, x

32) las coordenadas de los dos eventos, medidas

por un observador inercial Σ. Definamos el intervalo espacio-tiempo entrelos dos eventos por:

∆S212 := (x02 − x01)

2 − (x12 − x11)2 − (x22 − x21)

2 − (x32 − x31)2 (2.61)

Sea Σ0 otro observador inercial que se mueve con velocidad v respectoa Σ y sean (x001 , x011 , x021 , x031 ) y (x002 , x012 , x022 , x032 ) las coordenadas de los doseventos ℘1 y ℘2 medidas por Σ0. Entonces, para este nuevo observador, el

Page 49: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

2.3. PROPIEDADES DE LAS TL 39

intervalo espacio-tiempo entre los dos eventos está dado por:

∆S0212 := (x002 − x001 )

2 − (x012 − x011 )2 − (x022 − x021 )

2 − (x032 − x031 )2 (2.62)

Utilizando las TL (ecuaciones (2.46)) expresemos el intervalo espacio-tiempo medido por Σ0 (ecuación (2.62)), en términos de las coordenadas delobservador Σ:

∆S0212 = (γ(x02 − βx12)− γ(x01 − βx11))2 − (γ(x12 − βx02)

−γ(x11 − βx21))2 − (x22 − x21)

2 − (x32 − x31)2 (2.63)

reagrupando términos obtenemos

∆S0212 = (x02 − x01)

2 − (x12 − x11)2 − (x22 − x21)

2 − (x32 − x31)2 = ∆S212 (2.64)

Este resultado significa que el intervalo espacio-tiempo entre dos eventosfísicos es una cantidad independiente del observador y así es un invariantefísico, lo que implica que el valor numérico del intervalo es siempre el mismo,sin importar cual observador lo mida. A las variables físicas que son invari-antes bajo transformaciones de Lorentz se les llama invariantes relativistaso escalares de Lorentz, y claramente juegan un papel fundamental, pues alser independientes del observador, nos caracterizan propiedades intrínsecasdel sistema o de los fenómenos físicos.

Las implicaciones físicas, para el caso particular del intervalo espacio-tiempo, serán discutidas en el próximo capítulo con mayor detalle. Es im-portante solamente resaltar en este punto dos aspectos: en primer lugar∆S212puede ser positivo, negativo o cero, y en segundo lugar, el último caso cuan-do ∆S212 es cero, corresponde a la expresión matemática del principio de laconstancia de la velocidad de la luz, pues si desde el punto del espacio y enel instante donde ocurre el primer evento, por ejemplo ℘1, se emite un rayode luz en dirección del evento ℘2, entonces este rayo de luz alcanza el puntodel espacio en el instante de tiempo, en que el segundo evento ocurre. Estose ve fácilmente, pues de la definición del intervalo espacio-tiempo, ecuación(2.61) o (2.62), y recordando que x0 = ct, entoces despejando c de cualquierade estas dos ecuaciones (∆S212 = 0 = ∆S

0212) implica que c =(distancia espa-

cial entre los eventos)/(intervalo temporal entre los eventos) es un invarianterelativista.

Es importante resaltar que el intervalo espacio-tiempo es invariante ba-jo las transformaciones generales de coordenadas (ecuación (2.43)), y nosolamente bajo las transformaciones de Lorentz puras consideradas, puespor una parte, el témino inhomogéneo de las transformaciones se cancela al

Page 50: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

40 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

tomar la diferencia de las coordenadas, mientras que las rotaciones de losejes espaciales dejan invariante la distancia espacial (ver sección 4.1)

(x12 − x11)2 + (x22 − x21)

2 + (x32 − x31)2 (2.65)

permaneciendo la coordenada temporal inanalterada.Otra característica importante que se deriva directamente de las TL, es

que las velocidades relativas entre sistemas de referencia inerciales, debenser siempre menores que la velocidad de la luz, pues el factor γ(v) divergepara v = c y se hace imaginario si v > c, lo cual es inadmisible dado elsignificado físico asignado a las coordenadas utilizadas.

2.4. Consecuencias de las TL

Para finalizar el presente capítulo, vamos a considerar dos consecuenciasde las TL que constituyen, tal vez, los dos resultados más sorprendentes dela teoría especial de la relatividad y por esta razón los más conocidos en laliteratura de divulgación científica.

Consideremos para comenzar el problema de la dilatación temporal. Enprimer lugar definamos el concepto de tiempo propio, como el intervalo detiempo ∆τ entre dos eventos ℘1 y ℘2, medido por un mismo reloj. Esto sig-nifica, equivalentemente, que existe un sistema de referencia inercial, llamé-molo Σ, para el cual los dos eventos ocurren en el mismo punto del espacio.Así, las coordenadas de estos dos eventos para el observador Σ están dadaspor (x01, x

11, x

21, x

31) y (x

02, x

12, x

22, x

33), con x

02−x01 = c∆τ y xi2 = xi1; i = 1, 2, 3.

Suponiendo, sin pérdida de generalidad, que el evento 2 ocurre después queel evento 1 para el observador Σ, i.e. x02 > x01, y como xi2 = xi1; i = 1, 2, 3,pues los dos eventos por definición, tienen lugar en el mismo punto del es-pacio, es claro que para cualquier otro observador inercial, por ejemplo Σ0,los dos eventos suceden en puntos diferentes del espacio, y por lo tanto,dada la invarianza del intervalo espacio-tiempo ∆S212 entre los dos even-tos, el intervalo de tiempo medido por Σ0 para estos dos eventos, debe sermayor que el intervalo de tiempo propio. Para probar esta afirmación, sean(x001 , x011 , x021 , x031 ) y (x002 , x012 , x022 , x032 ) las coordenadas de estos eventos y ∆t0

el intervalo de tiempo medido en Σ0, con

c∆t0 = x002 − x001 (2.66)

Utilizando las TL para remplazar en esta expresión las coordenadas pri-madas en términos de las no primadas y aplicando la definición de tiempo

Page 51: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

2.4. CONSECUENCIAS DE LAS TL 41

propio, obtenemos

c∆t0 = γ(x02 − βx12)− γ(x01 − βx11) (2.67)

y puesto que en sistema de referencia inercial Σ los dos eventos suceden enel mismo punto del espacio, i.e. x12 = x11, llegamos finalmente a la ecuaciónde dilatación temporal:

∆t0 = γ∆τ =∆τp

1− v2/c2(2.68)

pues el factor γ simpre es mayor que 1, para v 6= 0. De paso hemos demostra-do, que si dos eventos ocurren para un observador en un mismo punto delespacio, el orden temporal de los eventos (e.g. x02 − x01 > 0) es el mismopara todos los observadores, es decir si x02 − x01 > 0 entonces x002 − x001 > 0,y el tiempo propio es el intervalo de tiempo más pequeño medido por al-gún observador. Esto justifica el nombre de dilatación temporal, y significafísicamente, que los dos eventos están conectados causalmente, es decir, queel evento posterior pudo ser causado por el primer evento, aún cuando nonecesariamente exista un proceso físico que los ligue. Notemos además queel intervalo de tiempo entre dos eventos puede hacerse tan grande como sequiera, si tomamos velocidades suficientemente cercanas a la velocidad de laluz, pues 1 ≤ γ <∞ para 0 ≤ v < c, y por lo tanto dado ∆τ > 0, entonces∆t0 = γ∆τ puede hacerse tan grande como se quiera haciendo que v −→ c.

Calculemos, ahora el intervalo espacio-tiempo para estos dos eventos. Enel sistema Σ obtenemos la expresión

∆S212 = (x02−x01)2−(x12−x11)2−(x22−x21)2−(x32−x31)2 = c2∆τ2 > 0 (2.69)

el cual nos indica, que para el caso que estamos considerando, el intervaloespacio-tiempo nos mide directamente (salvo un factor constante c2) el in-tervalo de tiempo propio. Si calculamos este mismo intervalo, ahora en elsistema de referencia Σ0 (ver ecuación (2.62)), por su invarianza, obviamenteobtenemos el mismo resultado. Esto nos muestra, sin ulteriores cálculos, queel intervalo de tiempo en Σ0 debe ser mayor que en Σ, pues a c2∆t02 le esta-mos restando una cantidad positiva, que nos da la distancia espacial entrelos dos eventos medidos en el sistema Σ0.

¿Cuando tiene sentido hablar del intervalo de tiempo propio entre doseventos?. Para responder a esta pregunta, consideremos dos eventos físicoscualesquiera ℘1 y ℘2 y calculemos el intervalo ∆S212 entre ellos en algúnsistema de referencia inercial Σ. Sean (x01, x

11, x

21, x

31) y (x

02, x

12, x

22, x

32) las

Page 52: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

42 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

coordenadas de los eventos ℘1 y ℘2 respectivamente, y supongamos parasimplificar los cálculos, pero sin perder generalidad del resultado, que x22 =x21 y x

32 = x31, entonces:

∆S212 = (x02 − x01)

2 − (x12 − x11)2 (2.70)

Por lo tanto, si este intervalo es mayor que cero, esto significa que siemprees posible encontrar un sistema de referencia inercial Σ0, para el cual los doseventos ocurren en el mismo punto del espacio, así

∆S212 = (x002 − x001 )

2 = c2∆τ2 (2.71)

pues, dadas las coordenadas de los dos eventos en Σ, basta con considerarun sistema de referencia Σ0 el cual se mueva con una velocidad v respecto aΣ dada por

β =v

c=

x12 − x11x02 − x01

(2.72)

Para el caso que estamos considerando, la velocidad ν del sistema Σ0

está a lo largo del eje de las x y su dirección depende de la posición relativaentre los eventos (x12 − x11 > 0 o x12 − x11 < 0) en Σ, y del orden temporalentre ellos, es decir si x02 − x01 > 0 o x02 − x01 < 0 (ver ecuación (2.72)).Ahora bien, si el intervalo espacio-tiempo entre los eventos medido en algúnsistema de referencia fuera menor o igual a cero, dada la invarianza de ∆S212,es obvio que no existe un sistema de referencia para el cual los dos eventosocurran en el mismo punto del espacio, y por lo tanto, en este caso, no tienesentido hablar de tiempo propio entre los eventos. Además, para esta últimasituación considerada, como lo veremos en seguida, el orden temporal entrelos eventos puede invertirse o ser simultáneos para algunos observadores, loque implica físicamente que los dos eventos no pueden estar causalmenteconectados, pues para que un evento fuera causa del otro, se necesitaríatransmir información a una velocidad mayor a la de la luz.

La segunda consecuencia importante de las TL, se relaciona con la con-tracción de longitudes. Para entender el significado físico de este fenómeno,definamos primero lo que se entiende por medir la longitud de un cuer-po. Consideremos el problema de medir la longitud de una varilla rígida.Supongamos que para un observador inercial Σ la varilla se encuentra enreposo y elijamos el eje de las x a lo largo de la varilla. Por definición, lalongitud de la varilla está dada por la diferencia de las coordenadas de losextremos de la varilla:

L0 = x12 − x11 (2.73)

Page 53: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

2.4. CONSECUENCIAS DE LAS TL 43

en donde se ha supuesto, sin pérdida de generalidad, que x12 > x11. Estadefinición es físicamente consistente, puesto que la varilla está en reposopara el observador Σ. De la misma manera como definimos tiempo propio,llamemos a L0, definido en la ecuación (2.73), longitud propia de la varilla.En términos generales, definimos la longitud propia de un cuerpo cualquiera,como la longitud del cuerpo medida en el sistema de referencia, en el cualel cuerpo se encuentra en reposo. El problema surge, cuando el cuerpo alcual se le quieren medir sus dimensiones, está en movimiento. Consideremosentonces, otro sistema de referencia Σ0, el cual se mueve con velocidad vrespecto a Σ y definamos la longitud de la varilla en Σ0, como la diferenciade las coordenadas de los extremos de la varilla en un instante dado t0:

L = x012 − x011 (2.74)

Esto significa, que el observador Σ0 mide simultáneamente la posición delos extremos de la varilla, y define su longitud como la diferencia de las coor-denadas espaciales de los dos eventos físicos, cuyas coordenadas están dadaspor (x001 , x011 , 0, 0) y (x002 , x012 , 0, 0). Para encontrar la relación entre las medi-das realizadas por los dos observadores, basta con aplicar las TL, teniendoen cuenta que en el sistema Σ0 los eventos (coordenadas espacio-tiempo delos extremos de la varilla) deben ser simultáneos. Así, de la ecuación (2.73)y de las TL inversas (ecuaciones (2.42)), tenemos

L0 = γ(x012 + βt0)− γ(x011 + βt0) = γ(x012 − x011 ) (2.75)

y aplicando la definición (2.74) para la longitud de la barra medida por Σ0,llegamos al resultado

L = L0p1− v2/c2 (2.76)

el cual esptablece que la longitud física en la dirección de movimiento deun sólido, se vé contraida en un factor

p1− v2/c2 con respecto a la lon-

gitud propia del sólido, en donde v es la velocidad del cuerpo respecto alobservador inercial que mide su longitud. De las TL se ve directamente quelas dimensiones transversales al movimiento de un sólido no se alteran envirtud de su movimiento. Una consecuencia inmediata de este efecto de lacontracción, es que en física relativista los conceptos de sólido rígido y flu-ido incomprensible no son válidos, en general. La ecuación (2.76) la habíanpostulado Fitzgerald y Lorentz para explicar el resultado negativo del ex-perimento Michelson-Morley, pues si en brazo del interferómetro a lo largode la dirección de movimiento de la tierra se contrayese de acuerdo a estaecuación, entonces se puede mostrar fácilmente que no aparecerían franjas

Page 54: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

44 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

de interferencia, pues los caminos ópticos de los dos rayos de luz seríaniguales. El problema con el razonamiento de Fitzgerald y Lorentz es que losbrazos del interferómetro están en reposo respecto a la tierra, y por lo tantosu longitud medida en la tierra, de acuerdo a la relatividad, es la longitudpropia y no debe aparecer contraída.

Estas dos primeras consecuencias de la teoría de la relatividad, dilat-ación temporal y contracción de longitudes, a pesar de su caracter bastanteextraño a nuestra intuición clásica, han sido corroboradas en varios exper-imentos. El primer experimento reportado, fue realizado por Rossi y Hall(Rossi, B. & Hall, D. B., Phys. Rev., 59,223, 1941) utilizando unas partícu-las elementales, los muones µ−, descubiertas en los rayos cósmicos. La granmayoría de las partículas elementales conocidas son inestables, es decir, queestas partículas después de haber sido producidas por algún proceso, decaenexpontáneamente en otras partículas al cabo de un cierto tiempo, llamadotiempo propio o tiempo de vida media de la partícula (este tiempo de vidaes característico de cada clase de partícula). Por ejemplo, si producimos unmuón µ− en reposo en el laboratorio, entonces pasados unos 2, 2 × 10−6sla partícula se desintegra en un electrón y en dos neutrinos. Los rayos cós-micos son haces de partículas, fundamentalmente protones y electrones dealta energía, los cuales al incidir sobre las capas superiores de la atmósferaterrestre, producen toda una serie de partículas elementates, entre otras, losmuones, los cuales viajan hacia la tierra con velocidades muy cercanas a lade la luz: v ≈ 0,994c. Estos muones se producen a una altura del orden delos 2000m, y se detectan sobre la superficie de la tierra. Clásicamente, seespera que estos muones se desintegren antes de llegar a la superficie ter-restre, pues a la velocidad de 0,994c en un tiempo de vida de 2, 2 × 10−6salcanzan a avanzar escasamente unos 656m. Dado que para un observadorligado a la tierra los dos eventos, se crea el muón y luego se detecta, ocurrenen puntos diferentes del espacio, mientras que para un observador ligado almuón los dos eventos ocurren en el mismo punto del espacio, y por lo tanto,el intervalo de tiempo medido por este último observador es un tiempo pro-pio, entonces, para el observador terrestre, el tiempo entre los eventos debeestar dilatado en un factor

1/p1− v2/c2 ≈ 9 (2.77)

de acuerdo con la ecuación (2.68). Así, para el observador en reposo conrespecto a la tierra el muón alcanza a sobevivir un tiempo del orden det ≈ 2 × 10−5s antes de desintegrarse y por lo tanto, puede recorrer unespacio aproximado de d = vt ≈ 6,000m, antes de desintegrarse, lo quesignifica que los mesones si pueden alcanzar la superficie terrestre antes de

Page 55: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

2.4. CONSECUENCIAS DE LAS TL 45

que ellos decaigan en otras partículas. Dado que la llegada de los muones ala superficie terrestre es un hecho físico, a esta misma conclusión debe llegarcualquier otro observador inercial. Por ejemplo, consideremos el observadorligado a la partícula. Puesto que para él la partícula se encuentra en reposo,su vida media no se ve dilatada y por lo tanto el muón se desintegra alcabo de 2, 2 × 10−6s. Pero ahora, es la tierra la que se mueve hacia él,con una velocidad de v = 0,994c y la distancia a la superficie tierrestre,desde el lugar donde se producen los muones, se ve contraida en un factorp1− v2/c2 ≈ 0,11 de acuerdo con la ecuación (2.76) y por lo tanto la

superficie de la tierra se encuentra a una distancia de 0, 11×2,000m = 220m,la cual es lo suficientemente corta para que la superficie de la tierra lleguehasta el punto en el cual se encuentra el muón, antes que este se desintegre.

Esta aparente asimetría en el análisis de un fenómeno físico, visto pordos observadores inerciales (en un caso el efecto considerado es la dilata-ción temporal, mientras que para el otro observador es la contracción delongitudes), no está en contradicción con el principio de relatividad, pueseste principio lo que establece es la invarianza de las leyes físicas para ob-servadores inerciales. En efecto, dos observadores pueden medir diferentestrayectorias, longitudes, intervalos de tiempo, energías cinéticas, etc., perolas leyes que rigen la dinámica de los sistemas si deben ser las mismas.

Es importante resaltar este aspecto, pues es frecuente caer en aparentesparadojas cuando se aplica el principio de relatividad. De hecho se han con-struido muchos ejemplos, llamados en física “gedanken Experimenten”, queilustran esta situación y que constituyen un buen ejercicio para comprendermejor los fenómenos relativistas. Un clásico ejemplo es el de un carro delongitud propia L0 y un garaje de menor longitud propia d0 con d0 < L0.Supongamos que el carro se dirige hacia el garaje con una velocidad v sufi-ciente, para que su longitud medida por un observador en reposo con respectoal garaje sea menor que d0, esto es L0

p1− v2/c2 < d0. Entonces, un obser-

vador en reposo respecto al garage planea atrapar al carro dentro del garajey calcula cerrar la puerta de éste, tan pronto la trompa del carro alcance lapared del fondo. Para el observador que viaja con el carro, es el garaje el queaparece contraido y por lo tanto, para él es imposible que lo atrapen dentrodel garaje, pues cuando la pared toque la punta del carro, el observador delgaraje no puede cerrar la puerta. Claramente este análisis es contradicto-rio, pues desde el punto de vista físico si el carro puede ser atrapado porun observador, este debe ser atrapado por todos, o lo contrario, es decir noes atrapado por ninguno. La solución a esta aparente paradoja reposa enel hecho que la simultaneidad no es un concepto absoluto como hemos vis-to. Cuando el observador ligado al garage cierra la puerta simultáneamente

Page 56: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

46 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

cuando la trompa del carro alcanza a la pared, para el observador en el carro,primero llega la trompa a la pared, y luego, se cierra la puerta.

Page 57: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

Capítulo 3

La estructura causal delespacio-tiempo

3.1. Introducción

En este capítulo definiremos la estructura causal del espacio-tiempo. Enla primera parte se hará una breve discusión sobre transformaciones linea-les que dejan invariante la distancia euclideana (rotaciones) con el fin demotivar la estructura Minkowskiana del espacio-tiempo y el concepto decuadri-vector. En la parte final se deducirán las transformaciones de Lorentza partir de la invarianza del intervalo espacio-tiempo entre dos eventos y sediscutará la estructura causal del espacio-tiempo.

3.2. Rotaciones en el plano euclideano

Consideremos el plano euclideano

R2 :=©x = (x1, x2) | xi ∈ R; i = 1, 2ª

y el conjunto de transformaciones lineales del plano euclideano sobre si mis-mo:

T : R2 → R2; x→ x0 = Tx (3.1)

tal que dejen invariante la norma euclideana, definida por

x2 :=2X

i,j=1

δijxixj = (x1)2 + (x2)2 (3.2)

47

Page 58: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

48CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

es decir,x0 = Tx =⇒ x02 = x2 (3.3)

En la ecuación (3.2) se ha definido el símbolo de Kronecker δij (o tensormétrico euclideano) por:

δij :=

½0 si i 6= j1 si i = j

(3.4)

Dado que T es una transformación lineal de R2 en R2 la podemos escribircomo

x0j =2X

i=1

ajixi = ajix

i (3.5)

en donde los coeficientes aji son constantes. En la última igualdad hemosintroducido la convención de suma de Einstein, en donde se asume unasuma en todo factor en el cual aparezcan dos índices repetidos, uno comosubíndice y el otro como supraíndice y la suma se realiza sobre el rangode valores que tome el índice. Busquemos entonces la forma más generalde estos coeficientes que representen una transformación lineal y que dejeninvariante la distancia euclideana. Para este fin remplacemos en la ecuación(3.3) la transformación lineal (3.5):

δijajka

ilx

kxl = δijxixj = x2 = x2 = δijx

ixj (3.6)

Identificando los coeficientes de las correspondientes coordenadas, obten-emos el siguiente conjunto de ecuaciones acopladas para los coeficientes:

a211 + a221 = 1 (3.7)

a212 + a222 = 1 (3.8)

a11a12 + a21a22 = 0 (3.9)

Además, dado que T es una transformación lineal de R2 en R2, y por lotanto Tx = 0 solo si x = 0, entonces el determinante de la transformacióndebe ser diferente de cero

a11a22 − a12a21 6= 0 (3.10)

Como el sistema de ecuaciones tiene cuatro incognitas podemos encon-trar tres de éllas en términos de la restante, o equivalentemente podemosdespejar las cuatro incognitas en función de un parámetro. Si llamamos a

Page 59: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

3.2. ROTACIONES EN EL PLANO EUCLIDEANO 49

este parámetro θ y lo definimos como a11 := cos(θ),directamente se puedendespejar los demás coeficientes para obtener:

a11 = a22 = cos(θ); a12 = −a21 = sin(θ) (3.11)

Con esto podemos escribir explícitamente las ecuaciones de transforma-ción en la forma:

x01 = x1 cos(θ) + x2 sin(θ) (3.12)

x02 = x2 cos(θ)− x1 sin(θ) (3.13)

Es de anotar que en el proceso de despejar los coeficientes tenemos queescoger un signo, pues de la ecuación (3.7), al despejar a21en términos de a11surge una raíz. La escogencia hecha de la raíz positiva nos conduce a que eldeterminante de los coeficientes tome el valor +1, que para el caso de habertomado la raíz negativa nos hubiera dado el valor del determinante igual a−1. Que el determinante de los coeficientes de la transformación lineal T es±1 se puede obtener directamente de las propiedades de las transformacionesque dejan invariante la norma euclideana de un vector, pues si representamoslos puntos (vectores) de x ∈ R2 por matrices columna

x =

µx1

x2

¶(3.14)

entonces, la norma al cuadrado (ecuación (3.2)) se puede escribir como:

x2 =¡x1 x2

¢µ x1

x2

¶=

µx1

x2

¶τ µx1

x2

¶= xτx (3.15)

donde τ significa la transpuesta de la matriz. De esta forma, la invarianzabajo la transformación lineal T de la norma se puede escribir de la siguienteforma:

xτx = x0τx0 = (Tx)τ (Tx) = xτT τTx (3.16)

lo que implica que la matriz de transformación debe satisfacer la condición

T τT = 1 (3.17)

que fácilmente se ve que conduce al mismo sistema de ecuaciones para loscoeficientes de la matriz T . Toda transformación (o matriz) que satisfaga laecuación anterior (3.17) se llama ortogonal, y fácilmente se ve que bajo unatal transformación, también se preservan los ángulos entre los vectores delplano euclideano, pues

x0 · y0 ≡ x0τy0 = (Tx)τTy = xτT τTy = xτy = x · y (3.18)

Page 60: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

50CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

Figura 3.1: Rotación de los ejes en el plano euclideano

Tomando el determinante en la ecuación (3.17) y teniendo en cuenta quedetT = detT τ , obtenemos el resultado general que:

| detT |2= 1 =⇒ | detT |= ±1 (3.19)

Este resultado tiene una interpretación geométrica que veremos ensegui-da (ver Figura 3.1).

Si hacemos una rotación de los ejes coordenados x, y por un ángulo θ y ensentido contrario a las agujas del reloj, las componentes de un vector de R2se transforman como en la ecuación (3.5) y claramente dejan la norma delvector invariante. Este resultado muestra entonces, que la transformaciónlineal que deja invariante la norma de un vector en R2 queda determina-da por un solo parámetro y puesto que es equivalente a una rotación delos ejes, podemos escoger como parámetro el ángulo de rotación θ. De estaforma podemos escribir T (θ) para representar esta transformación lineal.Además, si realizamos dos transformaciones (rotaciones) sucesivas T (θ) yT (ϕ), la primera en un ángulo θ y la segunda en un ángulo ϕ, entonces latransformación compuesta T (θ)◦T (ϕ) es equivalente a una sola transforma-ción en un ángulo θ+ϕ. Adicionalmente, la transformación inversa de T (θ)es equivalente a la transformación por un ángulo −θ y la transformación

Page 61: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

3.3. CUADRI-VECTORES Y EL GRUPO DE LORENTZ 51

identidad corresponde a la rotación en un ángulo cero. Resumiendo

T (θ) ◦ T (ϕ) = T (θ + ϕ) (3.20)

T−1(θ) = T (−θ) (3.21)

T (0) = 1 (3.22)

Estas ecuaciones definen un grupo matemático, llamado el grupo de rota-ciones del plano. Dado que las transformaciones están determinadas por unúnico parámetro θ, que varía continuamente de 0 a 2π, el grupo se llamacontinuo o grupo de Lie de un parámetro.

3.3. Cuadri-vectores y el grupo de Lorentz

Definamos el espacio cuadridimensional de cuadri-vectores como:

M : = {x = (x0, x1, x2, x3) ∈ R4 | x · y :=producto interno Minkowskiano} (3.23)

en donde el producto interno Minkowskiano está definido como

x · y := x0y0 − x1y1 − x2y2 − x3y3 = ηµνxµyν (3.24)

En la última igualdad hemos hecho uso de la convención de suma de Einstein,en la cual los índices griegos repetidos toman los valores 0, 1, 2, 3 y como esusual en relatividad, el índice 0 corresponde a la componente temporal delcuadri-vector. Los elementos de matriz ηµν , llamados las componentes deltensor de Minkowski (nombre que se justificará cuando veamos tensores),están definidos por

ηµν :=

0 si µ 6= ν1 si µ = ν = 0−1 si µ = ν = 1, 2, 3

(3.25)

El producto interno definido por la ecuación (3.24) induce entonces unanorma

x2 := x · x = (x0)2 − (x1)2 − (x2)2 − (x3)2 = ηµνxµxν (3.26)

Definamos una Transformación de Lorentz (TL) como una transforma-ción lineal

L : M −→ Mx 7−→ x, = Lx

(3.27)

Page 62: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

52CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

tal que deje invariante el producto interno Minkowskiano x · y, esto esx, · y, = x · y (3.28)

Para encontrar la forma general de una transformación de Lorentz, util-icemos primero el hecho que cualquier transformación lineal la podemosescribir en la forma

x,α = Λαβxβ (3.29)

en donde los coeficientes Λαβ conforman la matriz de transformación deLorentz. Remplazando la ecuación (3.29) en (3.28) y comparando coefi-cientes, obtenemos las condiciones que deben cumplir los elementos de lamatriz de Lorentz:

ηδγ = ηαβΛαδΛ

βγ (3.30)

Esta ecuación la podemos escribir en forma equivalente, como el siguientesistemas de ecuaciones:

(Λ00)2 −

3Xi=1

(Λi0)2 = 1 (3.31)

(Λ0k)2 −

3Xi=1

(Λik)2 = 1; k = 1, 2, 3 (3.32)

ηρσΛρµΛ

σν = 0; µ 6= ν (3.33)

Este sistema de ecuaciones es general y contiene todas las posibles trans-formaciones entre sistemas de coordenadas que dejan invariante el productopunto Minkowskiano. Estas transformaciones las podemos dividir en trescategorías: La primera corresponde a las rotaciones de los ejes espaciales,dejando la coordenada temporal inmodificada y forman el llamado grupo derotaciones. este grupo representa el hecho que el espacio físico es isotrópico.Claramente una rotación espacial queda determinada por tres parámetros,por ejemplo los tres ángulos de Euler. La segunda categoría la constituye laoperación de inversión de los ejes espaciales y el temporal. La última cate-goría, que es la de interés para nosotros, la conforman las transformacionespuras de Lorentz, que representan el cambio entre sistemas de referencia in-erciales, manteniendo tanto los ejes espaciales paralelos (no hay rotacionesespaciales) así como el sentido de los ejes espaciales y el temporal (sin in-versión de ejes). Este grupo de transformaciones es conocido en la literaturacomo las ”boost” de Lorentz ”, las cuales quedan completamente determi-nadas por tres parámetros, que pueden ser escogidos para que correspondena las tres componentes de la velocidad relativa de los sistemas de referencia.

Page 63: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

3.3. CUADRI-VECTORES Y EL GRUPO DE LORENTZ 53

Antes de continuar desarrollando este último grupo de transformaciones,es importante aclarar que el conjunto de transformaciones que dejan in-variante el producto punto Minkowskiano es más general que el dado enla ecuación (3.29), pues es inmediato ver que bajo una translación de losejes epacio-temporales la invarianza del producto punto se mantiene. Es-tas tranformaciones representan la homogeneidad del espacio-tiempo, o enotros términos, la arbitrariedad de la elección del origen de coordenadas.Esta transformación queda determinada por cuatro parámetros (las cuatrocomponentes del cuadri-vector translación) y podemos entonces escribir latransformación de coordenadas más general como

x,α = Λαβxβ + aα (3.34)

llamada transformación de Lorentz inhomogénea. Estas transformacionesgenerales constituyen el grupo de Poincare de diez parámetros: Tres ángulosde rotación + tres componentes de la velocidad relativa + cuatro desplaza-mientos. El grupo de Poincare es el grupo de simetrias fundamental de lafísica y representa la expresión matemática del principio de relatividad y delas propiedades básicas del espacio y el tiempo, esto es, de la homogenei-dad e isotropía del espacio físico tridimensional y su estructura geométricaeuclideana y de la homogeneidad e isotropía del tiempo.

Restrinjámonos ahora solamente a las ”boost” de Lorentz y consideremosun sistema de referencia inercial Σ0 que se mueve con velocidad constante vrespecto al sistema inercial Σ a lo largo del eje x1 y con los ejes espacialesparalelos. Entonces, dado que en este caso x02 ≡ y, = y ≡ x2 y x03 ≡ z, =z ≡ x3, la matriz de transformación de Lorentz se reduce a:

Λαβ =

Λ00 Λ01 0 0Λ10 Λ11 0 00 0 1 00 0 0 1

(3.35)

y las relaciones (3.31), (3.32) y (3.33), toman la forma:

(Λ00)2 − (Λ10)2 = 1 (3.36)

(Λ01)2 − (Λ11)2 = −1 (3.37)

Λ00Λ01 − Λ10Λ11 = 0 (3.38)

que es un sistema de tres ecuaciones con cuatro incógnitas y así, los coe-ficientes Λαβ por determinar, quedan dados en términos de un parámetro:

Page 64: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

54CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

la velocidad relativa v entre los sistemas de referencia Σ y Σ0. Teniendo encuenta que las coordenadas del origen del sistema Σ0, medidas en el sistemaΣ están dadas por (x0, vcx

1, 0, 0) y que bajo una T.L. se transforman a lascoordenadas (x,0, 0, 0, 0) en Σ0, obtenemos la ecuación:

0 = Λ10x0 + Λ11x

1 = Λ10x0 + Λ11

v

cx0 =⇒

Λ10 = −v

cΛ11 (3.39)

Entonces, el sistema de ecuaciones (3.36), (3.37) y (3.38) tiene soluciónúnica y está dada por:

Λαβ =

γ −βγ 0 0−βγ γ 0 00 0 1 00 0 0 1

(3.40)

en donde

γ = γ(v) :=1q1− v2

c2

; (3.41)

β = β(v) :=v

c(3.42)

Escribiendo explícitamente el sistema de ecuaciones de transformacionesde Lorentz,

x,0 = γ(x0 − βx1) (3.43)

x,1 = γ(x1 − βx0) (3.44)

x,2 = x2 (3.45)

x,3 = x3 (3.46)

vemos la extrecha relación formal con la ecuación (3.13) (rotación de los ejesx1 y x2).

No es dificil ver que podemos interpretar formalmente una transforma-ción de Lorentz, como una rotación en el plano complejo de los ejes (ict, x) enun ángulo complejo. Para este fín definamos el parámetro φ por la siguienteecuación:

tanhφ := β =v

c(3.47)

Page 65: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

3.4. CONOS DE LUZ Y RELACIONES DE CAUSALIDAD 55

en donde tanh es la tangente hiperbólica. Con esta definición, y utilizandolas identidades para las funciones hiperbólicas, tenemos que:

coshφ = γ(v); sinhφ =v

cγ(v); (3.48)

Con esta defición (ecuación (3.47)) y las relaciones (3.48) las ecuacionesde transformación de Lorentz se pueden escribir en la forma:

x,0 = x0 coshφ− x1 sinhφ (3.49)

x,1 = x1 coshφ− x0 sinhφ (3.50)

x,2 = x2 (3.51)

x,3 = x3 (3.52)

Recordando la relación coshφ = cos(iφ), vemos la estrecha relación entrelas rotaciones de los ejes coordenados y las transformaciones de Lorentz. Otraventaja que tiene expresar las transformaciones de Lorentz en términos delparámetro φ, es la expresión para el teorema de adición de las velocidades,pues dos transformaciones de Lorentz sucesivas, con parámetros tanhφ1 =v1/c y tanhφ2 = v2/c, corresponden a una transformación de Lorentz conparámetro φ = φ1+φ2, pues, de la identidad trigonométrica para la tangentede la suma de dos ángulos, tenemos:

tanhφ = tanh(φ1 + φ2)

=tanhφ1 + tanhφ21 + tanhφ1 tanhφ2

=v1/c+ v2/c

1 + v1v2/c2

=v

c(3.53)

la cual coincide con la ecuación (2.50).

3.4. Conos de luz y relaciones de causalidad

Puesto que el cuadrado la norma de todo cuadri-vector (c-v) es un inva-riante relativista y esta norma no es definida positiva, podemos clasificar alos c-v en en tres grupos disyuntos: Dado un c-v x ∈M, definimos:

1. si x2 > 0 el c-v se llama como de tiempo

Page 66: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

56CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

2. si x2 < 0 el c-v se llama como de espacio

3. si x2 = 0 el c-v se llama como de luz

Un c-vector x como de tiempo, cuya primera componente es mayor quecero, x0 > 0, se llama dirigido al futuro, mientras que si x0 < 0 se llamadirigido al pasado.

Para entender el significado físico de esta clasificación y sus consecuen-cias, consideremos dos eventos físicos, por ejemplo el decaimiento de un nú-cleo radiactivo de uranio, situado en el origen de coordenadas (x01, x

11, x

21, x

31) =

(0, 0, 0, 0) para un observador Σ y la fisión de otro núcleo de uranio, situadoen las coordenadas (x02, x

12, x

22, x

32) ≡ (ct, x, y, z)medidas por el observador Σ.

Calculemos entonces el intervalo espacio-temporal entre estos dos eventos:

∆S2 = (x02 − x01)2 − (x12 − x11)

2 − (x22 − x21)2 − (x32 − x31)

2

= c2t2 − x2 − y2 − z2 (3.54)

Consideremos primero el caso ∆S2 > 0 (sin pérdida de generalidadtomemos t > 0), y supongamos que en el instante t = 0, en el cual ocurre elprimer evento y desde el origen de coordenadas, se envía una señal luminosaque viaja en la dirección del segundo evento. Puesto que la distancia espacialentre los eventos es

px2 + y2 + z2, el tiempo t0, que tarda en llegar el rayo

de luz al punto del espacio donde el núcleo se fisiona es menor que t, puesde la relación ∆S2 > 0 se sigue que

t2 >x2 + y2 + z2

c2= t20 (3.55)

Esto significa que es posible que el primer evento, la desintegración del nú-cleo, pueda ser causa del segundo evento, la fisión del otro núcleo. Si hubier-amos supuesto que t < 0 la conclusión es la misma, solo que en este caso lafisión del núcleo pudo ser la causa de la desintegración del otro. El resultadogeneral que se desprende de este análisis es que eventos, cuya separacióno intervalo espacio-temporal es mayor que cero, son eventos causalmenteconectados (lo que no significa necesariamente que uno de ellos sea causadel otro), y por lo tanto, la sucesión temporal de eventos causalmente conec-tados es la misma para todos los observadores. Además, puesto que∆S2 > 0,notemos que siempre es posible encontrar un sistema de referencia Σ0 parael cual los dos eventos ocurren en el mismo punto del espacio, pues bastacon elegir la velocidad de este sistema igual a

v =

rx2 + y2 + z2

t2(3.56)

Page 67: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

3.4. CONOS DE LUZ Y RELACIONES DE CAUSALIDAD 57

en la dirección apropiada (a lo largo de la línea que une a los dos eventos,tomándola como el eje de las x) y haciendo una transformación de Lorentz,obtenemos que las coordenadas de los dos eventos en este sistema de refer-encia Σ0 son (0, 0, 0, 0) y (ct0, 0, 0, 0), y por lo tanto

∆S2 = c2t2 − x2 − y2 − z2 = c2t02 (3.57)

Recordando la definición de tiempo propio, como el intervalo de tiempomedido en un sistema de referencia para el cual los dos eventos ocurren enel mismo punto del espacio, vemos que el intervalo espacio-temporal paraeventos como de luz, nos da una medida directa del tiempo propio entre loseventos, sin necesidad de encontrar el sistema de referencia para el cual losdos eventos ocurren en el mismo punto del espacio. Así podemos adoptar lasiguiente definición general de tiempo propio:

Si ∆S2 > 0 para dos eventos, definimos ∆τ , intervalo de tiempo propio,como:

∆τ :=

r∆S2

c2(3.58)

En el segundo caso, para eventos como de luz donde ∆S2 = 0, obte-nemos una conclusión similar al caso anterior, en cuanto a que los eventosestán conectados causalmente, solo que para este caso, el fotón que se envíadesde el primer evento en la dirección del segundo, llega en el mismo instanteen que ocurre el segundo evento y en este caso no tiene sentido hablar detiempo propio entre los eventos, pues no es posible encontrar un sistema dereferencia para el cual los dos eventos ocurran en el mismo punto del espacio(∆x02 +∆y02 +∆z02 = 0), sin que se viole la invariancia de ∆S2 = 0, salvoen el caso trivial que también fuera ∆t02 = 0, caso en el cual los dos eventosocurren en el mismo punto del espacio-tiempo para todos los observadores.

Para el último caso, de eventos como de espacio ∆S2 < 0, encon-tramos,realizando un análisis similar a los anteriores, que el fotón enviadodesde el primer evento hacia el segundo, siempre llega después que el eventoha tenido lugar. Así no es posible que un evento sea causa del otro y eneste caso se habla de eventos causalmente desconectados. De la expresiónpara ∆S2 se obtiene que siempre es posible encontrar un sistema de referen-cia para el cual los eventos ocurren simultáneamente, pero, lógicamente, enpuntos separados del espacio. Además, la sucesión temporal de los eventosdepende del observador, es decir, si para un observador inercia Σ dos even-tos P1 y P2 causalmente desconectados (i.e. como de espacio) son tales quet1 < t2, entonces existen observadores inerciales, e.g. Σ, tal que t1 > t2.

Page 68: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

58CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

Figura 3.2: Estructura causal del espacio-tiempo

Esta clasificación de eventos divide al espacio-tiempo en cinco regionesdisyuntas. Dado un evento p , el cual lo podemos ubicar sin pérdida degeneralidad en el origen de coordenadas de un sistema de referencia Σ, elconjunto de eventos con coordenadas (ct, x, y, z), medidas en Σ, que satis-facen la relación

∆S2 = c2t2 − x2 − y2 − z2 = 0 (3.59)

definen el llamado cono de luz del evento p ubicado en el origen de coor-denadas. La razón de llamarse cono de luz surge cuando dibujamos estospuntos en un gráfico tridimensional, (ct, x, y) como se ve en la (Figura 3.2).Los eventos con coordenadas tales que:

∆S2 = c2t2 − x2 − y2 − z2 > 0 y ct > 0 (3.60)

forman el futuro causal de p y aquellos con ct < 0 el pasado causal, estosignifica, que todos los eventos situados dentro del cono de luz de p estáncausalmente conectados con p y pueden ser causados por el evento p (futurocausal) o pueden ser causa de p (pasado causal). Todos los demás eventos,es decir aquellos para los cuales se cumple la relación

∆S2 = c2t2 − x2 − y2 − z2 < 0 (3.61)

Page 69: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

3.5. ALGEBRA DE CUADRI-VECTORES 59

Figura 3.3: Lineas de universo de partículas físicas

conforman la región como de espacio de eventos causalmente desconectadoscon el evento p.

Esta forma de representar los eventos en un gráfico espacio-temporal, nospermite visualizar fácilmente muchos procesos físicos como veremos en variosejemplos a lo largo del texto. Un primer resultado que podemos obtener,sin necesidad de recurrir a cálculos explícitos, es que la trayectoria de unapartícula material representada en un gráfico espacio-tiempo, siempre tieneque estar dentro del cono de luz de cada uno de los puntos (eventos) de latrayectoria y la trayectoria de un fotón (rayo de luz) siempre está sobre elcono de luz de cada uno de los puntos de su trayectoria (ver Figura 3.3).

3.5. Algebra de cuadri-vectores

En esta sección veremos algunas propiedades de carácter matemáticode los c-v, que se desprenden directamente de la definición de la métricaMinkowskiana, sin necesidad de recurrir a interpretaciones físicas, pero quevan a ser de mucha utilidad para entender algunos resultados de la teoríade la relatividad.

El espacio cuadridimensional de cuadri-vectoresM, admite una estruc-

Page 70: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

60CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

tura de espacio vectorial con la suma de c-v y el producto de un escalar (losreales) por un c-v definidos como:

∀x, y ∈M y ∀λ ∈ R =⇒

x+ y = (x0, x1, x2, x3) + (y0, y1, y2, y3) (3.62)

= (x0 + y0, x1 + y1, x2 + y2, x3 + y3)

λx = λ(x0, x1, x2, x3) := (λx0, λx1, λx2, λx3) (3.63)

o en forma equivalente, utilizando la notación con índices:

(x+ y)µ = xµ + yµ (3.64)

(λx)µ = λxµ (3.65)

De la definición del producto interno invariante de Lorentz y por laspropiedades del álgebra vectorial definida, se obtienen las siguientes propiedadesdel producto interno:

Proposición 4.1 El producto interno Minkowskiano satisface las sigui-entes propiedades:

x · y = y · xx · (y + z) = x · y + x · z (3.66)

x · (λy) = (λx) · y = λ(x · y) ∀x, y, z ∈M ∀λ ∈ RSu demostración es directa a partir de la definición del producto punto

Minkowskiano (3.24) y del álgebra de vectores definida por las ecuaciones(3.62) y (3.63). Veamos, como ejemplo del método de demostración, sola-mente la segunda propiedad. De las definiciones de producto interno y sumade c-v en notación de componentes, tenemos:

x · (y + z) = ηµνxµ(y + z)ν

= ηµνxµ(yν + zν)

= ηµνxµyν + ηµνx

µzν

= x · y + x · z (3.67)

como queriamos probar.Corolario 4.2 ∀x, y ∈M se cumplen las siguientes identidades:

(x± y)2 = x2 + y2 ± 2xy

Page 71: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

3.5. ALGEBRA DE CUADRI-VECTORES 61

(x+ y)2 + (x− y)2 = 2(x2 + y2) (3.68)

(x+ y) · (x− y) = x2 − y2

Estas identidades se deducen directamente de la Proposición 4.1 an-terior.

Podemos extender formalmente, la definición de vectores ortogonales deespacios vectoriales reales con producto interno definido positivo, al caso dec-vectores por medio de la relación x · y = 0, la cual por ejemplo hace quetodo vector como de luz sea ortogonal a si mismo, pues x2 = xx = 0.

Nota 4.1 Dado un c-v cualquiera x ∈ M, con x = (x0, x1, x2, x3),a la primera componente del c-v se le llama temporal y a las otras trescomponentes espaciales, justificando de esta forma la notación x = (x0, x).

Entonces, de la definición del producto interno de c-v, la norma de unc-v la podemos escribir como

x2 = (x0)2− | x |2 (3.69)

con x ∈ R3 y | x | la norma usual ( euclideana) de R3.Otras propiedades de interés de los cuadri-vectores son las siguientes:Proposición 4.2 Si x, y ∈M son c-v como de luz, entonces los vectores

x+ y y x− y son mutuamente ortogonales y tienen normas opuestas.Para demostrar la ortogonalidad, basta con utilizar la última de las ecua-

ciones (3.68), pues

(x+ y) · (x− y) = x2 − y2 = 0 (3.70)

dado que los c-vectores x y y son como de luz, i.e. x2 = 0 y y2 = 0. Deesta última propiedad y de la primera de las ecuaciones (3.68) se obtienetambién, que sus normas son opuestas:

(x+ y)2 = x2 + y2 + 2x · y = 2x · y (3.71)

(x− y)2 = x2 + y2 − 2x · y = −2x · y (3.72)

Proposición 4.3 Dos c-v x, y ∈M como de luz y mutuamente ortogo-nales x · y = 0 son proporcionales entre si, i.e. x = λy.

Para la demostración basta con tener en cuenta, por hipótesis, las sigu-ientes relaciones,

0 = xy = x0y0 − x · y (3.73)

0 = x2 = (x0)2− | x |2 (3.74)

0 = y2 = (y0)2− | y |2 (3.75)

Page 72: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

62CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

Entonces, de las propiedades del producto interno euclideano para lascomponentes espaciales de cualquier c-v sabemos que x ·y =| x || y | cosx∧y,y así obtenemos de las anteriores relaciones que

x · y = x0y0 = (| x |2)1/2(| y |2)1/2 ⇒ cosx∧y = 1 (3.76)

lo cual significa que las componentes espaciales son paralelas y así propor-cionales, es decir x = λy. Ahora, de la relación x = λy y remplazándola enla ecuación (3.73) se obtiene:

0 = xy = x0y0 − x · y = x0y0 − λ | x |2 (3.77)

Teniendo en cuenta que (x0)2 =| x |2(relación (3.74)), entonces0 = x0y0 − λ(x0)2 = x0(y0 − λx0) (3.78)

Como el c-v x es como de luz se debe cumplir que x0 6= 0 y por lo tantola ecuación anterior implica que y0 = λx0, de donde se deduce que los c-v xy y son proporcionales:

y = λx (3.79)

como se quería probar.Nota 4.2 La relación

(x+ y) · (x− y) = x2 − y2 (3.80)

nos permite construir c-v ortogonales a partir de dos c-v cualesquiera x y yde igual norma.

Proposición 4.4 Todos los c-v x ∈M, ortogonales a un c-v z como detiempo, son como de espacio y forman un subespacio tridimensional comode espacio.

Para su demostración consideremos primero que, si

xz = 0⇒ x0z0 = x · z (3.81)

entonces, como z = (z0, z) es como de tiempo, se debe cumplir que z0 6= 0y (z0)2 >| z |2y por lo tanto¯

x0z0¯

|z0| =|x · z||z0| <

|x · z|(z2)1/2

(3.82)

Elevando al cuadrado ambos lados de esta desigualdad¯x0z0

¯2|z0|2 = (x0)2 <

|x · z|2|z|2 ≤ x2z2

|z|2 = x2

Page 73: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

3.5. ALGEBRA DE CUADRI-VECTORES 63

=⇒ x2 = (x0)2 − x2 < 0 (3.83)

Utilizando un argumento similar al anterior, se puede probar que todovector ortogonal a un vector como de luz es como de espacio, salvo el casotratado anteriormente (Proposición 4.3).

Nota 4.3 Claramente existen tres c-v como de espacio ortogonales entresí, pero solo hay dos c-v como de espacio mutuamente ortogonales, que sean asu vez ortogonales a un c-v dado como de luz. Esta situación se puede ilustrartomando eτ = (1, 1, 0, 0), el cual es un c-v como de luz y e1 = (0, 0, 1, 0) ye2 = (0, 0, 0, 1) c-vectores como de espacio, ortogonales entre si y ortogonalesal c-v eτ . Ahora, es claro que cualquier otro c-v como de espacio, ortogonala e1 y e2, debe tener la segunda componente no nula y por lo tanto ya nosería ortogonal al c-v eτ . Para probar esto, por contradicción, supongamosque existe un vector e3 = (x0, x1, x2, x3) como de espacio y ortogonal a losc-v eτ , e1 y e2. Entonces, de la ortogonalidad con e1 y e2 se obtiene quex2 = x3 = 0, y de la ortogonalidad con eτ se tiene que x0 = x1, por lo tantola norma del c-v e3 está dada por:

e3 · e3 = (x0)2 − (x1)2 = 0 (3.84)

lo cual implica que e3 sería como de luz, contradiciendo la hipótesis inicial.Nota 4.4 Análogo a la descomposición de vectores v ordinarios en com-

ponentes ortogonales, una de ellas a lo largo de un vector dado w, conv = v⊥ + τw, en donde v⊥ es ortogonal a w, podemos representar cualquierc-v x ∈M como

x = y + τz (3.85)

con z un c-v fijo como de tiempo y y un único c-v como de espacio ortogonala z, el cual está completamente determinado por por el c-v x, siendo τ unparámetro real.

Page 74: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

64CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

Page 75: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

Capítulo 4

Cinemática relativista

4.1. Introducción

En este capítulo se desarrollará la cinemática relativista como una apli-cación de los cuadri-vectores. En las dos primeras partes definiremos losc-vectores velocidad y aceleración y en la última parte introduciremos el c-vector número de onda, como una consecuencia de la invarianza relativistadel producto punto y se discutirá el efecto Doppler y la aberración de la luzcomo una consecuencia de las leyes de transformación de los c-vectores.

4.2. Cuadri-vector velocidad

Definamos el c-v posición x como un elemento del espacioM el cual de-scribe el instante de tiempo y posición espacial de un evento físico cualquiera,cuyas coordenadas para un observador inercial Σ están dadas por xα =(x0, x1, x2, x3). Por ejemplo, la trayectoria de una partícula elemental, esdecir, su posición espacial en cada instante de tiempo, la podemos describirpor un c-v posición x(s) como función de algún parámetro s, y a esta funciónx(s) se le llama la línea de universo de la partícula. En física no relativistaes usual utilizar como parámetro s la coordenada temporal t. Sin embargoes claro que en el caso relativista este no es el parámetro más adecuado, aúncuando se puede usar, pues él depende del observador. Para describir la líneade universo de una partícula material es usual, dada su interpretación físicadirecta, utilizar como parámetro s al tiempo propio de la partícula, es decir,el tiempo medido por un reloj que ”viaja con la partícula”, el cual es un in-variante relativista y así es un parámetro independiente del observador. Delo discutido en el parágrafo anterior, si xα1 y x

α2 son las coordenadas de dos

65

Page 76: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

66 CAPÍTULO 4. CINEMÁTICA RELATIVISTA

eventos medidos por un observador Σ, entonces el intervalo espacio-temporalentre los dos eventos está dado por la expresión:

∆S2 = (x02 − x01)2 − (x12 − x11)

2 − (x22 − x21)2 − (x32 − x31)

2 (4.1)

Si las coordenadas xα1 y xα2 representan dos posiciones sucesivas de unapartícula material, entonces ∆S2 es mayor que cero y nos mide el tiempopropio ∆τ entre los dos eventos (ecuación (3.58)). De esta manera x(τ) nosdescribe la posición espacio-temporal de una partícula en función del tiempopropio τ , transcurrido desde un instante inicial arbitrario, es decir x(0) nosrepresenta la posición espacio-temporal de la partícula en τ = 0. Notemosque esta descripción de la cuadri-posición en función de τ solo es posiblepara partículas que se mueven a una velocidad menor que la de la luz, puespara el caso de fotones (u otras partículas con masa en reposo nula), dadoque ellas solo se pueden mover a la velocidad de la luz, el intervalo ∆s2 entredos puntos de su línea de universo siempre es cero.

La velocidad física de una partícula se define como

u =dr

dt(4.2)

en donde r son las coordenadas de posición y t el tiempo medido por algúnobservador inercial Σ. Podemos generalizar el concepto de velocidad al casode cuadri-vectores de una manera independiente del observador, definiendoel c-v velocidad (c-velocidad) por:

U :=dx

dτ(4.3)

en donde x(τ) es el c-v posición que describe la línea de universo de unapartícula material y τ el parámetro tiempo propio. Para encontrar la relaciónentre las componentes de la c-velocidad y la velocidad física medida en unsistema de referencia inercial Σ, basta tener en cuenta que (ver ecuación(3.58) con la notación x = (x0, x1, x2, x3) = (x0, r) = (ct, r)) para unapartícula material el tiempo propio está dado por la expresión:

cdτ =p(dx0)2 − (dr)2 (4.4)

y por lo tanto tenemos

dt=

r1− (dr

dt)2 ⇒

dt

dτ= γ(u) :=

1p1− u2/c2

(4.5)

Page 77: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

4.2. CUADRI-VECTOR VELOCIDAD 67

en donde u = dr/dt es la velocidad física de la partícula medida en el sistemade referencia Σ. De esta última ecuación es fácil obtener la relación entre lascomponentes de la c-velocidad Uα = (U0, U1, U2, U3) y la velocidad física uen Σ, pues aplicando la regla de la cadena para las derivadas se obtiene

Uα =d

dτxα =

d

dτ(x0, x)

=dt

d

dt(ct, r) = γ(u)(c, u) (4.6)

Entonces

U0 = γ(u)c; U1 = γ(u)ux; U2 = γ(u)uy; U3 = γ(u)uz (4.7)

Por ejemplo, para una partícula en reposo u = 0 y el c-v velocidadestá dado por Uα = (c, 0). Puesto que para determinar unívocamente lavelocidad de una partícula se requieren tres parámetros, por ejemplo, lastres componentes de la velocidad respecto a algún sistema de referencia,y la c-velocidad tiene cuatro componentes, entonces estas componentes nopueden ser todas independientes y debe existir una relación entre ellas. Estarelación se puede obtener teniendo en cuenta el hecho de que la norma alcuadrado de todo c-v es un invariante relativista, así

U2 = ηαβUαUβ = γ2(u)(c2 − u2) = c2 (4.8)

Esta relación indica que todo c-v velocidad es como de tiempo y geométri-camente representa el c-v tangente a la línea de universo de una partículamaterial, generalizando de esta forma los conceptos usuales de curva y suvector tangente (velocidad). Notemos que el valor de la norma al cuadradodel c-v velocidad se hubiera podido obtener directamente, sin realizar ningúncálculo, pues, dado que esta norma es un invariante, siempre podemos es-coger un sistema de referencia inercial particular, por ejemplo, aquel parael cual la partícula está momentáneamente en reposo, en donde Uα = (c, 0),y asi directamente se obtiene que U2 = c2. Este ejemplo ilustra uno de loshechos que hacen del cálculo con c-vectores una herramienta muy poderosay en general más simple.

Otra propiedad muy importante de los c-vectores es que todos se trans-forman, por definición, de la misma forma bajo una transformación deLorentz, lo cual nos permite obtener de una manera más simple, pero másgeneral, las leyes de transformación entre sistemas de referencia inercialesde las variables físicas. Por ejemplo, el teorema de adición de velocidades

Page 78: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

68 CAPÍTULO 4. CINEMÁTICA RELATIVISTA

se sigue directamente del hecho que siendo U un c-v, entonces sus com-ponentes medidas en dos sistemas de referencia Σ y Σ0 están relacionadaspor las ecuaciones de transformación de Lorentz (ecuaciones (3.43), (3.44),(3.45) y (3.46)):

U ,0 = γ(v)(U0 − βU1) (4.9)

U ,1 = γ(v)(U1 − βU0) (4.10)

U ,2 = U2 (4.11)

U ,3 = U3 (4.12)

En donde v es la velocidad del sistema de referencia Σ0 respecto al sis-tema Σ y β = v/c. Hemos colocado explícitamente el argumento del factorγ, para distinguirlo del γ asociado a la velocidad física u de la partícula.Teniendo en cuenta la relación entre las componentes de la c-velocidad y lavelocidad física (ecuación (4.7)), válidas en cualquier sistema de referencia,la ecuación (4.9) nos da directamente la ley de transformación del factor γde la partícula:

γ(u,) = γ(v)γ(u)(1− vuxc2) (4.13)

y teniendo en cuenta esta relación, se obtiene, de las otras tres ecuaciones(4.10), (4.11) y (4.12), el teorema de adición de velocidades o equivalente-mente la ley de transformación de las componentes de la velocidad físicaentre dos sistemas de referencia inerciales:

ux0γ(u,) = γ(v)(γ(u)ux − βcγ(u)) (4.14)

entoncesux0 =

ux − v

(1− vuxc2 )

(4.15)

y similarmente

uy0 =uyp1− v2/c2

(1− vuxc2)

(4.16)

uz0 =uzp1− v2/c2

(1− vuxc2)

(4.17)

Para finalizar esta sección, daremos dos resultados importantes, queserán de utilidad en la dinámica relativista.

Proposición 5.1 Cualquier c-vector w = (w0, w) como de tiempo (w2 >0), y dirigido al futuro (w0 > 0), puede ser expresado como un multiplo deuna c-velocidad U .

Page 79: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

4.3. CUADRI-VECTOR ACELERACIÓN 69

Para esto basta tomar

w =

√w2

cU (4.18)

Proposición 5.2 Dado un c-vector w como de tiempo, siempre es posibleencontrar un sistema de referencia para el cual las componentes del c-vectorsean (w0, 0).

Teniendo en cuenta la Proposición 5.1, basta con probar que se cumplepara una c-velocidad. Sea U = γ(u)(c, u) en un sistema de referencia Σ yconsideremos un segundo sistema de referencia Σ0 cuya c-velocidad respectoal sistema Σ sea U , entonces claramente las componentes de la c-velocidadU respecto a Σ0 son (c, 0). La velocidad física del sistema es entonces u. Enefecto, si escogemos el eje temporal de Σ0 paralelo a u, podemos eliminarsus componentes espaciales; en caso que el c-vector U esté dirigido al pasadopodemos aplicar los mismos argumentos a la velocidad −u. Esta situación deelección de los ejes nos permite, en muchas situaciones, simplificar cálculos,pues por ejemplo si W es un c-vector cualquiera no nulo, siempre podemosabsorber dos de sus componentes espaciales (digamosW 2 yW 3) rotando losejes espaciales del sistema de referencia Σ y escoger el eje t0 o x0 a lo largodel vectorW y eliminar una componente más, bien sea W 1 (como en el casoanterior) si W es un c-vector como de tiempo, o W 0 si W es un c-vectorcomo de espacio.

4.3. Cuadri-vector aceleración

De manera similar a la c-velocidad, definimos el c-v aceleración como laderivada de la c-velocidad respecto al tiempo propio

A = (A0, A1, A2, A3) :=dU

dτ(4.19)

Para encontrarar la relación de las componentes de la c-aceleración conla aceleración física, i.e., con la derivada de la velocidad respecto al tiempoa = du/dt medida en un sistema de referencia, basta con utilizar la relación(4.5) en la ecuación que relaciona las componentes de la c-velocidad con u(ecuación (4.7)) medidas en algún sistema de referencia Σ:

Aα =dUα

dτ=

dt

d

dtγ(u)(c, u)

= γ(u)(dγ(u)

dt,dγ(u)

dtu+ γ(u)a) (4.20)

Page 80: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

70 CAPÍTULO 4. CINEMÁTICA RELATIVISTA

Consideremos un sistema de referencia inercial para el cual la partículase encuentra momentáneamente en reposo, i.e., u = 0, entonces para estesistema las componentes de la c-aceleración toman la forma

Aα = (0, a) (4.21)

A esta aceleración física a se le llama aceleración propia y es un invari-ante relativista, pues la norma al cuadrado del c-v aceleración está dadapor

A2 = − | a |2 (4.22)

Esta relación indica también que la c-aceleración es un c-v como de espa-cio. Además, los c-vectores velocidad y aceleración son ortogonales pues, enel sistema de referencia propio de la partícula el c-v velocidad tiene compo-nentes (c, 0) y por lo tanto el producto interno entre los c-vectores velocidady aceleración, que es también un invariante, está dado por:

U ·A = ηαβUαAβ = 0 (4.23)

Este resultado se puede obtener directamente, sin hacer uso de un sistemaparticular de referencia, pues dado que U2 = c2, se tiene entonces que

0 =d

dτU2 = 2U · d

dτU = 2U ·A (4.24)

Podemos proceder de manera similar como se hizo para obtener las leyesde transformación de las componentes de la velocidad entre sistemas de ref-erencia inerciales y calcular las ecuaciones de transformación para la acel-eración, sin embargo, dado que estas expresiones no son de mucha utilidad,pospondremos la interpretación física de la aceleración para el siguiente capí-tulo sobre dinámica relativista y nos limitaremos en este punto a dar unejemplo sobre la cinemática de un sistema con aceleración propia constante.

4.3.1. Viaje interestelar

Este ejemplo ilustra uno de los resultados más sorprendentes de la teoríaespecial de la relatividad, conocido históricamente como la paradoja de losmellizos de Langevan. Como veremos, este resultado no es de ninguna man-era una paradoja, pero si es ilustrativo plantearlo en estos términos, puesnos permite entender de manera más precisa el principio de relatividad yevitar un error muy común que se presenta cuando se analizan situacioneso fenómenos desde el punto de vista de diferentes observadores inerciales.

Page 81: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

4.3. CUADRI-VECTOR ACELERACIÓN 71

Supongamos que un mellizo parte en un viaje espacial mientras que elotro permanece en la tierra, entonces como veremos en el siguiente ejemplonumérico que vamos a tratar, el mellizo viajero regresa a la tierra al cabode unos cuantos años medidos por relojes de la nave espacial, mientras quepara el mellizo que permaneció en la tierra habrían transcurrido miles añosmedidos por relojes del sistema de referencia de la tierra. Claramente nohay simetría en el análisis de la situación vista por los dos mellizos, pues elmellizo viajero no constituye un sistema de referencia inercial y por lo tantono es válido (como se plantea en la paradoja) suponer que visto desde latierra, es el mellizo de la nave a quien le transcurren miles de años.

Consideremos un cohete que parte del reposo en la tierra con una acel-eración propia constante igual a g (la aceleración de la gravedad sobre lasuperficie de la tierra) y viaja hacia el centro de la galaxia. Supongamos quela mitad del viaje lo realiza acelerando y la otra mitad frenando, tambiéncon aceleración propia g. Tomando como sistema de referencia inercial latierra, con su origen de coordenadas en la tierra, el origen del tiempo en elinstante en que la nave parte y como eje x la dirección del movimiento de lanave, entonces las componentes de la c-velocidad y c-aceleración de la naveestán dadas por:

U = (U0, U) = (U0, Ux, 0, 0) (4.25)

A = (A0, A) = (A0, Ax, 0, 0) (4.26)

las cuales satisfacen las siguientes relaciones (usando unidades con c = 1):

U2 = 1 = (U0)2 − U2x (4.27)

U ·A = 0 = U0A0 − UxAx (4.28)

A2 = −g2 = (A0)2 −A2x (4.29)

En unidades de c = 1, el valor de la aceleración de la gravedad es g '1al−1 (al ≡ ano luz). De la ecuación (4.28) despejamos A0

A0 = AxUx/U0 (4.30)

y reemplazamos en la ecuación (4.29), entonces

g2 = A2x[1− (Ux

U0)2] (4.31)

Utilizando la ecuación (4.27) obtenemos

Ax = gU0 (4.32)

Page 82: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

72 CAPÍTULO 4. CINEMÁTICA RELATIVISTA

y de esta ecuación y la (4.30) se llega a la relación:

A0 = gUx (4.33)

Diferenciando con respecto al tiempo propio la ecuación (4.32) y ha-ciendo uso de la ecuación (4.33), obtenemos una ecuación diferencial paraUx:

d2Ux

dτ2= g

dU0

dτ= gA0 = g2Ux (4.34)

entoncesd2Ux

dτ2− g2Ux = 0 (4.35)

cuya solución está dada en términos de funciones hiperbólicas, como se puedeprobar por sustitución directa,

Ux = C1 sinh(gτ) + C2 cosh(gτ) (4.36)

con C1 y C2 constantes de integración, las cuales se pueden determinarutilizando las condiciones iniciales: la nave parte del reposo con acelera-ción propia g, i.e., Ux(τ = 0) = 0 y dUx

dτ |τ=0= g. Entonces, de la primeracondición se obtiene que C2 = 0 y de la segunda condición

g = C1g cosh(0)⇒ C1 = 1 (4.37)

Así, obtenemos las siguientes ecuaciones diferenciales para las coorde-nadas (x0, x) de la nave, medidas desde el sistema tierra:

Ux =dx

dτ= sinh(gτ) (4.38)

U0 =dx0

dτ= cosh(gτ) (4.39)

en donde la segunda ecuación se obtiene de la ecuación (4.27). Integran-do estas ecuaciones con las condiciones iniciales x = x0 = 0 para τ = 0,obtenemos la ecuación para la trayectoria o línea de universo de la nave, entérminos del parámetro τ (tiempo propio de la nave):

x0 = g−1 sinh(gτ) (4.40)

x = g−1(cosh(gτ)− 1) (4.41)

En la Figura 4.1 se muestra un gráfico de la línea de universo de la nave, enel sistema de referencia tierra. En este diagrama la línea de universo de la

Page 83: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

4.3. CUADRI-VECTOR ACELERACIÓN 73

Figura 4.1: Línea de universo del cohete

tierra es el eje ct y también se ha dibujado allí, el cono futuro del evento P,es decir, del evento: partida de la nave en la tierra. La línea de universo delcohete siempre tiene que estar dentro del cono de luz del evento P y en todopunto la tangente a la línea de universo es menor de 45o, con respecto aleje ct, indicando que la velocidad del cohete siempre es menor que c, comolo exige la relatividad. Notemos además, que la línea de universo del coheteintercepta a la línea de universo de la tierra en dos puntos: en el instante dellanzamiento de cohete y luego en el instante en que éste regresa a la tierra.

A partir de estas ecuaciones podemos obtener toda la información quese quiera respecto al viaje. Por ejemplo, calculemos la distancia a la cual seencuentra el cohete de la tierra y su velocidad al cabo de 40 años medidosen la tierra. Como estamos trabajando con unidades de c = 1 tenemos quex0 = t = 40anos, entonces, despejando τ de la ecuación (4.40)

τ = sinh−1(gx0) = sinh−1(40) ' 4, 38anos (4.42)

y remplazando este valor del tiempo transcurrido en la nave (tiempo propio)en la ecuación (4.41), obtenemos la distancia a la cual se encuentra la navede la tierra:

x = [cosh(4,38)− 1]anos− luz = 39,01anos− luz (4.43)

Page 84: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

74 CAPÍTULO 4. CINEMÁTICA RELATIVISTA

La velocidad de la nave en cualquier instante la podemos obtener derivan-do las ecuaciones (4.40) y (4.41), y de la relación entre las componentes desu c-velocidad y su velocidad física:

Uα = (U0, U) = γ(u)(1, u) (4.44)

Uα = (cosh(gτ), sinh(gτ), 0, 0) (4.45)

por lo tanto, despejando la velocidad u = (ux, 0, 0) de esta relación, tenemosque la velocidad de la nave en ese punto de la trayectoria es:

ux = tanh(gτ) = tanh(4,38) = 0,9997 (4.46)

El centro de la galaxia se encuentra aproximadamente a unos 30000 años-luz de la tierra, puesto que la mitad del viaje se hace acelerando y la otramitad desacelerando, entonces por simetría, el tiempo propio para que lanave llegue al centro de la galaxia es el doble del tiempo necesario pararecorrer los primeros 15000 años-luz. Despejando τ de la segunda (4.41)tenemos:

τ = cosh−1(15000 + 1) = 10,309anos (4.47)

y por tanto el tiempo medido en la nave para realizar este viaje es de20,6anos, tiempo perfectamente razonable para un viaje interestelar. Ahora,si este viajero regresa a la tierra siguiendo el mismo plan de vuelo, entoncesel viaje completo le llevaría un tiempo de 41,2anos, mientras que el tiempotranscurrido en la tierra sería de

x0 = 4 sinh(10,3) = 60003,9anos (4.48)

Este ejemplo muestra la famosa paradoja de los mellizos de Langevan,pero ilustra también claramente la asimetría de la situación. En el relato dela paradoja se afirma que dada la relatividad de los sistemas de referencia,esto es, la equivalencia de todos los sistemas de referencia inerciales paradescribir los fenómenos físicos, podemos considerar el viaje visto desde lanave espacial y ver que es la tierra la que se aleja de la nave y por lo tantose espera, que cuando la tierra regrese a la nave, entonces sea el mellizo quepermanecio en la nave al que le han transcurrido 60003,9anos, mientras queal viajero de la tierra tan solo le habrían pasado 41,2anos.

La falsedad de este último razonamiento radica en el hecho que la naveespacial está acelerada y por lo tanto no es un sistema de referencia inercial,a diferencia del sistema tierra, lo que hace inválido aplicar el principio derelatividad restringida. Este efecto de retraso temporal de relojes, que seencuentran sometidos a una aceleración, se ha probado experimentalmente

Page 85: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

4.4. CUADRI-VECTOR DE ONDA 75

utilizando relojes atómicos (de alta precisión), uno de los cuales permaneceen la tierra y el otro viaja en un avión alrededor de la tierra. Si bien, elefecto del retardo temporal del reloj viajero es muy pequeño, del orden demillonésimas de segundo, este tipo de relojes ha permitido hacer estas medi-das con la suficiente precisión, mostrando este espectacular efecto relativista.Es de anotar que para el cálculo del retardo temporal en este experimentoterrestre, es necesario tener en cuenta los efectos asociados al campo grav-itacional, es decir hay que trabajar en el contexto de la teoría general dela relatividad, sin que se invalide de ninguna manera las predicciones de lateoría especial de la relatividad.

Una última conclusión que se desprende de este ejemplo, es que los viajesinterestelares son físicamente posibles, pues basta con lograr aceleracionessuficientes durante un tiempo adecuado, para que un viajero en un tiemporazonable atraviese nuestra galaxia, o incluso viaje a otras galaxias, perodefinitivamente no pretenda regresar a la tierra, pues en la tierra podríanhaber transcurrido varios millones de años.

4.4. Cuadri-vector de onda

Una de las contribuciones más importantes de las ecuaciones de Maxwelllo constituye la propagación de las ondas electromagnéticas. Debido a que laecuación de ondas en el vacío (ver por ejemplo la ecuación (2.14)) es lineal,vale el principio de superposición y así cualquier onda electromagnética sepuede escribir como una suma o superposición de ondas planas de la forma

ψ(t, r) = Ae±i(ωt−k·r) (4.49)

en donde A es la amplitud del campo ψ (por ejemplo el campo eléctrico,magnético, potencial vectorial o potencial escalar), ω la frecuencia de laonda, k el vector de onda y el signo ± indica el sentido de propagación dela onda. La cantidad

ϕ = ωt− k · r (4.50)

se llama la fase de la onda y debe ser un invariante relativista, esto es, debeser la misma para todos los observadores inerciales. Si definimos el c-vectorde onda k como

k := (ω/c, k) (4.51)

entonces la fase de la onda se puede escribir como el producto internoMinkowskiano entre el c-vector de onda y el c-vector posición x = (ct, r):

ϕ = k · x (4.52)

Page 86: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

76 CAPÍTULO 4. CINEMÁTICA RELATIVISTA

la cual es un invariante relativista. De las propiedades de transformación delos c-vectores se tiene que las componentes del c-vector de onda, medidaspor dos observadores inerciales Σ y Σ0 están relacionadas por las ecuacionesde transformación:

ω0 = γ(v)(ω − vkx) (4.53)

k0x = γ(v)(kx − v

c2ω) (4.54)

k0y = ky (4.55)

k0z = kz (4.56)

De las propiedades de los c-vectores sabemos que la norma Minkowskianade todo c-vector es un invariante relativista y por lo tanto se espera queésta tenga un significado físico. Si tomamos la norma del c-vector de ondaobtenemos

k2 =ω2

c2−¯k¯2= 0 (4.57)

pues, si tenemos en cuenta la relación de dispersión para las ondas electro-magnéticas en el vacío, c = ω/

¯k¯, vemos que el c-vector de onda es un

c-vector nulo o como de luz, y cuya norma nos da la relación de dispersiónpara ondas electromagnéticas en el vacío.

Consideremos como ejemplo una onda electromagnética plana de fre-cuencia ω, que se propaga respecto al sistema Σ a lo largo del eje y, i.e.,k = (o, ky, 0). Entonces, para un observador Σ0 que se mueve respecto a Σcon velocidad v a lo largo de los ejes paralelos xx0, tenemos

ω0 = γ(v)ω k0x = −v

c2γ(v)ω k0y = ky (4.58)

En primer lugar, la dirección de propagación de la onda para el obser-vador Σ0 está dada por la relación

k0x/k0y = −

v

c2γ(v)

ω

ky= −v

cγ(v) (4.59)

en donde la última igualdad se obtuvo utilizando la relación de dispersiónpara la onda en el sistema Σ. En el límite de bajas velocidades, es decir,para velocidades del observador Σ0 tales que v ¿ c, podemos aproximar elfactor γ(v) ∼ 1, y obtenemos el fenómeno clásico de la aberración de la luzestelar, discutida en el capítulo segundo.

El efecto Doppler es un fenómeno asociado a las ondas en general y cor-responde al cambio en la frecuencia medida por un observador con respecto

Page 87: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

4.4. CUADRI-VECTOR DE ONDA 77

a la frecuencia emitida por la fuente, debido a los movimientos relativos delobservador y/o de la fuente y en el caso particular de ondas que requieranun medio para propagarse, tales como las sonoras o elásticas, también de-pende de la velocidad del medio. En física no relativista el efecto Dopplerse puede entender fácilmente si tenemos encuenta que, por ejemplo, cuan-do la fuente se está moviendo en dirección del observador, el tiempo entredos pulsos recibidos es menor que el tiempo entre la emisión de estos dospulsos, dando lugar así a una frecuencia detectada mayor a la frecuenciaemitida, fenómeno llamado corrimiento hacia el azul. La misma situación sepresenta si es el observador el que se acerca a la fuente. Cuando la fuentese aleja del observador, la frecuencia detectada es menor que la emitida yel efecto se llama corrimiento al rojo. En el caso relativista se presenta unasituación similar, pero el factor de corrimiento se ve corregido debido alcomportamiento del tiempo para diferentes observadores. En las ecuacionesde transformación para el c-vector de onda ( (4.53) a la (4.56)), está con-tenido el efecto Doppler relativista para la situación más general posible.Para encontrar las relaciones estandar del efecto Doppler relativista que setratan usualmente en los textos de relatividad especial, vamos a considerarcasos particulares de las ecuaciones de transformación (4.53) a la (4.56).

Supongamos que la fuente está en reposo respecto al observador Σ y queemite un frente de ondas de frecuencia ω a lo largo del eje x, entonces lascomponentes del c-vector de onda son (ω/c, kx, 0, 0). De la ecuación (4.53),y teniendo en cuenta que kx = ω/c, para el observador Σ0 tenemos

ω0 = γ(v)(ω − vkx) = ωγ(v)(1− v

c) (4.60)

en donde el signo de la velocidad v es positivo si el observador se aleja dela fuente y negativo si se acerca. Para el caso de movimiento del observadortransversal a la dirección de propagación, consideremos que el observadorΣ emite un frente de ondas de frecuencia ω en la dirección y, entonces elc-vector de onda toma la forma k = (ω/c, 0, ky, 0). A partir de la ecuación(4.53) la frecuencia medida por el observador Σ0 es

ω0 = γ(v)ω (4.61)

Una situación más general de interés se presenta cuando el tren de ondasemitido por la fuente viaja en el plano xy formando un ángulo α con respectoal eje de las x, entonces el c-vector de onda es k = (ω/c, kx, ky, 0), con

tanα = ky/kx;¯k¯=qk2x + k2y;

¯k¯= ω/c (4.62)

Page 88: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

78 CAPÍTULO 4. CINEMÁTICA RELATIVISTA

Entonces para el observador Σ0 se tiene que

ω0 = γ(v)(ω − vkx) = γ(v)ω(1− v

ccosα) (4.63)

Claramente esta última relación contiene, como casos particulares, lassituaciones descritas anteriormente. Cuando α = 0 obtenemos la ecuación(4.60) y para α = 90◦ se reduce a la ecuación (4.61).

Notemos que el efecto Doppler transversal, ecuación (4.61), es de origenestrictamente relativista puesto que es una consecuencia de la dilatacióntemporal, situación que obviamente no se presenta en el tratamiento clásico.

Page 89: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

Parte II

Dinámica relativista

79

Page 90: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma
Page 91: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

Capítulo 5

Dinámica relativista

En este capítulo se desarrollarán las leyes de la dinámica relativista uti-lizando desde un principio, la formulación de cuadrivectores, la cual permiteformular las leyes de la dinámica relativista como una generalización de lasleyes fundamentales de la mecánica Newtoniana.

5.1. Ecuaciones de movimiento

Definamos el cuadri-vector momentun por

p := m0U = m0dx

dτ(5.1)

en donde m0 es la masa inercial propia de la partícula, es decir, la masainercial medida en el sistema de referencia en reposo de la partícula. m0

también es llamada masa en reposo y U es su cuadri-velocidad. Por defini-ción, la masa en reposo de una partícula es un invariante relativista quecaracteriza a la partícula, pues si tomamos la norma del c-v momentun,ecuación (5.1), obtenemos:

p2 = m20c2 (5.2)

dado que la norma al cuadrado del c-v velocidad es c2.A partir de esta definición del c-momento de una partícula, podemos

mantener la misma definición de la segunda ley de Newton, pero formuladapara las cantidades c-vectoriales. Así, la ecuación de movimiento relativistaestá dada por

f =dp

dτ= m0A (5.3)

81

Page 92: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

82 CAPÍTULO 5. DINÁMICA RELATIVISTA

en donde A es la c-aceleración y f es la c-fuerza. Para interpretar las compo-nentes del c-momento y c-fuerza en términos de variables dinámicas físicas,específicamente, en términos de su cantidad de movimiento lineal (momen-tun), de su energía y de la fuerza, consideremos en primer lugar el c-momento(ecuación (5.1)) y hagamos uso del hecho que a bajas velocidades compara-das con la velocidad de la luz, i.e. v ¿ c, las ecuaciones de la relatividaddeben reducirse a las ecuaciones de la mecánica Newtoniana. Teniendo encuenta que las componentes de la c-velocidad están relacionadas con la ve-locidad de la partícula a través de la ecuación Uα = γ(u)(c, u), entonces (vercapítulo anterior) las componentes del c-momentun serán

pα = (m0γ(u)c,m0γ(u)u) =: (E/c, p) (5.4)

En esta última ecuación hemos definido las cantidades E (con unidadesde energía) y p (con unidades de momento) por

E = mc2 (5.5)

p = mu (5.6)

conm := m0γ(u) =

m0p1− u2/c2

(5.7)

llamada masa inercial relativista de la partícula, nombre que será justificadoen el siguiente análisis. Teniendo en cuenta que en el límite de bajas veloci-dades el factor γ(u) lo podemos expandir en una serie en potencias de (u/c),reteniendo términos hasta orden (u/c)2,

γ(u) = 1 +1

2

u2

c2+O(u4/c4) (5.8)

entonces, las componentes espaciales del c-momentun toman la forma

p = m0u(1 +1

2

u2

c2+O(u4/c4)) ≈ m0u (5.9)

la cual, en el límite de bajas velocidades se reduce a la definición del mo-mentum clásico. Así, la definición del momentum relativista de una partículapor la ecuación (5.6), nos conduce a interpretar la masa relativista (ecuación(5.7)) como la inercia de una partícula, la cual depende de su velocidad.

Para interpretar la componente temporal del c-momento, consideremosde nuevo el límite de bajas velocidades de la ecuación (5.5). Remplazandola expansión (5.8) en la definición (5.7) tenemos

E = m0c20(1 +

1

2

u2

c2+O(u4/c4)) ≈ m0c

2 +1

2m0u

2 (5.10)

Page 93: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

5.1. ECUACIONES DE MOVIMIENTO 83

la cual, salvo el término constantem0c2, corresponde a la definición newtoni-

ana de energía cinética. Así, este resultado nos conduce a definir la cantidad

K := mc2 −m0c2 (5.11)

como la energía cinética relativista de una partícula. Esta definición tienesentido en cuanto que la función K depende de la velocidad de la partícula,se anula para u = 0 y en el límite de bajas velocidades se reduce a la energíacinética clásica. La cantidad E = mc2 se define como la energía total de lapartícula y a la cantidad dinámica

E0 := m0c2 (5.12)

la definimos como su energía en reposo. Esta cantidad E0 adquiere el senti-do físico de una energía, solamente si es posible transformar esta forma deenergía (asociada a la masa y no a su estado de movimiento) en otras formasde energía. Einstein, en su segundo artículo de 1905 sobre relatividad, titu-lado ”Depende la inercia de un cuerpo de su contenido de energía” postulaque esta forma de energía, asociada a la masa en reposo de una partícula, esposible transformarla en otras formas de energía, dándole así sentido físicoa esta definición y sugiere que esta transformación de masa en energía sepuede medir en el decaimiento radioactivo de las sales de radio. Este pos-tulado le valió a Einstein el ganarse el dudoso honor de ser ”el padre de labomba atómica”.

Otro resultado que apoya las definiciones anteriores, nos lo da la inter-pretación física de las componentes de la c-fuerza, definida por la ecuaciónde movimiento (5.3). Haciendo uso de la relación d\dτ = γ(u)d/dt y de ladefinición (5.4) de las componentes del c-momento, tenemos

fα =dpα

dτ= γ(u)

dpα

dt

= γ(u)(cdm

dt,dp

dt) = γ(u)(c

dm

dt, f) (5.13)

En la última igualdad hemos definido la cantidad

f =dp

dt(5.14)

la cual identificamos como la fuerza física que actúa sobre la partícula, pro-duciendo, de acuerdo con la definión newtoniana de fuerza, un cambio porunidad de tiempo en el momentum de la partícula. Para sustentar aún más

Page 94: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

84 CAPÍTULO 5. DINÁMICA RELATIVISTA

esta definición de fuerza y de paso la definición de energía total E dada, con-sideremos la relación de ortogonalidad entre la c-velocidad y la c-aceleración(ecuación (4.23)) U ·A = 0, entonces

f · U = ηαβfαUβ = 0 (5.15)

y de esta ecuación y de la definición de las componentes de la c-velocidad,obtenemos la relación

γ2(u)c2dm

dt− γ2(u)f · u = 0

⇐⇒ dE

dt= f · u (5.16)

Esto implica que si adoptamos la definición clásica de trabajo

dW = f · dr (5.17)

entonces se obtiene quedW = f · udt = dE (5.18)

esto significa, que si el trabajo realizado por una fuerza sobre una partículaes diferente de cero, entonces la partícula cambia su energía total, de acuerdocon la ecuación (5.18).

Esta última relación nos permite escribir las componentes de la c-fuerza,definidas en la ecuación (5.13), en la forma

fα = γ(u)(1

cf · u, f) (5.19)

la cual nos da una interpretación directa de las componentes de la c-fuerza;la componente temporal representa el trabajo por unidad de tiempo querealiza la fuerza física f sobre la partícula, mientras que las componentesespaciales forman el vector fuerza.

5.2. Leyes de conservación

La dinámica Newtoniana está basada sobre tres postulados fundamen-tales: La primera ley de Newton o el princio de inercia, la cual tambiénse puede formular de manera equivalente, como el principio de relatividadGalileano, siendo el primer postulado de la teoría especial de la relatividadla generalización de esta primera ley. La segunda ley, que postula la ecuación

Page 95: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

5.2. LEYES DE CONSERVACIÓN 85

de movimiento para una partícula sometida a una fuerza (F = ma), se ex-tiende al caso relativista a través de la ecuación (5.3). La tercera ley llamadade acción y reacción, que postula el comportamiento de la interacción entresistemas, esto es, que la fuerza ejercida sobre una partícula es el resultadode la interacción de esta partícula con algún sistema y por tanto, sobre estesistema también interacciona la partícula, efectuando sobre él una fuerza dela misma magnitud pero de sentido contrario a la ejercida por el sistemasobre la partícula. Claramente esta ley implica que la acción y la reacciónson eventos simultaneos y por lo tanto no puede ser válida para el caso rel-ativista en general. Sin embargo, para el caso particular en que coincidanlos puntos de aplicación de las fuerzas de acción y reacción, sí se cumplela tercera ley de Newton, una situación que se puede presentar cuando lossistemas que interactúan son partículas puntuales y la interacción entre ellasse pueda aproximar por una interacción de contacto. Puesto que las inter-acciones fundamentales (gravitacional, electromagnética, fuerte o nuclear ydébil) que rigen todos los procesos físicos son interacciones a distancia, ypor lo tanto en sentido riguroso, ninguna de estas interacciones fundamen-tales puede satisfacer la tercera ley de Newton, es claro que el postuladode Newton sobre la acción y la reacción, deja de ser una ley fundamentalen la naturaleza y su validez queda restringida a sistemas cuyas velocidadestípicas séan pequeñas comparadas con la velocidad de la luz, o para intera-ciones puntuales de contacto. Es importante anotar en este punto que, en elmarco de la mecánica Newtoniana, la tercera ley de Newton juega un papelfundamental para establecer los teoremas de conservación del momentum yde la energía mecánica.

Esto nos conduce entonces, a postular un principio de conservación parala energía y el momentun de un sistema relativista, el cual como veremos,generaliza las leyes de conservación de la mecánica Newtoniana y adicionauna nueva forma de energía, llamada energía en reposo, que está asociada atoda partícula material y que constituye uno de los aportes más importantesde la teoría especial de la relatividad.

Para un sistema aislado de partículas, con c-momentos pi, i = 1, 2, ..., elc-momento total del sistema p , defido como

p :=Xi=1

pi (5.20)

es una constante de movimiento. Dado que la componente temporal del c-momento representa la energía total del sistema y las componentes espacialescorresponden a las componentes del vector momento, entonces el postula-do de la conservación del cuadrimomento asegura que la energía total y el

Page 96: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

86 CAPÍTULO 5. DINÁMICA RELATIVISTA

momentun total de un sistema aislado son constantes del movimiento. Estoes, si expresamos la ecuación (5.20) en componentes, con pi = (Ei/c, pi) yp = (E/c, p), obtenemos que la energía total del sistema E, definida comola suma de las energías de las partículas individuales

E :=Xi=1

Ei (5.21)

y el momentun total del sistema, definido como la suma vectorial de losmomentos individuales de las partículas

p :=Xi=1

pi (5.22)

se conservan. Notemos que la ley de conservación de la energía (ecuación(5.21)) se puede reformular como el postulado de la conservación de la masainercial, pues de la definición de energía total de una partícula E = mc2,tenemos que X

i=1

mi = cte. (5.23)

Existe toda una serie de consecuencias interesantes de los postuladosde la dinámica relativista, que las vamos a exponer a través de ejemplossobre procesos que se presentan al nivel de las partículas elementales. Esimportante en este punto de la discusión hacer algunas anotaciones respectoa la diferencia, tanto en las aplicaciones como en la metodología de trabajo,entre la dinámica Newtoniana y la relativista. En mecánica Newtoniana, porlo general se conocen las fuerzas (su forma funcional), por ejemplo la fuerzade la gravedad, de Coulomb, del tipo oscilador armónico, de rozamiento, etc.,y a partir de ellas , utilizando la segunda ley de Newton se encuentran lastrayectorias de las partículas y las leyes de conservación permiten determinarconstantes de movimiento, simplificando así el problema dinámico.

En el caso de la relatividad la situación se modifica un poco, pues, salvoel caso de la fuerza de Lorentz, que describe la fuerza que actúa sobre unapartícula cargada inmersa en un campo electromanético, la cual nos per-mite describir el movimiento de la carga solucionando la ecuación dinámicade movimiento, las otras interacciones fundamentales no admiten, por unaparte, una descripción clásica funcional de la fuerza que esté de acuerdocon los principios de la relatividad y por otra parte, es conocido que eltratamiento de las interacciones fundamentales (incluyendo la electromag-nética) debe hacerse en en marco de la teoría cuántica de campos. El casode la electrodinámica es especial, pues esta interacción fundamental admite

Page 97: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

5.3. PROPIEDADES DEL C-MOMENTUN 87

una descripción clásica dada por las ecuaciones de Maxwell, las cuales sonecuaciones relativistas que describen correctamente los fenómenos electro-magnéticos a nivel macroscópico. La diferencia de la electrodinámica clásicacon la ley de gravitación universal de Newton, la cual también describecorrectamente los fenómenos gravitacionales a escalas macroscópicas, radi-ca en el hecho que esta última no es una teoría relativista, pues la fuerzagravitacional Newtoniana es una interacción a distancia e independiente deltiempo. Esta situación fue precisamente la que condujo a Einstein a buscaruna teoría de la gravitación que estuviera de acuerdo con los principios dela relatividad y que en el límite de bajas velocidades se redujera a la teoríaNewtoniana de la gravedad, logrando su objetivo en 1915, cuando formulóla Teoría General de la Relatividad.

Si bien, las aplicaciones fundamentales de la teoría especial de la relativi-dad de dan en el marco de las partículas elementales y como fue enfatizadoen el parágrafo anterior, para su descripción dinámica se requiere de unateoría cuántica de campos, es posible como veremos, obtener toda una se-rie de resultados importantes a partir de la dinámica relativista a partir delos principios de conservación, sin necesidad de recurrir a una descripcióncompleta de las interacciones que rigen estos procesos.

Antes de entrar a estudiar las principales consecuencias de los postuladosde la dinámica relativista, a través de fenómenos y procesos físicos, daremosalgunas definiciones y propiedades y unos resultados generales que serán deutilidad más adelante.

5.3. Propiedades del c-momentun

Un primer resultado general que se deriva de la formulación cuadri-vectorial de la relatividad surge debido al hecho de que la norma de cualquierc-vector en un invariante relativista y por lo tanto las cuatro componentesque conforman un c-vector no son independientes. Así por ejemplo, esta re-stricción sobre las componentes del c-momentun de una partícula, nos con-duce a una relación entre su energía total y la magnitud de su momentun,pues dado p = (E/c, p) tenemos

p2 = E2/c2− | p |2= Invariante (5.24)

Para calcular el valor de este invariente, basta con determinar el c-momentun de la partícula en un sistema de referencia particular, por ejem-plo, en el sistema de reposo instantaneo de la partícula, para el cual el

Page 98: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

88 CAPÍTULO 5. DINÁMICA RELATIVISTA

c-momentun toma la forma

p = (E0/c, 0) (5.25)

y por lo tanto su norma al cuadrado se reduce a

p2 = E20/c2 = m2

0c2 (5.26)

Esto significa que para una partícula de masa en reposo m0, energíatotal E y momentun p medidas en un sistema de referencia Σ, se cumple larelación

E2/c2− | p |2= m20c2 (5.27)

o en forma equivalenteE2 = E20+ | p |2 c2 (5.28)

Dos conclusiones importantes se desprenden de este análisis: La primeratiene que ver con el hecho de que el cuadrivector-momentun de una partículafísica debe ser como de tiempo, pues m2

0c2 > 0 y la segunda conclusión es

que su norma nos caracteriza a la partícula, pues está dada por la masaen reposo de dicha partícula, que es un invariante relativista por definición.Más adelante cuando discutamos el concepto de fotón o partículas de masaen reposo nula, volveremos sobre la ecuación (5.28).

Consideremos ahora dos partículas de c-momentos p1 y p2, con masas enreposo m01 y m02 respectivamente y sea v la velocidad relativa entre ellas.Entonces el producto interno Minkowskiano entre sus c-momentos, que esun invariante relativista, está dado por

p1 · p2 = c2m01m2 = c2m1m02 = c2m01m02γ(v) (5.29)

en donde γ(v) =p1− v2/c2 es el factor γ de la velocidad relativa. Para

obtener esta expresión, basta con calcular el producto interno en el sistemade referencia propio de una de las partículas (segunda o tercera igualdadde la ecuación (5.29)), mientras que la última igualdad de esta ecuación sededuce del hecho que v es la velocidad de una de las partículas medida enel sistema de referencia de la otra (i.e. la velocidad relativa).

En mecánica Newtoniana se define una colisión elástica entre dos partícu-las, cuando la energía cinética del sistema es la misma antes y después dela colisión. Así, en una colisión inelástica parte de la energía cinética de laspartículas se transforma en otras formas de energía, como por ejemplo, calor,ondas mecánicas, etc.. Consideremos ahora una colisión relativista entre dospartículas puntuales, con c-momentos p1 y p2 antes de la colisión y p01 y p02

Page 99: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

5.3. PROPIEDADES DEL C-MOMENTUN 89

después de la colisión. De la hipótesis de conservación del c-momentun seobtiene que

p1 + p2 = p01 + p02 (5.30)

elevando al cuadrado y utilizando las propiedades del producto internoMinkowskiano (ecuación (3.68)) obtenemos

p21 + p22 + 2p1 · p2 = p021 + p022 + 2p01 · p02 (5.31)

Uno de los hechos más interesantes que surge en relatividad y que notiene su contraparte clásica, es que en un proceso de colisión (interacción)entre partículas, es posible que algunas o todas de las partículas inicialesque intervienen en el proceso se aniquilen y surjan otras diferentes. Queeste hecho sea posible es una consecuencia de la equivalencia masa-energía(ecuación (5.12)). Es importante reiterar que los parámetros que caracter-izan una clase de partículas (electrones, protones, etc.) son su masa en re-poso, carga eléctrica, spin, y otros números cuánticos. En los procesos queson de interés para nosotros, solo va a intervenir la masa en reposo de laspartículas y por lo tanto, este único parámetro es suficiente para caracterizardinámicamente a una partícula dada.

Retomando la discusión de la colisión entre dos partículas, considere-mos el caso particular en el cual las partículas que intervienen en el proceso(ecuaciones (5.30) y (5.31)) son las mismas antes y después de la colisión. Sim01 y m02 son las masas en reposo de las partículas, entonces de la relación(5.26) se tiene que

p21 = p021 = m201c

2 (5.32)

p22 = p022 = m202c

2 (5.33)

y por lo tanto la ecuación (5.31) se reduce a la igualdad

p1 · p2 = p01 · p02 (5.34)

Teniendo presente el resultado de la ecuación (5.29), aplicandolo a ambosmiembros de la ecuación (5.34), se llega a que

c2m01m02γ(v) = c2m01m02γ(v0) (5.35)

con v y v0 las velocidades relativas entre las partículas antes y después de lacolisión, de donde se obtiene que

v = v0 (5.36)

Page 100: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

90 CAPÍTULO 5. DINÁMICA RELATIVISTA

Por lo tanto, llegamos a la conclusión general que la magnitud de lavelocidad relativa entre las partículas no cambia. Esta situación nos conducea hacer la siguiente definición:

Una colisión entre partículas se llama elástica, si las partículas que in-tervienen en el proceso son las mismas antes y después de la colisión, oequivalentemente, si las masas en reposo de las partículas que intervienenen la colisión no cambian. Con esta definición, el resultado expresado enla ecuación (5.36) se conoce como el lema de la colisión elástica para dospartículas. Esta definición de colisión elástica tiene relación con la corre-spondiente definición Newtoniana de colisión elástica, pues en el límite debajas velocidades se reduce a la conservación de la energía cinética. Para veresto, basta con tener en cuenta la definición de energía cinética relativistacomo la diferencia entre la energía total y de reposo. Si llamamos Ei y Ef lasenergías totales antes y después de la colisión, entonces de la conservaciónde la energía total se tiene

Ei = m1c2 +m2c

2 = m01c2 +m0

2c2 = Ef (5.37)

Por lo tanto, la energía cinética del sistema antes y después de la colisiónes la misma:

Ki = Ei −m01c2 −m02c

2 = Ef −m01c2 −m02c

2 = Kf (5.38)

5.4. Sistema centro de masa

Como vimos en la Proposición 4.6, dado un c-vector V como de tiemposiempre es posible encontrar un sistema de referencia Σ0, para el cual suscomponentes se reducen a (V 0, 0), dejando además el signo de la primeracomponente invariante, puesto que V o está dirigido al futuro (V 0 > 0) odirigido al pasado (V 0 < 0). Si W es otro c-vector como de tiempo, sincronocon V , i.e., V 0W 0 > 0, entonces en el sistema de referencia Σ0 se cumple

(V +W )2 = (V 0 +W 0)2 −W 2 = V 2 +W 2 + 2V 0W 0 > 0 (5.39)

por lo tanto, se llega al siguiente resultado importante que lo enunciaremoscomo un lema:

Lema 5.1 La suma de dos c-vectores como de tiempo y sincronos, es unc-vector como de tiempo y sincrono con cada uno de los sumandos.

Por inducción este resultado es válido para una suma cualquiera de c-vectores como de tiempo sincronos.

Page 101: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

5.4. SISTEMA CENTRO DE MASA 91

Consideremos ahora un sistema de un número finito de partículas nointeractuantes, salvo colisiones puntuales mutuas, con masas en reposo m0i,i = 1, 2, ... y c-momentos pi y sea Σ un sistema de referencia inercialcualquiera. Definamos la masa relativista total m del sistema y su c-momentuntotal p como

m :=Xi=1

mi (5.40)

p :=Xi=1

pi =Xi=1

(mic, pi) = (mc, p) (5.41)

en donde hemos definido el momentun total del sistema p en la última igual-dad de la ecuación (5.41). De los postulados de conservación todas las can-tidades definidas, p y por tanto m y p, son constantes en el tiempo. Porel lema anterior, el c-momentun total del sistema es un c-vector como detiempo y dirigido al futuro pues mc > 0. Por las propiedades dadas en laProposición 5.1 y Proposición 5.2, podemos encontrar un sistema dereferencia que lo llamaremos ΣCM o sistema de referencia centro de masa,para el cual el c-momentun total p no tenga componentes espaciales, esto es,un sistema para el cual p = 0. La velocidad uCM del sistema de referenciacentro de masa respecto a Σ está dada por

uCM =p

m(5.42)

A diferencia de la mecánica Newtoniana, el vector centro de masa de unsistema de partículas relativistas es dependiente del sistema de referenciainercial, lo cual se puede entender fácilmente si tenemos en cuenta que lamasa inercial de las partículas depende de la velocidad de las mismas. Sinembargo, este vector centro de masa siempre está en reposo en el sistemade referencia ΣCM . Para ver esto, definamos para un sistema de referenciainercial Σ, el vector posición centro de masa del sistema como

rCM :=

Pi=1 rimiPi=1mi

(5.43)

entonces

drCMdt

=

Pi=1

dridt mi +

Pi=1 ri

dmidt

m=

Pi=1 pim

= uCM (5.44)

en donde se han utilizado las definiciones (5.42), (5.43) y (5.44), el hechode que m es una constante de movimiento y además que para interacciones

Page 102: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

92 CAPÍTULO 5. DINÁMICA RELATIVISTA

puntuales (colisión)P

i=1 ridmi/dt = 0 entre colisiones. Este resultado sig-nifica que para cualquier sistema de referencia, el centro de masa del sistemase mueve con la velocidad del sistema centro de masa, lo que no significa queel vector posición centro de masa sea el mismo para todos los observadoresinerciales. Por esta razón, es usual definir el centro de masa del sistema comoel vector posición rCM medido en el sistema ΣCM .

Definida la velocidad uCM (ecuación (5.42)), la c-velocidad del centro demasa está dada por

UCM = γ(uCM )(c, uCM ) (5.45)

entonces, de la definición de c-momentun total (ecuación (5.41)), velocidaddel centro de masa (ecuación (5.42) y la definición de c-velocidad del centrode masa (ecuación (5.45)), tenemos que

p = (mc, p) = m(c, uCM ) = mγ−1(uCM )UCM (5.46)

Tomando la norma al cuadrado de esta ecuación

p2 = m2γ−2(uCM )c2 (5.47)

la cual debe ser un invariante relativista, nos conduce a la definición de lamasa total del sistema de partículas en el sistema de referencia centro demasa ΣCM :

mCM :=m

γ(uCM )(5.48)

Por lo tanto, podemos escribir el c-momentun total del sistema como

p = mCMUCM (5.49)

en donde mCM y UCM para el sistema de partículas, juegan el papel de m0

y U para una partícula simple. Es importante aclarar que mCM , la masa enreposo del sistema en ΣCM , excede a la suma de las masas en reposo de laspartículas del sistema, pues a ella contribuyen también las energías cinéticasde las partículas individuales, puesto que la energía cinética del sistema enΣCM está dada por

KCM = mCMc2 − m0c2 (5.50)

en donde hemos definido

m0 :=nXi=1

m0i (5.51)

Page 103: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

5.5. ENERGÍA UMBRAL 93

5.5. Energía umbral

La primera patícula fundamental que se identificó fue el electrón, el cualera el responsable de la conducción eléctrica. Luego a comienzos de la décadade los treinta, se identificaron el protón y el neutrón como los constituyentesdel núcleo atómico. Por esta época Yukawa desarrolló un modelo para lainteracción nuclear, en el cual surgía una nueva partícula fundamental, elpión, que luego fue observada experimentalmente. Esta época se puede con-siderar como el comienzo de la física de las partículas fundamentales y yaen la década de los sesenta, se conocian cientos de nuevas partículas, lascuales se podían producir en el laboratorio como producto de las colisionesentre partículas aceleradas a altas energías (por ejemplo electrones contraelectrones o protones). Cuando chocan dos partículas con energía cinéticasuficiente, se pueden generar nuevas y más masivas partículas, como el re-sutaldo de la transformación de energía cinética en energía en reposo delas nuevas partículas. La pregunta dinámica que surge es ¿Cual en la en-ergía mínima necesaria de las partículas incidentes, para producir una nuevapartícula de una masa dada?. La respuesta a esta pregunta la constituye elllamado problema de la energía umbral, que es una de las aplicaciones másimportantes de la dinámica relativista.

Para introducir el concepto de energía umbral, consideremos por ejem-plo un electrón de masa en reposo m0 y energía total E = mc2, que chocacontra otro electrón en reposo y como producto de la colisión surge, ademásde los dos electrones iniciales, una nueva partícula de masa en reposo M0.El problema es encontrar la energía mínima necesaria del electrón incidente,llamada energía umbral, para que esta reacción pueda suceder. La respuestano es simplemente (m+M0)c

2, i.e., que la energía cinética del electrón inci-dente sea justamente la energía en reposo de la nueva partícula, pues dadoque el momentun del sistema debe conservarse, el producto de la colisiónen general, debe poseer alguna energía cinética y por lo tanto parte de laenergía inicial debe gastarse en esta energía cinética y la otra parte debesuplir la energía en reposo de la nueva partícula. De cualquier manera, laenergía mínima (umbral) se tendrá cuando las partículas resultantes de lacolisión estén en reposo en el sistema de referencia del centro de masa delsistema. Esta última afirmación define el concepto de energía umbral.

Tomemos por el momento el caso general de dos partícula de masas enreposo m01 y m02 y c-momentos p1 y p2 respectivamente, que al chocar pro-ducen una nueva partícula de masa en reposoM0. Entonces, el c-momentun

Page 104: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

94 CAPÍTULO 5. DINÁMICA RELATIVISTA

total del sistema está dado por:

p = p1 + p2 (5.52)

Elevando al cuadrado esta expresión y teniendo en cuenta la ecuación(5.29) y la definición (5.48), tenemos

m201c

2 +m202c

2 + 2m01m2c2 = p2 = m2

CMc2 (5.53)

De esta relación se obtiene que la energía de la partícula incidente, en elsistema de referencia del laboratorio, será mínima cuando mCM sea mínima,lo cual ocurre cuando todas las partículas emergentes estén en reposo en elsistema de referencia centro de masa. Puesto que en este caso la masa delsistema centro de masa coincide con la suma de las masas en reposo de laspartículas que salen, el límite de mínima energía (5.53) se reduce a

m201 +m2

02 + 2m01m02γ(v) = (m01 +m02 +M0)2 (5.54)

siendo v la velocidad de incidencia de la partícula 2. Dadas las masas de laspartículas iniciales y la masa de la nueva partícula, podemos obtener de estaecuación la velocidad de la partícula incidente y así la energía umbral. Parael ejemplo de los dos electrones, que al colisionar crean una nueva partículade masa en reposo M0, podemos despejar de la ecuación (5.54) el factorγ(v):

γ(v) = 1 +2M0

m0+

M20

m20

(5.55)

y por lo tanto la energía umbral está dada por

EU = m0γ(v)c2 = m0c

2 + 2M0c2 +

M20

m0c2 (5.56)

Esta ecuación es fundamental cuando se diseñan experimentos para bus-car nuevas partículas. Como ejemplo, tomemos el caso del último de losquarks buscado por los físicos de altas energías, el quark top τ , el cual fuedetectado en el año de 1995 en el Fermilab (Estados Unidos). Es importanteanotar que el cálculo que vamos a mostrar, es tan solo un estimado de lamínima energía a partir de la cual podría detectarse el quark, pues en lareacción donde aparece el quark, también pueden aparecer otras partículasy por lo tanto, para un cálculo más exacto se debe tener en cuenta estosefectos adicionales. El quark top se espera que aparezca en una colisiónprotón-antiproón (p − p) y supongamos para simplificar, que después de lacolisión permanece el par (p− p) y el quark τ . Las predicciones teóricas de

Page 105: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

5.5. ENERGÍA UMBRAL 95

la existencia del quark τ , así como su posible masa, dependen del modeloteórico utilizado, pues por ejemplo, tomando los modelos más aceptados enjulio de 1994 (tomados del Particle Physics Booklet, July 1994, AmericanInstitute of Physics) la masa predicha para el quark oscilaba entre 62Gev/c2,pasando por 131Gev/c2 y 174Gev/c2, hasta el valor más alto de 169Gev/c2,calculado a partir del modelo estandar electro-débil. Tomando para la masadel protón m0 = 0,94Gev/c

2, que es la misma masa del antiprotón, obten-emos de la ecuación (5.56) la energía umbral en el sistema laboratorio parala creación del quark top

EU = 32557Gev (5.57)

asumiendo una masa para el quark top de 174Gev/c2. Es importante anotarque esta energía umbral calculada, corresponde a la energía con la que debenincidir, por ejemplo los protones sobre los antiprotones estacionarios, paraque esta reacción pueda ocurrir. En la práctica, las energías alcanzadas hastael presente en los grandes aceleradores están en el orden de los cientos deGev. Sin embargo, en la mayoría de los aceleradores los experimentos serealizan en el sistema centro de masa directamente, pues tanto los protonescomo los antiprotones (o electrones) son acelerados a las mismas energíasen un anillo, viajando en direcciones opuestas y por lo tanto la energía ala cual ellos son acelerados debe ser del orden de la energía umbral en elsistema centro de masa, que para nuestro caso corresponde a energías delorden de la masa en reposo de la partícula que se quiere encontrar, estos esa energías del orden de los 200Gev. Para ilustrar esta situación, calculemosla energía disponible en un experimento de dispersión de protones contraprotones (o antiprotones) en dos casos: En el primer caso, los protones sonacelerados hasta alcanzar una energía de 100GeV y chocan contra un blancode protones en reposo (por ejemplo un gas de hidrógeno a baja temperatura,para el cual podemos despreciar la energía cinética típica de las partículasdel gas). En un segundo experimento, los protones son acelerados a energíasdel orden de 50GeV , se divide el rayo en dos partes y se hacen chocar los doshaces de protones frontalmente. Sean p y q los c-momentos iniciales de losprotones y sea ECM la energía del sistema en el centro de masa. De acuerdoa las ecuaciones (5.47) y (5.48) la cantidad

(p+ q)2 = m2CMc2 = E2CM/c2 (5.58)

es un invariante, la cual puede ser evaluada en cualquier sistema de refe-rencia. Para el primer caso, protones chocando con un blanco estacionariop = (E1/c, p1) y q = (mp0c, 0), tenemos

E2CM = 2m2p0c

4 + 2E1mp0c2 ' 2E1mp0c

2 (5.59)

Page 106: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

96 CAPÍTULO 5. DINÁMICA RELATIVISTA

pues, mp0c2 ¿ E. Con E1 = 100GeV y mp0c

2 = 0,94GeV , la energíadisponible es del orden de 13,7GeV .

Para el segundo experimento, p = (E2/c, p2) y q = (E2/c,−p ), por lotanto, la energía disponible está dada por:

E2CM = 4E22 =⇒ ECM = 100GeV (5.60)

Para alcanzar esta energía en el experimento de blanco estacionario, seríanecesario acelerar los protones hasta una energía del orden de

E1 ' E2CM2mp0c2

' 5319GeV (5.61)

5.6. Fotones y partículas de masa en reposo cero

En esta sección vamos a introducir el concepto de partícula de masa enreposo cero, y en particular el concepto de fotón, como la partícula porta-dora de la interacción electromagnética. El concepto de fotón o quantumde energía está estrechamente relacionado con la teoría cuántica, pero comoveremos enseguida su origen es estrictamente relativista. No está dentro delos objetivos de este libro discutir la formulación de la teoría cuántica decampos, pues no es necesario tener un conocimiento en física cuántica, paraentender los ejemplos y procesos que vamos a desarrollar a lo largo del pre-sente capítulo. Sin embargo, haremos un breve recuento de los principaleshechos históricos que contribuyeron al desarrollo del concepto de fotón.

En la segunda mitad del siglo XIX, cuando la teoría de Maxwell se consol-ida con los experimentos de Herz sobre ondas electromagnéticas, se planteanvarios problemas en diferentes áreas de la física, que finalmente conducenal desarrollo de la mecánica cuántica. En el campo de la espectroscopia setenía el problema de explicar la estructura y en particular, el espectro deemisión y absorción de radiación electromagnética por átomos. En el exper-imento de Herz sobre las ondas electromagnéticas, se reporta un fenómenocurioso que luego, en experimentos más detallados conducen al descubrim-iento del efecto fotoelectrico, esto es, la producción de una corriente eléctrica(fotocorriente) en un material, debido a la incidencia de radiación electro-magnética. El problema surge, cuando todos los intentos teóricos basadossobre la electrodinámica de Maxwell, fallan para explicar las característicasde este efecto. Hacia finales del siglo XIX, Max Planck trabajando sobreel espectro de radiación de cuerpo negro, introduce la hipótesis de la emi-sion y absorción discreta de energía de los osciladores del cuerpo negro, el

Page 107: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

5.6. FOTONES Y PARTÍCULAS DE MASA EN REPOSO CERO 97

cual se puede modelar por una cavidad cerrada, en la cual se encuentra ra-diación electromanética en equilibrio térmico a una temperatura T dada.Esta radiación a su vez, está en equilibrio termodinámico con el materialque conforma la cavidad que está emitiendo y absorviendo continuamenteradiación electromagnética. Contrario a la situación clásica, para la cual seespera que un oscilador pueda absorber o emitir energía en cualquier can-tidad, Planck postuló que cada oscilador podía enmitir o absorber energíaúnicamente en valores discretos, múltiplos de una cantidad fundamental

E = hν (5.62)

en donde ν es la frecuencia de la radiación electromagnética emitida oabsorvida y h se conoce como la constante de Planck, cuyo valor actual6,626075(40) × 1034J · s. Seis años después en 1905, Einstein extiende estahipótesis y postula que la radiación electromagnética energía está cuanti-zada y no solamente los osciladores materiales que emiten y absorven laradiación. Así una onda electromagnética de frecuencia ν transporta su en-ergía en paquetes o quantos de energía, llamados fotones, de valor hν. Conesta hipótesis, Einstein explica el efecto fotoeléctrico y predice además quede acuerdo a la equivalencia masa-energía, los fotones deben transferir mo-mentun al igual que cualquier otra partícula. La diferencia con las partículasusuales, tales como el electrón o el protón, está en su masa en reposo, comoveremos enseguida.

Partiendo de la definición de las componentes del c-momentun (ver e-cuación (5.4))

pα = (E/c, p) (5.63)

y de sus propiedades, ecuación (5.24) o equivalentemente ecuación (5.28),se tiene la relación, entre la energía total de la partícula E, su energía enreposo E0 y su momentun p:

E2 = E20 + |p|2 c2 (5.64)

Esta relación nos permite considerar el caso de una partícula de energíaen reposo nula, i.e., E0 = 0. Esto implica por una parte, que su masa enreposo es cero m0 = 0 y además, que la norma del c-momentun de estapartícula es un c-vector como de luz, pues su norma se anula

p2 = E2/c2 − |p|2 = 0 (5.65)

Estas partículas se llaman partículas de masa en reposo nula y su prin-cipal característica es que sus líneas de universo siempre están sobre el cono

Page 108: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

98 CAPÍTULO 5. DINÁMICA RELATIVISTA

de luz y por lo tanto no existe ningún observador inercial para el cual estaspartículas estén en reposo. La ecuación (5.65) nos da la relación entre elmomentun físico y la energía total de las partículas de masa en reposo nula.El fotón, que es la partícula asociada al campo electromagnético, es un casoparticular de partícula de masa en reposo nula.

Consideremos ahora el c-vector de onda

k = (ω/c, k) (5.66)

definido en el capítulo anterior (sección (4.4)), que nos representa una ondaelectromagnética plana de frecuencia ω y número de onda k y postulemos,de acuerdo a Einstein, que esta onda transporta su energía y momentun enquantos o fotones, cuyo c-vector momentun está dado por:

p := ~k = (~ω/c, ~k) (5.67)

en donde se ha introducido la constante ~, relacionada con la constante dePlanck por ~ = h/2π. De esta relación se sigue que el fotón transporta unaenergía total

E = ~ω = hν (5.68)

pues ω = 2πν, de acuerdo al postulado original de Einstein y un momentunfísico

p = ~k (5.69)

que de acuerdo a las propiedades del c-vector de onda (ecuación (4.57)),la energía (ecuación (5.68)) y el momentun físico (ecuación (5.69)), debencumplir la relación

~2k2 = E2/c2 − |p|2 = 0 (5.70)

la cual nos define una partícula de masa en reposo nula, teniendo en cuentala ecuación (5.65). Las partículas de masa en reposo cero pueden tener tam-bién otras características que las diferencian entre si, tales como la carga,momento magnético, etc.. A parte del fotón, en la naturaleza se encuentranotras partículas de masa en reposo cero, como por ejemplo los neutrinos.Es importante anotar que la física busca permanentemente nuevos experi-mentos para determinar si estos neutrinos son realmente partículas de masaen reposo cero, o si estos poseen una masa en reposo. Hasta el presente seha determinado que la masa es reposo de estos neutrinos, si la tienen, esinferior a 17kev/c2, que al compararla con la masa del electrón (la partículaestable de menor masa en reposo conocida) m0 = 0,51Mev/c2, es realmentemuy pequeña. De hecho para el fotón también se han realizado experimentos

Page 109: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

5.6. FOTONES Y PARTÍCULAS DE MASA EN REPOSO CERO 99

para imponerle cotas superiores a su masa en reposo. Como ya se ha dichoen la introducción de esta sección, el caracter dual que presentan las ondaselectromagnéticas, esto es, para cierto tipo de fenómenos, como el efectofotoelectrico o el efecto Compton (que discutiremos más adelante), para loscuales la luz interacciona como partículas, contrasta con otros fenómenostípicos del caracter ondulatorio de la luz, como los efectos de interferenciao difracción. Esta dualidad es una característica general de toda la materiacuyo estudio le corresponde a la mecánica cuántica. Esta dualidad es talvez, uno de los aspectos más interesantes que presenta la naturaleza y suinterpretación ha sido objeto de muchos trabajos. La teoría de la relativi-dad no pretende conciliar estas ideas y de hecho, este comportamiento dualaparentemente contradictorio, no se presenta como un problema en el con-texto de la teoría de la relatividad, pues tanto las ondas electromagnéticas,como las partículas de masa en reposo cero (y en particular los fotones) sonconceptos relativistas y su relación física se establece solo a través del pos-tulado de cuantización de la energía de Planck, el cual en ningún momentoentra en contradicción con los principios básicos de la relatividad.

Para finalizar esta sección, retomaremos algunos resultados generalesde la dinámica relativista, que siguen siendo válidos si alguna o todas laspartículas que intervienen en el proceso son de masa en reposo nula, comopor ejemplo la emisión de un fotón por un átomo.

En primer lugar consideremos el caso de dos partículas de c-momentunp1 y p2, para el cual el producto interno Minkowskiano está dado por larelación invariante ecuación (5.29). Si una de las partículas es un fotón, e.g.,la partícula 2, entoncesm02 = 0 y podemos escribir esta relación en la forma:

p1 · p2 = cm01E2 (5.71)

en donde p1 = (m1c, p1) y p2 = (E2/c, p2), con E2 la energía del fotónen el sistema de referencia propio de la partícula 1. En el caso en quelas dos partículas sean fotones, la relación (5.29) se vuelve indetermina-da. Para encontrar la relación correcta, supongamos que p1 = (E1/c, p1) yp2 = (E2/c, p2). Como p1 y p2 son c-vcectores nulos, se debe cumplir que|pi| = Ei/c, para i = 1, 2, entonces de la definición de producto internoMinkowskiano se tiene:

p1 · p2 = E1E2/c2 − p1 · p2 = E1E2

c2(1− cos θ) (5.72)

en donde θ es el ángulo formado por los vectores momentun de las partícu-las, que para el caso de fotones, sería el ángulo entre las direcciones depropagación de las ondas electromagnéticas o fotones.

Page 110: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

100 CAPÍTULO 5. DINÁMICA RELATIVISTA

Otra relación que permanece válida para el caso de partículas de masaen reposo cero, se refiere al problema de la energía umbral, ecuación (5.53).Si por ejemplo la partícula que choca es un fotón, entonces m2 = ~ω/c2,m02 = 0 y por lo tanto

mCM = m01 (5.73)

Page 111: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

Capítulo 6

Aplicaciones de la dinámicarelativista

6.1. Introducción

En este capítulo daremos algunos ejemplos de procesos dinámicos, loscuales ilustran los fenómenos y aplicaciones más importantes de la teoríaespecial de la relatividad y más específicamente, de los postulados de con-servación de la energía y el momentun. Restringiremos nuestra discusión aprocesos de colisión entre partículas puntuales, i.e., consideraremos única-mente interacciones de contacto, sin entrar en los detalles de las interac-ciones (fuerzas) que rigen estos procesos. Como se mencionó al comienzo delcapítulo anterior, de las cuatro interacciones fundamentales que determinanla dinámica de todos los procesos conocidos, solamente la interacción elec-tromagnética admite una descripción clásica relativista. Dejaremos para elcapítulo sobre electrodinámica, el problema de formular las ecuaciones demovimiento de partículas cargadas en campos electromagnéticos.

6.2. Colisiones elásticas

El ejemplo más importante de una colisión elástica, tanto por su impor-tancia histórica como por sus aplicaciones prácticas, lo constituye el procesode dispersión Compton. Este proceso, llamado energía efecto Compton, jugóun papel fundamental en el desarrollo de la mecánica cuántica, pues ésteofreció una de las primeras pruebas directas del carácter corpuscular de laluz y de paso también, una prueba más de la dinámica relativista. A. H.Compton recibió el premio nobel en 1927 por el estudio de este efecto (ver,

101

Page 112: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

102CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

Figura 6.1: Efecto Compton

por ejemplo, el artículo original: Compton A.H., 1923, Phys. Rev. 22,409).

6.2.1. Efecto Compton

La dispersión Compton es el proceso de colisión elástico entre una partí-cula de masa en reposo cero (e.g., un fotón) contra una partícula masiva (e.g.,un electrón). El experimento original se realizo haciendo colisionar fotonesde alta energía (como rayos X o rayos gama) contra electrones practicamenteen reposo, es decir, electrones con energías cinéticas mucho menores que lasenergías típicas de los fotones.

Tomemos el eje z en la dirección de incidencia del fotón (ver Figura 6.1),entonces su c-momentun inicial se puede escribir como

pγ = (Eγ/c, pγ) (6.1)

con Eγ = hν la energía, siendo ν la frecuencia del fotón incidente y pγ =(0, 0, Eγ/c) su momentun, en donde se ha hecho uso de la relación (5.65). Elc-momentun inicial del electrón en reposo está dado por:

pe = (me0c, 0) (6.2)

Page 113: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

6.2. COLISIONES ELÁSTICAS 103

Figura 6.2: Lineas de universo del efecto Compton

Seanp0γ = (E

0γ/c, p

0γ) y p0e = (mec, p

0e) (6.3)

los correspondientes c-momentos del fotón y del electrón después de la col-isión. Sin pérdida de generalidad, supongamos que el plano en el cual serealiza la colisión es el x − z y sea θ el ángulo que forma la dirección dedispersión del fotón con respecto al eje z y ϕ el ángulo respecto al eje z dedispersión del electrón. Entonces de la conservación del c-momentun totaldel sistema, tenemos

pγ + pe = p0γ + p0e (6.4)

En la Figura 6.2 se muestran las líneas de universo del electrón y el fotónen el sistema de referencia del laboratorio. La línea de universo del fotón,dibujada a 45o en un plano paralelo al plano ct − z, intercepta a la líneade universo del electrón en reposo, evento P. En este punto el electrón esdispersado, siguiendo una línea de universo dentro del cono de luz del eventoP, mientras que el fotón es dispersado en otra dirección, siguiendo una líneade universo sobre el cono de luz del evento P.

Puesto que experimentalmente se mide la frecuencia (energía) o longi-tud de onda del fotón dispersado, en función del ángulo de dispersión y dela frecuencia o longitud de onda del fotón incidente, despejemos p0e de la

Page 114: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

104CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

ecuación (6.4) y tomando la norma al cuadrado de esta ecuación resultante,obtenemos:

(pγ + pe − p0γ)2 = (p0e)

2 (6.5)

Teniendo en cuenta quep2γ = p02γ = 0 (6.6)

yp2e = p02e = m2

e0c2 (6.7)

llegamos finalmente a la relación:

pγ · p0γ + pe · (p0γ − pγ) = 0 (6.8)

Utilizando la ecuación (5.72) para el producto punto entre c-vectoresnulos y de las expresiones (ecuaciones (6.1) a la (6.2)) para los c-momentundel electrón y los fotones inicial y final, obtenemos

EγE0γ

c2(1− cos θ) +me0(E

0γ −Eγ) = 0 (6.9)

Expresando las energías de los fotones en términos de la longitud de ondaasociada, Eγ = hν = hc/λ y E0γ = hν0 = hc/λ0, obtenemos finalmente, laexpresión estandar para la dispersión Compton, la cual nos da la diferenciaentre las longitudes de onda dispersada e incidente, en función del ángulode dispersión θ:

λ0 − λ = λe(1− cos θ) (6.10)

A la cantidad λe := h/me0c se le llama longitud de onda de Compton aso-ciada al electrón. En la (Figura 6.3) se reproducen los resultados originalesde Compton.

En 1950 Cross y Ramsey (Cross W.G. and Ramsey N.F., 1950, Phys.Rev. 80,929) midieron por primera vez al electrón dispersado simultánea-mente con el fotón, en un experimento de coincidencia, obteniendo resultadosen concordancia con la teoría. Para calcular el ángulo de dispersión delelectrón, en función del ángulo de dispersión del fotón y de la energía delfotón incidente, despejemos la velocidad del electrón de las componentesespaciales de la ecuación (6.4) y eliminando E0γ en esta expresión, con laayuda de la ecuación (6.9), obtenemos:

tanϕ =me0cc

2 sin θ

(Eγ +me0c2)(1− cos θ) (6.11)

en donde ϕ es el ángulo de dispersión del electrón, medido con respecto ala dirección de incidencia del fotón. En el experimento de coincidencia deCross y Ramsey se midió un ángulo ϕ = 31,3◦, para una energía del fotónincidente de 2,6Mev y un ángulo θ = 30,0◦ para el fotón dispersado.

Page 115: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

6.2. COLISIONES ELÁSTICAS 105

Figura 6.3: Resultados experimentales de Compton

6.2.2. Efecto Compton inverso

Como otro ejemplo de colisión elástica, consideremos la dispersión deun fotón de muy baja energía por una partícula, por ejemplo un protón,de alta energía. Después de la colisión la partícula masiva le cede parte desu energía cinética al fotón, el cual se dispersa con una frecuencia mayordependiente del ángulo de dispersión. Por esta razón, a este proceso lo lla-maremos efecto Compton inverso. El desarrollo matemático es similar al delefecto Compton tratado en el parágrafo precedente, aun cuando algo máscomplejo, pues la partícula está inicialmente en moviento. Para discutir unfenómeno interesante que se puede presentar con los rayos cósmicos y losfotones de la radiación cósmica de fondo, vamos a restringir la discución aun caso particular de este proceso de dispersión.

Supongamos que la energía del fotón inicial Eγ es mucho menor que laenergía total de la partícula incidente Ep = mpc

2, i.e., Eγ ¿ mpc2 y consid-

eraremos solamente el caso de máxima transferencia de energía en el procesode colisión, que de acuerdo con la relación (ecuación (6.10)) se obtiene parael caso de dispersión frontal, es decir θ = 180. Sea pγ = (Eγ/c, pγ) el c-momentun del fotón y pp = (Ep/c, pp) el c-momentun del protón antes dela colisión y sean p0γ = (E0γ/c, p0γ) y p0p = (E0p/c, p0p) los correspondientesc-momentos después de la colisión. De manera similar al caso tratado para

Page 116: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

106CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

el efecto Compton, despejamos p0p de la ecuación de conservación (6.4) yelevando al cuadrado, obtenemos

pγ · p0γ + pp · (p0γ − pγ) = 0 (6.12)

Teniendo en cuenta que |pγ | = Eγ/c,¯p0γ¯= E0γ/c y utilizando la aprox-

imación

|pp| c =qE2p −m2

p0c4 ≈ Ep −−

m2p0c

4

2Ep(6.13)

obtenemos, para la energía del fotón dispersado

E0γ =Eγ(Ep +

¯Pp

¯c)

2Eγ +Ep − |pp| c ≈Ep

1 +m2p0c

4/EγEp(6.14)

El modelo estandar de la cosmología describe la estructura y evolucióndel universo actual, postulando su origen a partir de un estado inicial dealtísima densidad y temperatura (en principio infinitas). Una de las predic-ciones fundamentales del modelo estandar es la existencia de un fondo deradión cósmica (radiación electromagnética con un espectro de cuerpo ne-gro), el cual se ha ido enfriando debido a la expansión del universo, alcanzan-do una temperatura actual del orden de 2,73◦K. Esta radiación cósmica defondo se puede modelar como un gas de fotones, con una cierta distribuciónde energías. En promedio un fotón típico de este fondo de radiación tieneuna energía media dada por

Eγ = kBT (6.15)

en donde T es la temperatura absoluta de 2,73◦K y

kB = 1,380× 10−23J ·K−1 = 8,617× 10−5eV ·K−1 (6.16)

es la constante de Boltzmann.Por otra parte, los rayos cósmicos son haces de partículas elementales

(en su mayoría electrones y protones) de alta energía E ∼ 1020eV , cuyafuente, aun cuando no está completamente determinada, parece ser de origengaláctico. Un protón típico de estos rayos cósmicos, puede entonces dispersarelásticamente un fotón del fondo de radión cósmica y suministrarle entoncesuna energía, que de acuerdo a la relación (5.39), es del orden de

E0γ '1020eV

1 + (0,938× 109)2/(1020 · 2,37× 10−4) ' 2,6× 1018eV (6.17)

Es decir, el fotón dispersado puede adquirir energías típicas de los rayosgama.

Page 117: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

6.3. COLISIONES INELÁSTICAS 107

6.3. Colisiones inelásticas

Las aplicaciones más importantes de la dinámica relativista se encuen-tran en los procesos de dispersión inelásticos, tales como la absorción yemisión de fotones y la creación de nuevas partículas. Cuando colisionandos partículas, se pueden producir muchos tipos de efectos que podemosesquematizar en los siguientes tipos de reacciones:

A+B = CA+B = A+B + CA+B = A+ C

A+B = C +D + F + · · ·(6.18)

La primera reacción por ejemplo, representa un proceso en el cual laspartículas que chocan se aniquilan, para dar lugar a una nueva partiícu-la (por partícula queremos significar tanto las partículas elementales, comoaquellas que presentan estructura interna o están conformadas por otraspartículas elementales, tales como los átomos, moléculas o núcleos). La se-gunda reacción representa un proceso en el cual las partículas iniciales so-breviven a la colisión, dando lugar a una nueva partícula. En el tercer caso,una de las partículas que entra en la reacción se aniquila, dando lugar a lacreación de otra y en la última reacción las partículas iniciales desaparen-cen y surgen varias partículas nuevas. ¿Que leyes físicas determinan cuál ocuáles reacciones pueden ocurrir?. En primer lugar están las leyes de con-servación, las cuales determinan si un proceso dado puede o no suceder.Tomemos como ejemplo un fotón que choca contra un electrón inicialmenteen reposo y captura al fotón, saliendo el electrón con cierta energía cinética.Sean p = (me0c, 0) y q = (Eγ/c,Eγ/cn) los c-momentos iniciales del elec-trón y el fotón respectivamente, con n un vector unitario en la direcciónde movimiento del fotón incidente y sea p0 = (mc,mvn) el c-momentun delelectrón depués de la colisión. Al aplicar el postulado de la conservación delc-momentun, p + q = p0, obtenemos un resultado inconsistente, pues bastacon elevar al cuadrado esta expresión:

m2e0c

2 + 2me0Eγ = (p+ q)2 = p02 = m2e0c

2 (6.19)

la cual implica que me0 = 0 o Eγ = 0. Esto significa que este proceso esprohibido, pues viola el principio de conservación del c-momentun. En se-gundo lugar existen otros principios de conservación los cuales, en general,dependen de la interacción (fuerte, electromagnética, débil o gravitacional)que media el proceso de colisión y que de igual manera, a los principios fun-damenta de conservación de la energía y momentun, restringen los procesos

Page 118: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

108CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

que puedan ocurrir en una colisión entre partículas. Algunos de estos prin-cipios de conservación son de validez general, tal como la conservación dela carga eléctrica, mientras que otros, como la conservación del número bar-iónico o la paridad, solamente se cumplen para unas interacciones pero nopara otras. Por ejemplo, la interacción electromagnética conserva la paridad,pero la interacción bébil no la conserva.

6.3.1. Absorción de un fotón por un átomo

Antes de entrar en el problema de absorción de un fotón por un átomo, esimportante aclarar la diferencia, desde la óptica de la dinámica relativista,entre un átomo y una partícula elemental. La partícula elemental está car-acterizada por su masa propia y eventualmente por otros números cuánticoscomo la carga, el spin, el isospin, etc, y basta que uno de estos parámetrossea diferente para que se tenga otra partícula elemental diferente. Un átomo,por otra parte, está caracterizado por su número atómico (i.e., el númerode electrones o protones el cual determina sus propiedades químicas) y sunúmero de nucleones (protones más neutrones del núcleo) el cual determinalos diferentes isópos de un mismo elemento químico. La masa propia de losátomos no es estrictamente un parámetro que determine un tipo particularde átomos, pues dado que los atómos presentan estructura interna, (comolos diferentes niveles de energía) la energía cinética de las partículas quelo constituyen y la energía potencial de interacción entre ellas contribuyentambién a la masa propia de los átomos. Es de anotar, que si bien la con-tribución a la masa de los átomos debida a esta energía interna, es muypequeña comparada con la suma de las masas de las partículas que lo con-forman, si hacen una diferencia fundamental, cuando se trata el problemadinámico de la emisión y absorción de fotones por átomos, como veremos enesta sección. Así, un átomo que a emitido o absorbido un fotón, tendrá unamasa propia diferente antes y después del proceso, sin que cambien necesari-amente sus propiedades químicas y por lo tanto desde el punto de vista de ladinámica relativista relativista, estos átomos son partículas diferentes antesy después de la emisión o absorción de un fotón. Esta misma situación siguesiendo válida, aún en el caso en que el átomo se ionise (pierda uno o variosde sus electrones) y también cuando estamos tratando con otras estructurascomo los núcleos atómicos. Por esta razón, una partícula elemental (sin es-tructura interna) aislada, tal como un electrón, no puede emitir o absorberun fotón individual, sin violar los principios de conservación fundamentalescomo vimos en el ejemplo tratado anteriormente.

Consideremos una partícula no elemental (átomo, molécula, ión o núcleo)

Page 119: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

6.3. COLISIONES INELÁSTICAS 109

Figura 6.4: Lineas de universo del átomo y el fotón capturado

con masa en reposo M0, sobre la cual incide un fotón de frecuencia ν, elcual es absorbido por la partícula. En la Figura 6.4 se muestra el procesode absorción de un fotón por un átomo. La línea de universo del átomoinicialmente en reposo, intercepta a la línea de universo del fotón, eventoP. El átomo captura al fotón y se dispersa siguiendo una línea de universorecta, la cual está dentro del cono de luz futuro del evento P.

Sea M 00 la masa de la partícula después de la colisión y calculemos,

suponiendo que la partícula inicial está en reposo, la velocidad con quesale la partícula final. Llamemos p = (M0c, 0) y q = (Eγ/c,Eγ/cn) los c-momentos iniciales de la partícula y el fotón respectivamente, en donde Eγ =hν y n es un vector unitario en la dirección de propagación del fotón. El c-momentun final del sistema será p0 = (M 0c,M 0vn), pues por la conservacióndel momentun, la dirección de movimiento de la partícula final es la mismaque la del fotón incidente, siendo v su velocidad y

M 0 =M 00/p1− v2/c2 (6.20)

De la conservación del c-momentun p + q = p0 podemos despejar di-rectamente, elevando al cuadrado esta expresión, la masa en reposo de la

Page 120: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

110CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

partícula final

M 00 =M0

r1 +

2Eγ

M0c2(6.21)

Escribiendo explícitamente en componentes la ecuación de conservacióndel c-momentun

M0c2 +Eγ =M 0c2

Eγ/c =M 0v (6.22)

podemos calcular la masa relativista y la velocidad de la partícula final:

M 0 =M0 +Eγ

c(6.23)

β =v

c =Eγ

M0c2+Eγ

(6.24)

Las partículas con estructura interna, como los átomos, moléculas y nú-cleos, poseen niveles de energía internos Ei con i = 0, 1, 2, ..., (en dondeel nivel E0 se le llama estado base o fundamental del sistema) y por lotanto el proceso de absorción de fotones por este tipo de partículas es se-lectivo, esto es, la partícula solo puede absorber fotones de ciertos valoresde energía que cumplan con la condición que Ej − Ek ' Eγ , estrictamenteEγ > Ej − Ek, pues parte de la energía del fotón incidente debe gastarseen la energía cinética final del átomo (lo cual se deduce de las ecuaciones(6.23) y (6.24)). En un átomo por ejemplo, la diferencia típica entre nivelesde energía está en el rango de los electronvoltios. Puesto que la masa propiade los átomos oscila entre 1GeV/c2 (para el átomo de hidrógeno) hasta loscientos de gigaelectronvoltios (para átomos pesados), la fracción Eγ/M0c

2 esdel orden de 10−8, calculada para el caso de un átomo de hidrógeno, mien-tras que la diferencia entre niveles de energía es inferior a 13,6eV (valor quecorresponde a la energía de ionización del átomo de hidrógeno).

De la ecuación (6.21) vemos que la masa propia del átomo exitado (queha absorbido el fotón) es tan solo una fracción del orden de 10−8 mayor quela masa del átomo inicial. Por otra parte, la velocidad del átomo exitadoestá dada por la ecuación (6.24)), obteniendose

v = 10−8c (6.25)

en donde para estos cálculos, hemos asumido un valor típico de 10eV parala energía Eγ del fotón incidente.

Es de anotar que si incide un fotón sobre un átomo con una energíamayor a la de ionización, el fotón puede ser capturado por el átomo, o más

Page 121: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

6.3. COLISIONES INELÁSTICAS 111

exactamente por un electrón del átomo, el cual se desprende del sistema conuna energía cinética igual al exceso de energía del fotón sobre la energía deionización. Este proceso, diferente al que estamos considerando, es la base delefecto fotoeléctrico el cual, como yá se ha mencionado anteriormente, jugóun papel fundamental en el desarrollo de la mecánica cuántica. Si llamamosϕ la energía de ligadura del electrón al átomo, o a la estructura de átomospara el caso de un sólido (llamada también función trabajo del material), yEγ = hν a la energía del fotón incidente, entonces si este fotón es absorbidopor el sólido, el electrón se puede desprender del material, con una energíacinética dada por

Ke = hν − ϕ (6.26)

La energía cinética de los electrones desprendidos, llamados fotoelec-trones, se puede medir utilizando un contravoltaje. La ecuación (6.26) pre-senta dos características importantes probadas experimentalmente, las cualesno pueden ser explicadas con un modelo ondulatorio de la luz: La primeracaracterística es la relación líneal entre la frecuencia de la luz incidente, sinimportar cual sea la intensidad de ella (la intensidad de la luz, en el modeloondulatorio es proporcional al cuadrado de la amplitud de los campos elec-tromagnéticos, mientras que en el modelo corpuscular de la luz, la intensidades proporcional a la densidad de fotones). La segunda característica impor-tante, es la existencia de una frecuencia umbral ν0, por debajo de la cual nohay corriente de fotoelectrones, la cual se obtiene cuando Ke = 0 = hν0−ϕy que depende del material, pues la función trabajo ϕ es una propiedad delmaterial, más no de la radiación electromagnética incidente.

6.3.2. Emisión de un fotón por un átomo exitado

Consideremos ahora el proceso inverso al descrito en la sección anterior.

Supongamos que un átomo exitado de masa propia M0, inicialmente enreposo, emite un fotón de frecuencia ν, esto es, de energía Eγ = hν.

En la Figura 6.5 se muestran las líneas de universo del proceso de emisiónde un fotón por un átomo. El átomo exitado, inicialmente en reposo, emiteun fotón: evento P. El fotón emitido sigue una línea de universo que estásobre el cono de luz futuro del evento P, en tanto que la línea de universodel átomo dispersado es descrito por la línea recta, interior al cono de luzdel evento P.

De manera similar al caso tratado en la sección anterior, la energía delfotón emitido no puede ser exactamente igual a la diferencia entre dos nivelesde energía del átomo, de hecho debe ser ahora menor Eγ < Ej −Ek ≡ Eγ0,

Page 122: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

112CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

Figura 6.5: Lineas de universo del átomo y el fotón emitido

pues por conservación de momentun el átomo, al emitir el fotón, debe sufrirun retroceso y por lo tanto parte de la energía suministrada por el átomoal realizar la transición, debe ser transformada a energía cinética del átomofinal. Es de anotar que esta energía Eγ0 corresponde también a la diferenciaentre las energías en reposo de los átomos inicial y final, i.e.,

Eγ0 =M0c2 −M 0

0c2 (6.27)

Una variable de interés en este proceso es la relación entre la energíadel fotón emitido, con respecto a la diferencia entre dos niveles internos deenergía del átomo, o equivalentemente, a la energía de un fotón emitido porel átomo, si este no sufriera retroceso. Sean p = (M0c, 0) el c-momentundel átomo inicial y q = (Eγ/c,Eγ/cn) y p0 = (M 0c,−M 0vn) los c-momentosfinales del fotón y el átomo, en donde n es la dirección de propagación delfotón y v la velocidad de retroceso del átomo. De la ecuación de conservacióndel c-momentun, escrita en la forma p0 = p− q y elevando al cuadrado estaecuación, se obtiene la relación:

M 020 c

2 =M20 c2 − 2M0Eγ (6.28)

Remplazando la masa en reposo del átomo final, en términos de Eγ0, se

Page 123: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

6.4. SISTEMAS DE MASA VARIABLE 113

llega finalmente a

Eγ = Eγ0(1− Eγ0

2M0c2) (6.29)

Para ganar una idea de las magnitudes de las variables físicas involu-cradas, tomemos de nuevo el caso del átomo de hidrógeno y supongamosque Eγ0 ' 10eV y M0c

2 ' 1GeV , entonces la energía del fotón emitido seráuna fracción del orden de 10−12 veces menor, que la frecuencia de un fotónemitido sin retroceso. Como se discutió anteriormente, el efecto del retrocesocausa una disminución en la frecuencia del fotón emitido con respecto a lafrecuencia de la transición y la fración en la cual cambia esta frecuencia, esinversamente proporcional a la masa del átomo (ver ecuación (6.29)). Si elátomo emisor está ligado a una estructura, por ejemplo a una red de átomoscomo en un sólido, entonces la masa efectiva que absorbe el momentun deretroceso será ahora del orden de 1023 veces la masa del átomo emisor y laenergía del fotón emitido, prácticamente coincide con la energía propia dela correspondiente transición entre niveles de energía del átomo. Este efec-to de emisión sin retroceso fue descubierto por Möβbauer, quien recibió elpremio nobel en 1961 y este efecto es actualmente una fuente de muchasaplicaciones en física atómica, estado sólido y física nuclear.

6.4. Sistemas de masa variable

Puesto que la masa inercial de una patícula medida por un observadordepende de la velocidad, se puede considerar que todo sistema relativistaes, de hecho, un sistema de masa variable. Sin embargo en relatividad, elequivalente al caso de la mecánica clásica de un sistema de masa variable,corresponde a un sistema cuya masa propia sea variable. Un ejemplo de unsistema de masa propia variable, lo constituye el cohete fotónico, esto es,un cohete para el cual el sistema de propulsión transforma masa en energíaradiante (fotones).

Retomemos el ejemplo discutido en el capítulo anterior de una naveespacial que realiza un viaje al centro de nuestra galaxia, con aceleraciónpropia constante igual a la aceleración de la gravedad g y supongamos queesta nave dispone de un cohete de propulsión que transforma masa en reposoen fotones y los radía con un ciento por ciento de eficiencia, directamentehacia atrás y perfectamente colimados. Calculemos entonces qué fracción dela masa propia inicial es gastada para realizar el viaje hasta el centro de lagalaxia, suponiendo (como en el ejemplo del capítulo cuarto, sección (4.4.3))que durante la mitad del viaje acelera y la otra mitad frena, con aceleración

Page 124: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

114CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

propia constante g. Sea M la masa propia del cohete en un instante dado(la cual es variable) y P =MU su c-momentun, en donde

U = (U0, U) = (U0, Ux, 0, 0) (6.30)

es la c-velocidad del cohete, el cual se mueve a lo largo del eje x y

prad = (Erad/c, prad) (6.31)

el c-momentun de la radiación. Por conservación de la energía, el cambio enla energía del cohete es igual al cambio en la energía radiada, entonces

d(MU0) = −dErad/c (6.32)

Como la energía radiada es en forma de fotones, se debe tener que:

dErad = cdprad (6.33)

y por conservación del momentun tenemos:

dprad = d(MUx) (6.34)

Entonces, de estas relaciones obtenemos la ecuación:

dMU0 = −d(MUx) (6.35)

la cual se puede escribir en la forma:

dM

M= −d(U

0 + Ux)

U0 + Ux(6.36)

Integrando esta ecuación y teniendo en cuenta las expresiones para U0 yUx (ecuación (4.38)) se llega, finalmente a la expresión para la masa propiadel cohete, en función del tiempo propio τ :

M =M0e−τg/c (6.37)

en donde M0 es la masa propia inicial de la nave. De acuerdo a la ecuación(4.47), el tiempo propio para que la nave realice la mitad del viaje es de10,3anos y por lo tanto eτg/c ' 29700, de donde se sigue que la masa propiade la nave a la mitad del viaje es de M1/2 =M0/29700 y la masa propia alfinal del viaje hasta el centro de la galaxia será

Mfinal =M0/(29700)2 ' 10−9M0 (6.38)

Esto significa que la gran mayoria de la masa de la nave (109) debe sergastada como combustible.

Page 125: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

6.5. CREACIÓN Y ANIQUILACIÓN DE PARTÍCULAS 115

6.5. Creación y aniquilación de partículas

Una de las aplicaciones más importantes de la equivalencia entre la masay la energía, es la posibilidad de generar nuevas partículas en procesos decolisión inelástica, o también a partir del decaimiento (aniquilación) espon-táneo de una partícula inestable. Como ya se mencionó en la sección (6.6.3)sobre colisiones inelásticas, la posibilidad de una determinada reacción, porejemplo la creación de un antiprotón a partir de la colisión entre dos pro-tones depende, en primer lugar, de los principios de conservación dinámicosde energía-momentun y en segundo lugar, que la interación que media elproceso permita este tipo de reacción. La teoría física fundamental que de-scribe estos procesos se llama teoría cuántica de campos y ella nos permitepredecir, no solo que reacciones son posibles, sino también la probabilidadcon que un determinado proceso puede ocurrir. La probabilidad para queun cierto proceso ocurra signica lo siguiente: cuando dos partículas colision-an, o una partícula inestable se desintegra, como resultado de esta reacciónpueden surgir diferentes productos, todos permitidos por las diferentes leyesde conservación y cada uno de ellos con una probabilidad de ocurrencia,o equivalentemente, con un porcentaje de ocurrencia. Por ejemplo el bar-ión Λ0 puede decaer en 6 formas diferentes, cada una de ellas con diferenteprobabilidad:

Λ0 −→ p+ π− (63,9± 0,5)% (6.39)

Λ0 −→ n+ π0 (35,8± 0,5)% (6.40)

Λ0 −→ n+ γ (1,75± 0,15)× 10−3% (6.41)

Λ0 −→ p+ π− + γ (8,4± 1,4)× 10−4% (6.42)

Λ0 −→ p+ e− + νe (8,32± 0,14)× 10−4% (6.43)

Λ0 −→ p+ µ− + νµ (1,57± 0,35)× 10−4% (6.44)

El porcentaje entre paréntesis significa que, de cada 100 eventos de de-caimiento del barión Λ0, por ejemplo, decáe en un protón y en un piónaproximadamente 64 veces, el cual es el evento más probable, miéntras queel último proceso, decaimiento en un protón, un muón y un neutrino muóni-co es el menos probable, con una ocurrencia de un evento por cada 10000,aproximadamente. La masa del barión Λ0 es de 1115,684MeV y su vida me-dia, esto es el tiempo propio que la partícula permanece desde su creaciónhasta que ella decáe, es de 2, 632×10−10s. A su vez esta partícula, el bariónΛ0, es producido en otra reacción, como por ejemplo

π+ + n −→ K+ + Λ0 (6.45)

Page 126: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

116CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

Si las masas del pión π+, el neutrón n y el mesón K+ son 140MeV/c2,940MeV/c2 y 494MeV/c2 respectivamente, calculemos por ejemplo la en-ergía cinética umbral del mesón π+, para que al chocar con el neutrón enreposo, se cree el barión Λ0 a un ángulo de 90◦, medidos con respecto a ladirección de incidencia del pión. De la conservación del c-momentun, ten-emos

pπ + pn = pK + pΛ (6.46)

Puesto que no estamos interesados en la información para la partícu-la K+, despejemos su c-momentun de la ecuación anterior y tomemos elcuadrado de la expresión resultante (con la notación pπ = (Eπ/c, pπ), mπ0

la masa en reposo del pión y similarmente para las otras partículas):

m2K0c

2 = m2π0c

2 +m2n0c

2 +m2Λ0c

2 + 2pπ · pn − 2pπ · pΛ − pn · pΛ (6.47)

Puesto que en el sistema de laboratorio pπ = (Eπ/c, pπ), pn = (mn0c, 0)y pΛ = (EΛ/c, pΛ) y además pπ · pΛ = 0 dado que el ángulo de dispersióndel barión Λ0 es de 90◦, entonces podemos despejar la energía total Eπ deesta expresión, para obtener

Eπ =m2

K0c2 −m2

π0c2 −m2

n0c2 −m2

Λ0c2 + 2mn0EΛ

2(mn0 −EΛ/c2)(6.48)

por lo tanto, para que Eπ séa mínimo se requiere que la energía del bariónΛ0 sea mínima y para esto basta tomar EΛ = mΛ0c

2, entonces

Eπ(umbral) =m2

K0 −m2π0 −m2

n0 −m2Λ0 + 2mn0mΛ0

2(mn0 −mΛ0)c2 = 1149MeV

(6.49)y por lo tanto la energía cinética umbral del pión incidente será de

Kumbral = 1149MeV − 140MeV = 1009MeV ' 1Gev (6.50)

Page 127: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

Parte III

Electrodinámica relativista

117

Page 128: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma
Page 129: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

Capítulo 7

Tensores

7.1. Introducción

Uno de los elementos fundamentales de toda teoría física lo constituye elmodelo matemático adecuado para describir las variables físicas y las leyesque rigen su comportamiento. En el capítulo 3 se definieron los conceptosde cuadri-vector y de invariante relativista, el primero como una cantidadcon cuatro componentes que bajo una transformación de Lorentz, sus com-ponentes se transforman de acuerdo a una ley definida (ecuación (3.29)) yel segundo como una cantidad invariante bajo una TL, es decir una canti-dad que toma el mismo valor numérico en todos los sistemas de referenciainerciales, el cual llamaremos en lo sucesivo escalar de Lorentz. Para muchosde los fenómenos físicos conocidos estos objetos matemáticos, escalares y c-vectores, son suficientes para definir las variables que permiten describir losprocesos físicos. Sin embargo, existe toda una serie de variables dinámicas,tales como por ejemplo el momento de inercia de un sólido rígido, las cualesrequieren para su descripción otros objetos matemáticos llamados tensores.El objetivo fundamental del presente capítulo es introducir el concepto detensor y dar las herramientas fundamentales del álgebra y del cálculo ten-sorial.

Existen varios caminos posibles para definir el concepto de tensor, porejemplo, la aproximación algebráica, la cual es una extensión del álgebralineal y de los espacios vectoriales. Otro camino más cercano a sus aplica-ciones físicas, es a través de la definición de un tensor por sus propiedadesde transformación bajo un cambio de coordenadas. Este será el camino queseguiremos en este capítulo.

Es importante anotar en este punto, que las variedades diferenciales con-

119

Page 130: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

120 CAPÍTULO 7. TENSORES

stituyen el marco matemático natural para definir de manera rigurosa ygeneral el concepto de tensor. Pero no abordaremos aquí esta teoría, puesestá más allá del alcance del presente libro y además para los objetivosque perseguimos, formular la electrodinámica clásica en forma relativistaexplícita, no es necesario desarrollar este formalismo matemático en toda suextensión. Sin embargo, vale la pena resaltar que los resultados del análisistensorial que presentaremos son válidos en el caso general y sirven comopunto de partida para un estudio más riguroso de geometría diferencial,necesario para abordar el estudio de la Teoría General de la Relatividaddesarrollada por Einstein en 1916.

7.2. Definiciones fundamentales

En esta sección introduciremos los conceptos fundamentales del cálculotensorial. Los objetos matemáticos fundamentales con los cuales tratare-mos son los escalares, los vectores y los tensores, los cuales son en generalfunciones de las coordenadas. Estos objetos serán definidos en términos desus propiedades de transformación, cuando cambiamos de sistemas de co-ordenadas. Aun cuando todas las definiciones que daremos, así como suspropiedades, son generales, nos restringiremos exclusivamente a transforma-ciones de Lorentz, pero mantendremos en lo posible una notación general.

Definición 8.1 Sean Σ y Σ0 dos sistemas de referencia inerciales y seanxµ = (x0, x1, x2, x3) y x0µ = (x00, x01, x02, x03) las coordenadas de un eventofísico medidas en Σ y Σ0 respectivamente. Entonces una transformación deLorentz de las coordenadas está definida como:

xµ 7−→ x0µ = Λµνxν (7.1)

tal que el producto punto Minkowskiano queda invariante bajo esta trans-formación de coordenadas.

Definición8.2 Un escalar de Lorentz es una cantidad (en general unafunción de las coordenadas) que es invariante bajo transformaciones deLorentz.

Ejemplos de escalares de Lorentz son: la masa propia de una partícula, elintervalo de tiempo propio entre dos eventos, la norma de todo cuadri-vector,el producto interno de cuadri-vectores, etc.

Definición 8.3 Un cuadri-vector (c-v) V es una cantidad cuyas com-ponentes, que denotaremos por V µ, µ = 0, 1, 2, 3, medidas por el observadorinercial Σ, se transforman bajo una transformación de Lorentz de las co-ordenadas (ecuación (7.1)), de la misma manera que las coordenadas, es

Page 131: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

7.2. DEFINICIONES FUNDAMENTALES 121

decir:V 0µ = ΛµνV

ν (7.2)

donde V 0µ denota las componentes del cuadri-vector V medidas en el sis-tema de referencia Σ0. A las cantidades V µ se le llaman las componentescontravariantes del cuadri-vector V. Esta denominación de las componentescontravariantes será justificada más adelante.

Ejemplos de c-v contravariantes son: el c-v posición x, cuyas componentesson las coordenadas de un evento físico, las diferenciales de coordenadas dxµ,la c-velocidad Uµ, la c-aceleración Aµ, el c-momentum pµ, la c-fuerza fµ,etc.

Las componentes de un c-v V µ y V 0µ relacionadas por una transforma-ción de Lorentz, representan el mismo objeto matemático ”medido” en dossistemas de referencia inerciales Σ y Σ0 respectivamente. Asi V es el c-v yV µ son las componentes de V en el sistema Σ y V 0µ sus componentes en elsistema Σ0.

Definición 8.4 Un tensor T de segundo orden dos veces contravariante,es un conjunto de 16 componentes Tµν ;µ, ν = 0, 1, 2, 3medidas en un sistemade referencia Σ, tales que bajo una transformación de Lorentz (ecuación(7.1)) sus componentes se transforman como:

T 0µν = ΛµαΛνβT

αβ (7.3)

donde T 0µν denota las componentes del tensor T en el sistemade referenciaΣ0.

Definición 8.5 La definición anterior se generaliza al caso de un tensorT contravariante de orden r, como un objeto de 4r componentes, medidasen un sistema de referencia Σ, cuyas componentes se transforman bajo unatransformación de Lorentz (7.1) en la forma:

T 0µ1µ2...µr = Λµ1ν1 Λµ2ν2 · · · ΛµrνrT ν1ν2...νr (7.4)

Así, podemos definir un tensor de orden cero como un escalar y un tensorcontravariante de orden uno como un c-vector.

En el siguiente capítulo veremos ejemplos de tensores de segundo ordencon significado físico, tales como el tensor campo electromagnético y el ten-sor energía-momentun. Por ahora trabajaremos con estas cantidades comoobjetos matemáticos abstractos, sin asignarles ningún significado. Es de an-otar que en física no aparecen cantidades que se describan por tensores deorden mayor al segundo, salvo en el caso de la Teoría General de la Rela-tividad, en donde se requiere del tensor de Riemann, el cual es un tensor

Page 132: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

122 CAPÍTULO 7. TENSORES

de cuarto orden y cuyo significado está ligado al concepto geométrico decurvatura de la variedad espacio-tiempo.

7.2.1. Componentes covariantes

Las transformaciones de Lorentz las definimos como el conjunto de trans-formaciones de coordenadas, tales que dejen invariante el intervalo espacio-tiempo (ver capítulo 4, ecuaciones (3.25) a la (3.30)), es decir, si xµ yxµ + dxµ, son las coordenadas de dos eventos físicos medidas por un ob-servador inercial Σ, entonces la distancia espacio-tiempo entre estos doseventos, definida como:

ds2 = ηµνdxµdxν (7.5)

es invariante bajo una transformación de coordenadas, es decir:

ds2 = ηµνdxµdxν = ηµνdx

0µdx0ν (7.6)

en donde la matriz de Minkowski η (llamado también tensor métrico deMinkowski, por las razones que veremos en seguida) está definido por:

ηµν :=

1; si µ = ν = 0−1; si µ = ν = 1, 2, 30; si µ 6= ν

(7.7)

Así, para que bajo una transformación de Lorentz el escalar de Lorentzds2 permanezca invariante, esto es:

ds2 = ηµνdx0µdx0ν = ηµνΛ

µαΛ

νβdx

αdxβ = ηαβdxαdxβ (7.8)

se debe cumplir que la matriz de Minkowski satisfaga la relación:

ηαβ = ΛµαΛ

νβηµν (7.9)

Como el determinante de la matriz de Minkowski es diferente de cero,i.e., det(ηαβ) = −1, entonces existe la matriz de transformación inversa(ηαβ)

−1, cuyas componentes que denotaremos por ηαβ, satisfacen la sigui-ente relación:

ηη−1 = 1 (7.10)

la cual, escrita en términos de componentes toma la forma:

ηαβηβσ = δ σ

α (7.11)

Page 133: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

7.2. DEFINICIONES FUNDAMENTALES 123

en donde δ σα son los elementos de la matriz identidad.

Los elementos de la matriz inversa de Minkowsky coinciden numérica-mente con ηαβ, como se puede probar directamente. Además, la matriz deMinkowski y su inversa son matrices simétricas, i.e. ηαβ = ηβα y η

αβ = ηβα.Por otra parte, la inversa de una transformación de Lorentz está dada

por:xµ = Λ µ

ν x0ν (7.12)

conΛ µν = (Λ

µν)−1 ⇐⇒ Λ ε

ν Λνµ = δ ε

µ (7.13)

Los elementos de la transformación inversa de Lorentz se pueden obtenera partir de la relación:

Λ µν = ηνγη

µδΛγδ (7.14)

puesΛ µν Λνδ = ηνγη

µβΛγβΛνδ = η δη

µ = δ µδ (7.15)

en donde se ha hecho uso de la ecuación (7.9). Por ejemplo, si considera-mos el caso particular de una transformación de Lorentz entre sistemas dereferencia inerciales Σ y Σ0, con ejes espaciales paralelos y v la velocidad deΣ0 en la dirección del eje x positivo, entonces los elementos de la matriz detransformación de Lorentz están dados por (ver la ecuación (3.40))

Λαβ =

γ −βγ 0 0−βγ γ 0 00 0 1 00 0 0 1

(7.16)

por lo tanto aplicando la relación (7.14), tenemos

Λ µν = ηνγη

µδΛγδ =

γ βγ 0 0βγ γ 0 00 0 1 00 0 0 1

(7.17)

la cual corresponde a la transformación del sistema de referencia Σ0 al Σ,que equivale como vimos en el capítulo 3, a cambiar la velocidad v por −v.

Definición 8.6 Definamos las “componentes” covariantes de un c-v Vcomo

Vα := ηαβVβ (7.18)

Page 134: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

124 CAPÍTULO 7. TENSORES

Esta definición tiene sentido, pues dado que la matriz de Minkowskiηαβ posee una inversa, la relación entre las componentes contravariantes ycovariantes de un c-v es una relación biyectiva (uno a uno y sobre) y porlo tanto es un isomorfismo, es decir, dadas las componentes contravariantesV µ de un c-v, sus componentes covariantes Vν están unívocamente definidas(ecuación (7.18)) y viceversa; es decir, dadas las componentes covariantesVµ, entonces sus correspondientes componentes contravariantes se obtienende la transformación inversa, así

V µ = ηµνVν (7.19)

Este resultado nos permite identificar a las componentes covariantes Vνy a las contravariantes V µ de un c-v, como representaciones de un mismoobjeto abstracto V.

Podemos generalizar esta operación, que se conoce en el marco del análi-sis tensorial como subir y bajar índices, al caso de tensores de cualquierrango. Así por ejemplo, las componentes covariantes de un tensor de se-gundo orden están relacionadas con sus componentes contravariantes por laecuación:

Tµν = ηµαηνβTαβ (7.20)

o también, podemos definir las componentes de un tensor de segundo ordenuna vez contravariante y una vez covariante, con las siguientes posibilidades:

Tαβ = ηβµT

αµ ; T βα = ηµαT

µβ (7.21)

De esta forma, Tαβ, Tµν , Tαβ, y T β

α son todas diferentes representa-ciones de un mismo tensor de segundo rango T. Es importante anotar queel orden de los índices en una ecuación tensorial debe ser preservado, dadoque en general Tαβ 6= T βα y por esta razón las componentes mixtas Tα

β y

T βα del tensor T son diferentes en general.Para encontrar como se transformanlas componentes covariantes de cualquier

tensor, bajo una transformación de Lorentz, consideremos primero el casoparticular de un c-v:

V 0µ = ΛµνVν =⇒ V 0α = ηαµV

0µ = ηαµΛµνV

ν (7.22)

Ahora, de la relación (7.14) multiplicándola por ηβµ a ambos lados ysumando sobre el índice µ, obtenemos

ηβµΛµ

ν = ηβµηνγηµδΛγδ = ηνγδ

δβΛ

γδ = ηνγΛ

γβ (7.23)

Page 135: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

7.2. DEFINICIONES FUNDAMENTALES 125

Remplazando esta relación en el último término de la ecuación (7.22),tenemos

V 0α = ηνµΛµ

α V ν = Λ µα Vµ (7.24)

Esta ecuación nos da la ley de transformación de las componentes co-variantes de un c-v.

De lo visto hasta ahora, es fácil generalizar esta ecuación para obtener laley general de transformación de las componentes covariantes y contravari-antes de un tensor cualquiera T, r-veces contravariante y s-veces covariante:

T0µ1µ2...µrγ1γ2...γs = Λ

µ1ν1 Λ

µ2ν2 · · · ΛµrνrΛ δ1

γ1Λ δ2γ2· · · Λ δr

γrT ν1ν2...νrδ1δ2...δs

(7.25)

7.2.2. Algebra tensorial

Denotemos por Πrs el conjunto de todos los tensores Tν1ν2...νrδ1δ2...δs

de ordenn = r + s, r-veces contravariante y s-veces covariante. Así, en esta notaciónun escalar es un elemento de Π00, un c-vector contravariante es un elementode Π10 y uno covariante de Π

01, etc.

Definición 8.7 Suma de tensores: Dados dos tensores T,S ∈ Πrs defini-mos la suma y la multiplicación por un escalar λ ∈ R, por:

Qν1ν2...νrδ1δ2...δs

:= (T + S)ν1ν2...νrδ1δ2...δs:= T ν1ν2...νr

δ1δ2...δs+ Sν1ν2...νr

δ1δ2...δs(7.26)

P ν1ν2...νrδ1δ2...δs

:= (λT )ν1ν2...νrδ1δ2...δs:= λT ν1ν2...νr

δ1δ2...δs(7.27)

Notemos que estas operaciones no son más que la generalización directade la suma y el producto por un escalar de vectores cartesianos, en donde elvector resultante de estas operaciones se obtiene como la suma componentea componente y por el producto del escalar por cada componente del vector.

Cuando se define una opreación con tensores, hay que demostrar que estaoperación está bien definida, es decir, que la operación preserva el caractertensorial. Esto significa que por ejemplo, para las operaciones definidas en lasecuaciones (7.26) y (7.27), para la suma y multiplicación por un escalar detensores de un mismo rango, las componentes resultantes Qν1...νr

δ1...δsy P ν1...νr

δ1...δsse transforman efectivamente como las componentes de un tensor del tipo¡rs

¢n, es decir:T,S ∈ Πrs =⇒ Q = T+ S ∈ Πrs y P =λT ∈ Πrs (7.28)

Page 136: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

126 CAPÍTULO 7. TENSORES

La demostración general de este resultado es muy sencilla y por estarazón ilustraré el método para el caso particular de un tensor mixto desegundo rango. Sean T,S ∈ Π11 con componentes para un observador inercialΣ dadas por Tα

β y Sαβ respectivamente y sea

Qαβ = Tα

β + Sαβ (7.29)

Debemos probar que bajo una transformación de coordenadas, las compo-nentes Qα

β se transforman como un tensor del tipo Π11. Así, para un sistema

de referencia Σ0 tenemos, aplicando la ley de transformación (7.25) para lascomponentes de los tensores T 0αβ y S

0αβ ,

Q0αβ = T 0αβ + S0αβ= ΛανΛ

µβ T ν

µ + ΛανΛ

µβ Sν

µ

= ΛανΛµ

β (T νµ + Sν

µ)

= ΛανΛµ

β Qαβ (7.30)

lo cual implica que las cantidades Qαβ se transforman como las componentes

de un tensor del tipo Π11, como se quería probar. Un procedimiento similarse puede hacer para el producto de un escalar por un tensor.

Este resultado muestra que el conjunto de todos los tensores del tipo¡rs

¢n forman un espacio vectorial.Definición 8.8 Producto tensorial: Dados dos tensores T ∈ Πrs y S ∈

Πpq , definimos el producto tensorial como:

Wν1ν2...νrνr+1...νr+pδ1δ2...δsδs+1...δs+q

:= T ν1ν2...νrδ1δ2...δs

Sνr+1νr+2...νr+pδs+1δs+2...δs+q

(7.31)

el cual es un tensor de Πr+ps+q

¡r+ps+q

¢, es decirW ∈ Πr+ps+q .

Esta operación no tiene su correspondiente en el cálculo vectorial ordi-nario y representa lo que en álgebra matricial se llama un producto direc-to. Como en el caso anterior, hay que probar que esta operación está biendefinida y para este fin consideremos el caso particular del producto de dosc-vectores, uno covariante y el otro contravariante. Sea T ∈ Π10 y llamem-os sus componentes Tµ, y S ∈ Π01 con componentes Sµ. Entonces, de ladefinición 8.8 el producto está dado por

Wµν = TµSν (7.32)

y debemos probar que las componentes del producto Wµν se transforman

como:W 0µ

ν = ΛµαΛ

βν W

αβ (7.33)

Page 137: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

7.2. DEFINICIONES FUNDAMENTALES 127

de acuerdo con la ecuación (7.25). Sean T 0µ y S0ν las componentes de losc-vectores T y S medidas en el sistema de referencia Σ0, entonces en estesistema de referencia las componentes del producto están dadas por:

W 0µν = T 0µS0ν (7.34)

Puesto que T y S son c-vectores, sus componentes se transforman deacuerdo con la relación:

T 0µ = ΛµαTα ; S0ν = Λ

βν Sβ (7.35)

Remplazando estas expresiones en la ecuación (7.34), tenemos

W 0µν = T 0µS0ν = Λ

µαT

αΛ βν Sβ = Λ

µαΛ

βν T

αSβ = ΛµαΛ

βν W

αβ (7.36)

como se quería demostrar.La siguiente operación que vamos a definir es fundamental en el cálculo

tensorial, pues nos permite obtener a partir de un tensor dado de rangon, un tensor de rango n − 2. Así, si partimos de un tensor de rango par,por aplicaciones sucesivas de esta operación, podemos obtener un tensor derango cero, es decir un escalar de Lorentz o en términos más físicos, uninvariante relativista.

Definición 8.9 Contracción de Indices: Dado un tensor T ∈ Πr1s defin-imos la contracción del índice contravariante αi (1 ≤ i ≤ r) con el índicecovariante βj (1 ≤ j ≤ s) por:

C(αi)(βj)

(Tα1α2...αi...αrβ1β2...βj ...βs

) := Tα1α2...σ...αrβ1β2...σ...βs

∈ Πr−1s−1 (7.37)

Es decir, dado un tensor mixto de orden n = r + s, r − veces con-travariante y s − veces covariante, al sumar sobre dos índices repetidos,uno contravariante y otro covariante, obtenemos un tensor de orden n− 2,r− 1− veces contravariante y s− 1− veces covariante. Para demostrar queesta operación está bien definida consideremos, sin pérdida de generalidad,un tensor de de rango 4, 2 − veces contravariante y 2 − veces covarianteTαβγδ ∈ Π22 y contraigamos por ejemplo, el primer índice contravariante conel segundo covariante:

C(α)(δ) (T

αβγδ ) = T σβ

γσ := T βγ ∈ Π11 (7.38)

Entonces, veamos que las componentes que resultan T βγ , después de real-

izada la operación de contracción, se transforman como las componentes de

Page 138: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

128 CAPÍTULO 7. TENSORES

un tensor mixto de rango 2. Si denotamos como es costumbre, por cantidadesprimadas las componentes de los tensores en el sistema de referencia Σ0 yaplicamos las correspondientes leyes de transformación de tensores, tenemosentonces

T 0 βγ = T 0λβγλ = ΛλσΛβηΛ

µγ Λ

ϑλ T

σβµϑ

= δϑσΛβηΛ

µγ T

σβµϑ = Λ

βηΛ

µγ T

σηµσ

= ΛβηΛµγ T

ηµ (7.39)

lo cual demuestra que la operación de contracción de índices está bien defini-da. En la segunda igualdad hemos utilizado la ley de transformación parael tensor T 0λβγλ , la cual se aplica independientemente del hecho que el tensortenga dos índices repetidos sobre los cuales se suma. Para obtener la terceraigualdad se ha utilizadoel hecho que los elementos de la transformación Λλσy Λ ϑ

λ , corresponden a la transformación de Lorentz de Σ a Σ0 y a su inversa

respectivamente y por lo tanto satisfacen la relación (7.15). Finalmente, alsumar sobre el índice repetido ϑ, por la definición de la delta de Kroneckerδϑσ, todos los términos son cero, salvo aquel para el cual ϑ = σ, obteniendosede esta forma la cuarta iguldad.

Antes de continuar con otras operaciones entre tensores, mostremos quelas componentes de la matriz de Minkowski ηαβ, su inversa ηαβ y la deltade Kronecker δβα son tensores de segundo rango, lo que justifica el nombrede tensor métrico de Minkowski y además ηαβ, η

αβ y δβα corresponden adiferentes representaciones del mismo objeto matemático, el tensor métricoη, con la particularidad que las componentes de este tensor métrico tomanlos mismos valores numéricos en todos los sistemas de referencia inerciales.El papel especial de este objeto matemático lo podemos ver, si retornamosa la definición del intervalo espacio-tiempo entre dos puntos de la variedadespacio-tiempo:

ds2 = ηµνdxµdxν (7.40)

El escalar ds2 es obtenido a partir del producto de tres tensores (ηµν , dxµ

y dxν) seguida de una doble contracción sobre índices, y por lo visto hastaahora, estas operaciones están bien definidas. También, podemos probardirectamente el carácter tensorial de η, pues dado que ds2 es un invariante,

Page 139: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

7.2. DEFINICIONES FUNDAMENTALES 129

entonces

ds2 = η0µνdx0µdx0ν

= Λ αµ Λ

βν Λ

µγΛ

νϑηαβdx

γdxϑ

= δαγ δβϑηαβdx

γdxϑ

= ηαβdxαdxβ (7.41)

en donde hemos denotado por η0µν a las componentes del tensor métricomedidas en el sistema de referencia Σ0, las cuales están relacionadas con suscomponentes en el sistema Σ por:

η0µν = Λαµ Λ

βν ηαβ (7.42)

Un cálculo directo, aplicando las propiedades de las transformaciones deLorentz, muestra que las componentes del tensor η en el sistema Σ0 coincidencon sus componentes en Σ. Un procedimiento similar se puede seguir paraprobar que ηαβ y δαβ también se transforman como tensores de segundo rango(dos veces contravariante y mixto respectivamente) y que sus componentesson las mismas en todos los sistema de referencia inerciales.

Un caso particular que surge de la combinación de las operaciones, pro-ducto tensorial y contracción de índices, es la generalización de la Defini-ción 8.6, llamada subir y bajar índices, pues el producto tensorial del tensormétrico η de segundo orden (sea de sus componentes contravariantes ηµν ,covariantes ηµν o mixtas δµν ) con un tensor cualquiera T de orden n, seguidade una contracción de índices, produce de nuevo un tensor de orden n; porejemplo, consideremos un tensor T de cuarto orden del tipo Π22. Al mul-tiplicar este tensor T por el tensor métrico ηαβ ∈ Π20, produce un tensordel tipo Π42, que al contraer dos índices conduce a otro tensor del tipo Π

31.

Resumiendo tenemos:ηµνT σβ

γν = T σβµγ (7.43)

Otro caso particular de la combinación de estas dos operaciones tenso-riales, producto tensorial seguida de una contracción, es el producto puntode dos c-vectores, pues

V · V = ηµνVµV ν = ηµνVµVµ = δµνV

νVµ = V µVµ (7.44)

Por ejemplo, consideremos el c-vector momentun p de una partícula demasa en reposo m0, cuyas componentes contravariantes en algún sistema dereferencia inercial Σ, están dadas por pµ = (p0, p1, p2, p3) ≡ (E/c, px, py, pz).

Page 140: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

130 CAPÍTULO 7. TENSORES

Entonces podemos calcular sus correspondientes componentes covariantesen este sistema como

pα = ηαβpβ = (p0, p1, p2, p3) = (E/c,−px,−py,−pz) (7.45)

Aplicando ahora cualquiera de las expresiones dadas en la ecuación(7.44), obtenemos que su norma al cuadrado está dada por

p2 = p · p = E2/c2 − p2x − p2y − p2z = m20c2 (7.46)

7.2.3. Propiedades de simetría de tensores

En esta sección definiremos los conceptos de tensores simétricos y anti-simétricos e introduciremos la operación tensorial de simetrización (y anti-simetrización) de las componentes de un tensor, la cual es de utilidad parageneralizar algunas operaciones del cálculo vectorial usual, como veremos enla última sección del presente capítulo.

Definición 8.10 Un tensor T de segundo rango del tipo Π20, con com-ponentes Tαβ en un sistema de referencia Σ, se llama simétrico si

Tαβ = T βα (7.47)

y antisimétrico siTαβ = −T βα (7.48)

Esta definición es válida también, para las componentes covariantes de untensor de segundo rango y puede ser generalizada a cualquier par de índicesde un tensor de rango n ≥ 2. Por ejemplo, para un tensor R de cuarto rangodel tipo Π04, simétrico en su primera y tercera componente y antisimétricoen la segunda y cuarta componente, se tiene que

Rαβγδ = Rγβαδ ; Rαβγδ = −Rαδγβ (7.49)

Es fácil probar, a partir de las propiedades de transformación de lascomponentes, que el carácter simétrico o antisimétrico de un tensor es in-dependiente del sistema de referencia, pues si Tαβ = T βα en un sistema dereferencia Σ, entonces de las propiedades de transformación (ecuación (7.3))tenemos

T 0µυ = ΛµαΛνβT

αβ = ΛµαΛνβT

βα = ΛνβΛµαT

βα = T 0νµ (7.50)

como se quería probar.

Page 141: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

7.2. DEFINICIONES FUNDAMENTALES 131

Dado un tensor de segundo rango con componentes Tαβ en un sistema dereferencia, siempre se puede escribir este tensor como la suma de un tensorsimétrico más uno antisimétrico, es decir

Tαβ = Sαβ +Aαβ (7.51)

con Sαβ = Sβα y Aαβ = −Aβα. Para demostrar esta afirmación basta contomar

Sαβ :=1

2(Tαβ + T βα) (7.52)

y

Aαβ :=1

2(Tαβ − T βα) (7.53)

en donde al tensor Sαβ se le llama la parte simétrica del tensor Tαβ y altensor Aαβ su parte antisimétrica. Claramente estas mismas relaciones sonválidas para índices covariantes. De estas ecuaciones ( (7.52) y (7.53)) sededuce además, que un tensor es simétrico si su parte antisimétrica es ceroy es antisimétrico si su parte simétrica es cero:

Tαβ = T βα ⇐⇒ Aαβ =1

2(Tαβ − T βα) = 0 (7.54)

Tαβ = −T βα ⇐⇒ Sαβ =1

2(Tαβ + T βα) = 0 (7.55)

Un ejemplo de un tensor simétrico es el tensor métrico de Minkowski,pues por su definición ηαβ = ηβα.

Las ecuaciones (7.52) y (7.53) nos conducen a la siguiente definición dedos nuevas operaciones tensoriales:

Definición 8.11 Dado un tensor T de segundo rango del tipo Π20, concomponentes Tαβ en un sistema de referencia Σ, definamos un nuevo tensorque lo denotaremos como T (αβ), por la operación

T (αβ) :=1

2(Tαβ + T βα) (7.56)

el cual por definición es simétrico, es decir T (αβ) = T (βα). A esta operaciónse le conoce en la literatura como simetrización de un tensor. Claramente,si el tensor Tαβ es simétrico, entonces el tensor simetrizado coincide con eltensor original, esto es T (αβ) = Tαβ y si el tensor Tαβ es antisimétrico, eltensor simetrizado es cero: T (αβ) = 0.

Similarmente, definimos la operación de antisimetrización de un tensordado Tαβ, que lo denotaremos como T [αβ], por:

T [αβ] :=1

2(Tαβ − T βα) (7.57)

Page 142: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

132 CAPÍTULO 7. TENSORES

De la misma manera se tiene que si un tensor Tαβ es simétrico, entoncesel tensor antisimetrizado es cero y si Tαβ es antisimétrico, entonces T [αβ] =Tαβ. Claramente estas operaciones son válidas también para tensores deltipo Π02.

Tanto las definiciones de simetría y antisimetría dadas (Definición 8.10),así como las operaciones de simetrización y antisimetrización (Definición8.11), se pueden generalizar a tensores de orden mayor. Antes de consider-ar este problema, se introducirán algunos elementos básicos de la teoría depermutaciones.

Consideremos el conjunto {1, 2, ..., r} de los r primeros números natu-rales y denotemos por (n1, n2, ..., nr) un arreglo ordenado de ellos, sin queninguno se repita. Existen entonces r! = 1 · 2 · 3 · ... · r formas diferentesde ordenar en este arreglo los r pimeros números naturales. Por ejemplo, sitomamos el conjunto {1, 2, 3}, podemos construir 3! = 6 arreglos diferentes:

(1, 2, 3); (1, 3, 2); (2, 1, 3); (2, 3, 1); (3, 1, 2); (3, 2, 1) (7.58)

Dado un arreglo (n1, n2, ..., nr), definimos una permutación Pσ sobreeste arreglo, como el arreglo obtenido al permutar los elementos del arreglooriginal. Denotaremos simbólicamente esta operación de permutación por

Pσ(n1, n2, ..., nr) = (nσ(1), nσ(2), ..., nσ(r)) (7.59)

en donde σ es una función (uno a uno y sobre)

σ : {1, 2, ..., r} −→ {1, 2, ..., r}ni 7−→ σ(ni) = nj

(7.60)

Por ejemplo, el arreglo (3, 2, 1) se puede obtener a partir del primer arreglo(1, 2, 3) permutando los números 1 y 3:

Pσ(1, 2, 3) ≡ Pσ(n1, n2, n3) = (nσ(1), nσ(2), nσ(3)) = (3, 2, 1) (7.61)

Definamos ahora una transposición como una permutación

Pni↔ni+1 (7.62)

obtenida, al permutar dos números consecutivos ni y ni+1 del arreglo origi-nal:

Pni↔ni+1(n1, n2, ..., ni, ni+1, ..., nr) = (n1, n2, ..., ni+1, ni, ..., nr) (7.63)

Page 143: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

7.2. DEFINICIONES FUNDAMENTALES 133

Claramente, cualquier arreglo de los números {1, 2, ..., r} se puede obtenerpor una permutación Pσ sobre un arreglo dado, incluyendo como caso par-ticular, la permutación identidad que no cambia el arreglo original. Además,cualquier permutación dada se puede obtener aplicando sucesivamente trans-posiciones. Es decir, toda permutación se puede descomponer, o factorizar,como el producto de transposiciones:

Pσ = Pni↔ni+1Pnj↔nj+1 · · · Pnk↔nk+1 (7.64)

En el ejemplo ilustrado en la ecuación (7.58), se puede obtener el segundoarreglo (1, 3, 2) a partir del primer arreglo (1, 2, 3), aplicando la transposiciónP2↔3, esto es:

P2↔3(1, 2, 3) = (1, 3, 2) (7.65)

pero también es posible obtener este mismo arreglo en otra forma, por apli-cación sucesiva de las transposiciones siguientes:

P3↔1P2↔1P2↔3P1↔3P1↔2(1, 2, 3) = P3↔1P2↔1P2↔3P1↔3(2, 1, 3)= P3↔1P2↔1P2↔3(2, 3, 1)= P3↔1P2↔1(3, 2, 1)= P3↔1(3, 2, 1)= (1, 3, 2) (7.66)

Este ejemplo muestra que no hay una única forma de obtener una per-mutación dada por transposiciones sucesivas. Sin embargo, el número definidopor:

(−1)Nσ =

½+1 si Nσ es par−1 si Nσ es impar

(7.67)

sí es independiente de las transposiciones realizadas para obtener la per-mutación dada. Este número es llamado el signo de la permutación, siendoNσ igual al número de las transposiciones realizadas. Esto significa que siuna permutación dada se factoriza en un número par (impar) de transposi-ciones, entonces, cualquier otra factorización de la misma permutación, con-tendrá también un número par (impar) de transposiciones. Una permutaciónse llama par(impar) si el signo es +1(−1). Así en nuestro ejemplo anteri-or, la permutación Pσ(1, 2, 3) = (1, 3, 2) se puede escribir en términos detransposiciones, como Pσ = P2↔3, en cuyo caso Nσ = 1 y el signo de lapermutación es (−1)Nσ = −1, o también se puede factorizar en la formaPσ = P3↔1P2↔1P2↔3P1↔3P1↔2, con Nσ = 5 y por lo tanto el mismo signode la permutación (−1)5 = −1.

Page 144: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

134 CAPÍTULO 7. TENSORES

Con estos elementos básicos de la teoría de permutaciones, podemosextender las operaciones anteriores de simetrización y antisimetrización atensores de orden superior.

Definición 8.12 Dado un tensor T de rango r del tipo Πr0, con com-ponentes Tα1···αr en un sistema de referencia Σ, definamos dos nuevos ten-sores, uno completamente simétrico en todos sus índices que denotaremoscomo T (α1···αr) y el otro completamente antisimétrico en todos sus índicesque denotaremos como T [α1···αr], por las operaciones

T (α1···αr) :=1

r!

XPσ

TPσ(α1···αr) (7.68)

T [α1···αr] :=1

r!

XPσ

(−1)NσTPσ(α1···αr) (7.69)

en donde la suma se realiza sobre todas las permutaciones de los índices(α1, · · ·, αr). La misma definición vale para índices covariantes.

Por ejemplo, consideremos un tensor Tαβγ del tipo Π03 y construyamoslos tensores T(αβγ) y T[αβγ] por las operaciones definidas en las ecuaciones(7.64) y (7.69):

T(αβγ) :=1

3!(Tαβγ + Tαγβ + Tβαγ + Tβγα + Tγαβ + Tγβα) (7.70)

T[αβγ] :=1

3!(Tαβγ − Tαγβ + Tβγα − Tβαγ + Tγαβ − Tγβα) (7.71)

Es fácil comprobar directamente que el nuevo tensor T(αβγ) es comple-tamente simétrico bajo cualquier permutación de sus índices; por ejemploT(031) = T(013) = etc, mientras que el tensor T[αβγ] es completamente anti-simétrico bajo permutación de sus índices, pues por ejemplo T[031] = −T[013],pero T[031] = T[310] dado que en el primer caso los índices [013] correspondena una permutación par de los índices originales [031], mientras que en elsegundo caso el arreglo de índices [310] es una permutación par del arreglooriginal [031]. Notemos que las definiciones dadas para tensores de segundorango son un caso particular de la Definición 8.12. Un ejemplo de estaoperación de antisimetrización de tensores, lo constituye la generalizacióndel producto cruz usual del cálculo vectorial tridimensional.

SeanAα yBβ las componentes de dos c-vectores en un sistema de referen-cia Σ. Definamos un nuevo vector como el producto tensorial antisimetrizadode estos dos c-vectores:

Cαβ := A[αBβ] =1

2{AαBβ −AβBα} (7.72)

Page 145: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

7.2. DEFINICIONES FUNDAMENTALES 135

Un tensor de segundo rango Cαβ en n dimensiones tiene n2 componentesindependientes. En el caso particular de las 4 dimensiones del espacio-tiempon2 = 16 componentes independientes. Si el tensor es simétrico entoncesCαβ = Cβα y su número de componentes independientes se reduce a:

n2 − n

2+ n =

n(n+ 1)

2(7.73)

Ahora, si el tensor es antisimétrico Cαβ = −Cβα su número de compo-nentes independientes está dado por:

n2 − n

2=

n(n− 1)2

(7.74)

pues en este caso las componentes con índices repetidos son cero. En el casode vectores tridimensionales cartesianos n = 3, y por lo tanto el número decomponentes independientes de un tensor antisimétrico de segundo rangoes tres. Así, podemos identificar a las tres componentes independientes quesurgen de la operación definida en la ecuación (7.72), a su vez con las com-ponentes de un nuevo vector, el cual se conoce como el producto cruz delcálculo vectorial usual. Notemos que esta identificación no es posible paraotras dimensiones del espacio, pues por ejemplo, en cuatro dimensiones elnúmero de componentes independientes de un tensor antisimétrico de se-gundo rango es de seis y por lo tanto estas componentes no pueden seridentificadas con las componentes de nigún c-vector.

Para finalizar esta sección consideraremos un ejemplo especial de untensor de cuarto rango completamente antisimétrico, el cual jugará un papelimportante en el capítulo octavo sobre las ecuaciones de Maxwell. Definamosel tensor εαβγδ, llamado tensor de Levi-Civita, por la ecuación:

εαβγδ :=

+1 si αβγδ es permutacion par de 0123−1 si αβγδ es permutacion impar de 0123

0 en los demas casos(7.75)

Este tensor, al igual que el tensor métrico de Minkowski, tiene la partic-ularidad que en todos los sistemas de referencia inerciales sus componentestienen el mismo valor numérico. Para probar que εαβγδ es un tensor con estacaracterística, se debe mostrar que sus componentes se transforman, bajouna transformación de Lorentz, en la forma

ε0αβγδ = ΛαµΛβνΛ

γσΛ

δρε

µνσρ ≡ εαβγδ (7.76)

Page 146: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

136 CAPÍTULO 7. TENSORES

Para esto, es suficiente notar lo siguiente: si en la ecuación anterior reem-plazamos los índices α, β, γ y δ por 0, 1, 2 y 3 respectivamente, entonces laecuación (7.76) toma la forma

1 = ε0123 = Λ0µΛ1νΛ

2σΛ

3ρε

µνσρ = det |Λ| (7.77)

De lo visto en el capítulo 3 sobre las propiedades de las transformacionesde Lorentz, es fácil deducir que toda transformación de Lorentz propia,es decir que no involucra inversión de los ejes espaciales o inversión de lacoordenada temporal, tiene determinante igual a 1. Así, la ecuación (7.77)es una identidad y por lo tanto las componentes εαβγδ del tensor de Levi-Civita deben transformarse de acuerdo con la ecuación (7.76), como se queríamostrar.

7.3. Transformación general de coordenadas

Antes de continuar con la generalización de los operadores vectorialesusuales del cálculo diferencial (gradiente, divergencia y rotacional), veamosel caso general de transformaciones de coordenadas que contienen, lógica-mente, el caso particular de las transformaciones de Lorentz que hemosconsiderado hasta ahora.

Sean Σ y Σ0 dos sistemas de referencia y llamemos xµ y x0ν las coorde-nadas de un punto medidas en los sistemas de referencia Σ y Σ0 respectiva-mente. Supongamos, sin pérdida de generalidad, que nuestro espacio es decuatro dimensiones. Entonces, un cambio general de coordenadas entre lossistemas Σ y Σ0 se puede expresar como un conjunto de cuatro ecuaciones,en donde las nuevas coordenas primadas son funciones continuas, con in-versa continua, de las coordenadas no primadas. Así la transformación decoordenadas y su inversa, se pueden escribir como:

x0µ = x0µ(xα) (7.78)

xβ = xβ(x0ν) (7.79)

Notemos que si exigimos que las transformaciones de coordenas seanlineales, entonces estas ecuaciones se reducen a la forma:

x0µ = Λµ αxα (7.80)

xβ = Λ βν x0ν (7.81)

Page 147: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

7.3. TRANSFORMACIÓN GENERAL DE COORDENADAS 137

con los coeficientes de la transformaciones Λµα (y los de la transformación in-versa Λ β

ν ) constantes, independientes de las coordenadas. Las componentesdel vector desplazamiento infinitesimal dx en el sistema de coordenadas Σestán dadas por dxµ = (dx0, dx1, dx2, dx3), mientras que las correspondi-entes componentes medidas en Σ0 son dx0ν = (dx00, dx01, dx02, dx03). Paraencontrar la relación entre las componentes del vector dx en los dos sis-temas, basta con tomar la diferencial total de cada una de las funciones enlas ecuaciones (7.78) y (7.79), así:

dx0µ =∂x0µ

∂xνdxν (7.82)

dxµ =∂xµ

∂x0νdx0ν (7.83)

Estas ecuaciones definen la ley de transformación (y su inversa) para lascomponentes de cualquier vector en los dos sistemas de referencia:

V 0µ =∂x0µ

∂xνV ν (7.84)

V µ =∂xµ

∂x0νV 0ν (7.85)

En el caso particular de transformaciones lineales (ecuaciones (7.80) y(7.81)), la ley de transformación para las componentes de un vector toma laforma:

V 0µ = Λµ νVν (7.86)

V µ = Λ µν V

0ν (7.87)

la cual se obtiene del caso general si hacemos la siguiente identificación:

Λµ ν =∂x0µ

∂xν(7.88)

Λ µν =

∂xµ

∂x0ν(7.89)

Finalmente, puesto que las transformaciones de coordenadas deben serinvertibles se debe cumplir que

∂x0µ

∂xα∂xα

∂x0ν= δµν (7.90)

Esta relación se obtiene directamente, si aplicamos la regla de la cadena paralas derivadas a la transformación idéntica x0µ(xα(x0ν)) ≡ x0µ, la cual para

Page 148: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

138 CAPÍTULO 7. TENSORES

el caso particular de transformaciones lineales, toma la forma Λµ αΛ αν = δµν .

Así, teniendo en cuenta las ecuaciones (7.88) y (7.89), toda el álgebra y losconceptos del cálculo tensorial desarrollados en este capítulo, para el casoparticular de transformaciones de Lorentz, son válidos para el caso más gen-eral de transformaciones arbitrarias de coordenadas. Las restricciones queimpongamos sobre el conjunto de transformaciones de coordenadas entresistemas, nos determinan las propiedades matemáticas (o físicas, según seael caso) del espacio sobre el cual estamos trabajando. Por ejemplo, si con-sideramos que los sistemas de referencia físicamente significativos son losinerciales y que el principio de la constancia de la velocidad de la luz enel vacío se cumple, entonces solamente las ecuaciones de transformación decoordenadas admisibles son aquellas que dejan el intervalo espacio-tiempoinvariante, obteniendo entonces el caso particular de transformaciones deLorentz que hemos estado considerando en este capítulo. Otra posibilidadsería por ejemplo, aceptar el principio de la constancia de la velocidad dela luz, pero postular que las leyes de la física son válidas en todos los sis-temas de referencia, séan inerciales o no. Para este caso más general ya noestamos restringidos a transformaciones de coordenadas lineales, como en elcaso anterior que corresponde a la relatividad especial, aún cuando se sigueexigiendo que el intervalo espacio-tiempo permanezca invariante, esto es

ds2 = gµνdxµdxν = g0αβdx

0αdx0β (7.91)

En este caso, bajo una transformación admisible de coordenadas, lascomponentes del tensor métrico (denotado ahora por g) son en general fun-ciones de las coordenadas y por tanto, a diferencia del tensor métrico deMinkowski, sus componentes varían de un sistema de coordenadas (o de ref-erencia) a otro. Este último ejemplo adquiere todo su significado en la teoríageneral de la relatividad, cuyo estudio está más allá del alcance del presentelibro.

7.4. Operadores vectoriales

En el cálculo vectorial usual sobre R3 se define el operador gradientecomo:

∇ = ( ∂∂x

,∂

∂y,∂

∂z) (7.92)

el cual al actuar sobre una función escalar produce un vector en la direc-ción del máximo cambio de la función. Por función escalar se entiende, una

Page 149: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

7.4. OPERADORES VECTORIALES 139

función de valor real y variable vectorial, es decir una función de la forma

f : R3 7−→ R (7.93)

tal que, a un vector x = (x, y, z) de R3 le asocia un número real f(x, y, z).Así, al actuar el operador gradiente ∇ sobre la función f(x, y, z) da comoresultado un vector sobre cada punto de R3, con sus componentes dadas por

∇f = (∂f∂x

,∂f

∂y,∂f

∂z) (7.94)

Si consideramos ahora una función vectorial F (x, y, z), es decir una fun-ción de valor vectorial y variable vectorial:

F : R3 7−→ R3 (7.95)

con componentes (Fx, Fy, Fz), entonces podemos hacer actuar el operadorgradiente sobre F en la forma

∇ · F = ∂Fx∂x

+∂Fy∂y

+∂Fz∂z

(7.96)

para obtener una función real llamada la divergencia. También es posibleobtener un vector a partir del operador gradiente, actuando éste sobre unafunción vectorial en la forma:

∇× F = (∂Fz∂y− ∂Fy

∂z,∂Fx∂z− ∂Fz

∂x,∂Fy∂x− ∂Fx

∂y) (7.97)

conocida como el rotacional de una función vectorial. Notemos que las tresoperaciones definidas a partir del operador ∇, el gradiente, la divergencia yel rotacional, se pueden considerar como una extención de las operacionesusuales del álgebra vectorial: el producto de un vector por un escalar, elproducto interno entre vectores y el producto cruz, respectivamente. Poresta razón es usual considerar para todos los efectos al operador ∇ como unvector, con el cual podemos construir todo tipo de operaciones permitidasdentro del cálculo vectorial usual, solamente teniendo presente el orden enel cual entra ∇ en la expresiones, pues el vector ∇ actua sobre funciones.Así por ejemplo, podemos construir expresiones tales como

∇2 = ∇ ·∇ = ∂2

∂x2+

∂2

∂y2+

∂2

∂z2(7.98)

conocida como el operador Laplaciano.

Page 150: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

140 CAPÍTULO 7. TENSORES

Definamos entonces el cuadri-vector gradiente∇ como un operador difer-encial, tal que al actuar sobre una función escalar de las coordenadas Φ(xµ),produce el c-vector ∇Φ, cuyas componentes en un sistema de referencia Σestán dadas por:

(∇Φ)µ = ( ∂Φ∂x0

,∂Φ

∂x1,∂Φ

∂x2,∂Φ

∂x3) (7.99)

A las componentes de ∇Φ las denotaremos también como ∂Φ/∂xµ, o ∂µΦ.Veamos entonces, que las componentes de ∇Φ se transforman como lascomponentes covariantes de un c-vector bajo una transformación de coorde-nadas. Sean xµ y x0ν las coordenadas de un evento, medidas en los sistemasde referencia Σ y Σ0 respectivamente y relacionadas por una transformaciónde Lorentz, entonces las componentes covariantes de un c-vector V, en losdos sistemas de referencia, están relacionadas por:

V 0µ = Λνµ Vν ≡

∂xν

∂x0µVν (7.100)

de acuerdo con las ecuaciones (7.88) y (7.89) de la sección anterior. Bajouna transformación de coordenadas por definición, una función escalar per-manece invariante, es decir Φ(xµ) = Φ(x0ν). Teniendo en cuenta que bajo latransformación de coordenadas se tiene x0µ = x0µ(xν) y aplicando la reglade la cadena a la función Φ(x0µ(xν)), obtenemos para las componentes deloperador gradiente, medidas en los dos sistemas de referencia, la relación

∇0Φ(x0µ) ≡ ∂Φ

∂x0µ=

∂xα

∂x0µ∂Φ

∂xα(7.101)

Puesto que esta relación es general e independiente de la función escalarΦ, podemos concluir que las componentes del operador gradiente se trans-forman, bajo un cambio de coordenadas, como las componentes covariantesde un c-vector, es decir

∂0µ = Λνµ ∂v (7.102)

A partir de esta definición, podemos construir los operadores de uso másfrecuente en física, siguiendo los mismos procedimientos que en el caso delcálculo vectorial tridimensional estandar. Consideremos un campo vectori-al Ψµ(xα), esto es, una función vectorial de las coordenadas y calculemosel producto interno Minkowskiano entre este campo vectorial y el vectorgradiente:

∇ ·Ψ = ∂νΨν (7.103)

que corresponde a la generalización del operador divergencia tridimensional.Un ejemplo de esta operación de uso muy frecuente en física, es la llamada

Page 151: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

7.4. OPERADORES VECTORIALES 141

ecuación de continuidad:

∂νΨν = 0 ⇐⇒ ∂ Ψ0

∂x0+ ∇Ψ = 0 (7.104)

en donde el simbolo ∇ significa el operador gradiente tridimensional. Clara-mente esta ecuación, por provenir de un producto interno entre c-vectores,es invariante bajo transformaciones de coordenadas, es decir

∂νΨν = 0 = ∂0νΨ

0ν (7.105)

lo que significa que la ecuación de continuidad escrita de esta manera, au-tomáticamente satisface el principio de relatividad. Ahora, si definimos unnuevo operador (conocido en la literatura como el D’Alembertiano ¤) comoel producto interno del operador gradiente consigo mismo, obtenemos unoperador que es un invariante (un escalar) bajo transformaciones de coor-denadas, asi

¤ = ηµν∂µ∂ν = ∂µ∂µ =∂2

∂x02−∇2 (7.106)

la cual nos permite escribir directamente la ecuación de ondas como:

¤Ψ = 0 (7.107)

Es conocido del álgebra vectorial, que el producto cruz entre vectoreses una operación que solo tiene sentido para vectores cartesianos en tresdimensiones y por lo tanto en la forma usual como ella se define, no es posiblegeneralizarla a vectores definidos en otras dimensiones espaciales. Realmenteel producto cruz usual es un caso particular de tensores de segundo rango,como fue discutido al final de la sección 5.2.3.

La operación de antisimetrizar un tensor de segundo rango (ecuación(7.57)) nos permite generalizar el producto cruz del cálculo verctorial usualen tres dimensiones, al caso de varias dimensiones, obteniendose no un vec-tor axial como en el caso tridimensional, sino un tensor de segundo rangoantisimétrico. Así por ejemplo, el “rotacional” de una función vectorial Ψα

está dado por:

∂[αΨβ] = ∂αΨβ − ∂βΨα (7.108)

Si aplicamos esta definición al caso particular de un vector tridimen-sional usual, con componentes A = (Ax, Ay, Az) ≡ (A1, A2, A3) ≡ Ai y∇ = (∂/∂x, ∂/∂y, ∂/∂z) ≡ ∂j , entonces las siguientes tres componentes

Page 152: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

142 CAPÍTULO 7. TENSORES

independientes del tensor ∂[iAj]

∂[1A2] =∂Ax

∂y− ∂Ay

∂x

∂[3A1] =∂Az

∂x− ∂Ax

∂z(7.109)

∂[2A3] =∂Ay

∂z− ∂Az

∂y

corresponden a las componentes del rotacional (∇×A)z, (∇×A)y y (∇×A)xrespectivamente, en el cálculo vectorial ususal.

Page 153: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

Capítulo 8

Electrodinámica

8.1. Introducción

En el segundo capítulo sobre los fundamentos de la teoría especial dela relatividad, vimos como las ecuaciones de Maxwell no permanecían in-variantes bajo transformaciones de Galileo, indicando que si se aceptan lasleyes de la electrodinámica, entonces ellas son válidas únicamente en unsistema de referencia privilegiado y por lo tanto, a través de experimentoselectromagnéticos se podría determinar el movimiento absoluto. Los resul-tados negativos de estos experimentos planteaban una inconsistencia entrelos principios de la mecánica Newtoniana y las leyes del electromagnetismo,las cuales condujeron a muchos teóricos de la época, a desarrollar elabo-radas teorias que permitieran coexistir, sin aparente contradicción, a estosdos grandes pilares de la física del siglo XIX.

La relatividad especial, basada sobre los potulados de la constancia dela velocidad de la luz en el vacío y el principio de relatividad, es una teoríaindependiente de los fenómenos eléctricos y mecánicos y por esta razón con-stituye uno de los pilares fundamentales de la física. En efecto podemospartir por ejemplo, de la validez de la ley de Coulomb para la fuerza entredos partículas cargadas en reposo respecto a algún observador inercial (oequivalentemente, del campo eléctrico producido por una carga en reposo)y del carácter invariante de la carga eléctrica y encontrar, utilizando losprincipios de la dinámica relativista, la necesidad de introducir un campodependiente de la velocidad de la partícula que lo produce, conocido como elcampo magnético. Continuando con este procedimiento, más algunas hipóte-sis de origen experimental, tales como la conservación de la carga, se puedenencontrar las leyes de la electrodinámica que rigen el comportamiento de los

143

Page 154: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

144 CAPÍTULO 8. ELECTRODINÁMICA

campos electromagnéticos, así como la fuerza sobre las partículas cargadasen campos electromagnéticos. Este método de trabajo para mostrar el car-acter relativista de la electrodinámica ha sido extensivamente utilizado enla literatura (ver por ejemplo el exelente tratado en el libro de Rosser) y poresta razón presentaré en este capítulo otro método de trabajo, el cual nospermite encontrar de manera directa las propiedades de transformación delos campos electromagnéticos entre sistemas de referencia inerciales.

El objetivo fundamental de este capítulo es entonces, escribir las leyesde la electrodinámica en forma explícita covariante, es decir, de tal maneraque su invarianza relativista sea manifiesta. Como una consecuencia de estaformulación de las ecuaciones de Maxwell, obtendremos las ecuaciones detransformación de los campos eléctricos y magnéticos bajo transformacionesde Lorentz. Para este fin, haremos uso del formalismo tensorial desarrolla-do en el capítulo anterior, postulando en primer lugar, que las leyes de laelectrodinámica, constituidas por las ecuaciones de Maxwell, la ecuación decontinuidad para la carga y la ley de la fuerza de Lorentz, son válidas yluego reescribiremos estas ecuaciones en términos de cantidades tensoriales.

8.2. Ecuaciones de Maxwell

Las leyes de la electrodinámica están constituidas por dos conjuntos deecuaciones. El primer conjunto lo conforman las ecuaciones de Maxwell queestán dadas por (en unidades cgs):

∇ ·E = 4πρ (8.1)

∇ ·B = 0 (8.2)

∇×B =1

c

∂E

∂t+4π

cJ (8.3)

∇×E = −1c

∂B

∂t(8.4)

las cuales nos determinan los campos eléctrico E y magnético B en térmi-nos de sus fuentes (cargas y corrientes), con ρ la densidad volumétrica decarga y J la densidad de corriente eléctrica. La primera de estas ecuacioneses conocida como la ley de Gauss y establece que las cargas eléctricas sonfuente del campo eléctrico, mientras que la tercera ecuación, la correspondi-ente ley de Gauss para el campo magnético, nos dice que no existen fuentespara el campo magnético, es decir, que en la naturaleza no existen cargas

Page 155: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

8.2. ECUACIONES DE MAXWELL 145

magnéticas aisladas, conocidas en la literatura como monopolos magnéti-cos. La segunda de las ecuaciones de Maxwell contiene dos términos: poruna parte está la ley de Ampere, esto es, que las corrientes eléctricas (rep-resentadas en el término 4πJ/c) producen campos magnéticos y por otraparte está el término 1/c∂E/∂t, introducido por Maxwell, que nos dice quecampos eléctricos variables en el tiempo son también una fuente de campomagnético. La última de las ecuaciones de Maxwell es la ley de inducciónde Faraday, la cual establece que campos magnéticos variables en el tiempoinducen campos eléctricos.

El segundo conjunto de ecuaciones que conforman las leyes de la elec-trodinámica, lo constituyen la ecuación de continuidad y la ley de la fuerzade Lorentz:

∇ · J + ∂ρ

∂t= 0 (8.5)

dp

dt= qE +

q

cu×B (8.6)

en donde q es la carga de la partícula y u su velocidad. La primera deestas ecuaciones, la ecuación de continuidad, establece que la carga eléctricaes conservada en la naturaleza. Es decir, si en una región del espacio ladensidad de carga eléctrica varía (∂ρ/∂t 6= 0), es porque esta entrando osaliendo carga de esa región (∇ · J 6= 0). Es de anotar que esta ley deconservación de la carga está contenida en las ecuaciones de Maxwell y por lotanto no constituye una ley independiente de la electrodinámica, pues bastacon tomar la divergencia de la segunda ecuación de Maxwell y teniendo encuenta la ley de Gauss (primera ecuación) se llega directamente a la ecuaciónde continuidad. Sin embargo, es usual y útil, para claridad en la discusión,mantener explícitamente esta ecuación de continuidad. Finalmente, la leyde la fuerza de Lorentz nos da la ecuación de movimiento para una cargapuntual inmersa en un campo electromagnético.

Las ecuaciones de Maxwell muestran como los campos eléctricos y mag-néticos son en realidad aspectos diferentes de un solo fenómeno. Sin embargo,hasta el siglo XVIII los fenómenos eléctricos y los magnéticos, conocidos porla humanidad desde tiempos remotos, se consideraban como fenómenos com-pletamente independientes entre si, situación que se puede entender ahora, siconsideramos el caso particular de campos electromagnéticos independientesdel tiempo, con sus fuentes de cargas y corrientes estacionarias. Bajo estascondiciones (campos y densidades de carga y corriente independientes deltiempo), las ecuaciones de Maxwell (ecuaciones (8.1) a la (8.4)) se puedenseparar en dos conjuntos independientes: El primer conjunto de ecuaciones,

Page 156: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

146 CAPÍTULO 8. ELECTRODINÁMICA

dado por:∇ ·E = 4πρ (8.7)

∇×E = 0 (8.8)

describe las leyes de la electrostática. La primera ecuación, la ley de Gauss,describe que la única fuente del campo eléctrico son las cargas (estacionar-ias), mientras que la segunda ecuación nos dice que el campo producido porestas cargas es conservativo. Estas dos ecuaciones son equivalentes a la leyde Coulomb. El segundo conjunto de ecuaciones

∇×B =4π

cJ (8.9)

∇ ·B = 0 (8.10)

constituido por la ley de Ampere (con densidad de corriente estacionaria J ,i.e. ∇ ·J = 0) y la ley de Gauss para el campo magnético, describen las leyesde la magnetostática y muestran que la única fuente del campo magnéticotambién son las cargas eléctricas, pero ahora en movimiento (corrientes). Sibien sabemos que el origen de los campos electrostáticos y magnetostáticosson las cargas, los conjuntos de ecuaciones (8.7), (8.8) y (8.9), (8.10) para loscampos E y B no establecen ninguna relación entre estos campos, es decir, sibien E y B tienen en últimas las mismas fuentes por origen, son conceptualy fenomenológicamente diferentes. Veremos en la siguiente sección, comola relatividad especial nos permite establecer una relación entre el campomagnético y el eléctrico, aún en el caso particular de campos independientesdel tiempo.

8.3. Campo magnético como un efecto relativista

Antes de entrar al tema central del presente capítulo, mostraremos enesta sección la estrecha relación que existe entre los fenómenos eléctricos ymagnéticos (para campos independientes del tiempo) como una aplicación delos postulados fundamentales de la teoría especial de la relatividad. Veamosentonces, como surge el concepto de campo magnético como una necesidadpara mantener la invarianza de las leyes físicas, si suponemos que la ley deCoulomb, la cual nos da la fuerza entre dos partículas cargadas en reposo,es válida. Coulomb fue el primero en describir cuantitativamente la fuerzaentre partículas cargadas estacionarias a través de la ley de fuerzas:

f12 = kq1q2r2

r (8.11)

Page 157: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

8.3. CAMPO MAGNÉTICO COMO UN EFECTO RELATIVISTA 147

en donde q1 y q2 miden las cargas eléctricas de las partículas, r es la distanciaentre en ellas, con r un vector unitario en la dirección del radio vector queune la carga 1 con la carga 2, y k es una constante de proporcionalidadque depende del sistema de unidades elegido (k = 1 en el sistema cgs queusaremos en el presente capítulo). Entonces f12 nos mide la fuerza que lacarga q2 experimenta debido a la carga q1, siendo esta fuerza atractica orepulsiva dependiendo del signo de las cargas: repulsiva si las cargas sondel mismo signo y atractiva en caso contrario. Además, esta expresión de lafuerza satisface por su definición la tercera ley de Newton, esto es f12 = −f21.En esta relación (ecuación (8.11)) se ha expresado la fuerza sobre la cargaq2 debido a la carga q1 y en este sentido podemos escribir la ley de Coulomben la forma:

f12 = q2E1(r) (8.12)

en donde la cantidad E1(r), definida como

E1(r) :=q1r2r (8.13)

es el campo eléctrico producido por la carga q1 en el punto r (hemos elegidoel origen del sistema de coordenadas espaciales en la posición de la carga q1para simplicar las expresiones). Estas expresiones para la fuerza (ecuación(8.11)) y el campo eléctrico (ecuación (8.13)) son válidas para un obser-vador inercial Σ, con respecto al cual la carga q1 está en reposo. Es un hechoexperimental, que la fuerza sobre la carga de prueba q2 es independientedel estado de movimiento de la carga de prueba, lo cual está implícito enla expresión para la fuerza de Coulomb, pues ella depende solamente de laposición instantánea de la carga q2. Además, tanto la fuerza de Coulombcomo el campo eléctrico producido por la carga q1, son independientes deltiempo siempre y cuando la carga q1 permanezca en reposo. Experimental-mente determinamos la fuerza f12 sobre la carga de prueba q2 en el sistemade referencia inercial Σ, midiendo la rata de cambio del momentun p2 dela carga q2, es decir midiendo dp2/dt, así como también las otras variablescinemáticas y dinámicas que entran en la definición de la fuerza de Coulomb,tales como la distancia entre la carga q1 y la de prueba, la velocidad (nulaen este caso) de la carga q1 y el momentun p2 de q2. Si consideramos otrosistema de referencia inercial Σ0, el cual se mueve con velocidad v a lo largode los ejes x, x0 con respecto a Σ, entonces todas las cantidades cinemáticasy dinámicas deben transformarce de acuerdo con los principios de la rela-tividad especial y a partir de estas cantidades podemos determinar la fuerzasobre la carga de prueba, pero ahora estando las cargas q1 y q2 en moviento.

Page 158: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

148 CAPÍTULO 8. ELECTRODINÁMICA

Figura 8.1: Interacción Coulombiana normal al movimiento

Nuestro primer objetivo es determinar la fuerza sobre una carga de prue-ba q2, medida por un observador inercial Σ, debida a una carga q1 que semueve con velocidad constante. Para simplificar los cálculos y sin pérdidade generalidad, consideraremos dos situaciones particulares: En la primera,ilustrada en la Figura 8.1, la carga de prueba q2 se encuentra en reposocon respecto al sistema Σ y está situada sobre el eje y en las coordenadas(0, y, 0), mientras que la carga q1 se mueve con velocidad v a lo largo del ejepositivo de las x y pasa por el origen de coordenadas en el instante t = 0.La segunda situación, mostrada en la Figura 8.2, se diferencia de la ante-rior solamente en que ahora la carga de prueba, que la denotaremos ahorapor q3, se situa en reposo respecto al sistema Σ sobre el eje de las x en lascoordenadas (x, 0, 0).

Debido a que la carga q1 se está moviendo, debemos pasarnos a un sis-tema de referencia inercial Σ0 con respecto al cual esta carga se encuentreen reposo, con el fin de poder aplicar la ley de Coulomb. Considerados unsistema de referencia inercial Σ0, que se mueva con velocidad v a lo largo deleje positivo x, siendo v la velocidad de la carga q1 respecto a Σ. Entonces,para todo instante t0 la carga q1 se encuentra en reposo en el origen de co-ordenadas de Σ0, mientras que la carga de prueba q2 pasa por el punto decoordenadas (0, y0, 0) en el instante t0 = 0 y la carga q3 pasa por el punto

Page 159: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

8.3. CAMPO MAGNÉTICO COMO UN EFECTO RELATIVISTA 149

Figura 8.2: Interacción Coulombiana en la dirección de movimiento

de coordenadas (x0, 0, 0) en t0 = 0. Bajo estas condiciones, las fuerzas sobrelas cargas q2 y q3 están dadas por la ley de Coulomb (ecuación (8.11)). En-tonces, sobre la carga q2 la fuerza en el instante t0 = 0 solo tiene componentey y está dada por:

f 0x12 = 0; f0y12 =

q1q2y02

; f 0z12 = 0 (8.14)

mientras que para la carga q3 la fuerza de Coulomb, en t0 = 0, tiene solocomponente x:

f 0x13 =q1q3x02

; f 0y13 = 0; f0z13 = 0 (8.15)

Retornemos ahora al sistema de referencia inercial Σ. Para este fin,recordemos la definición de las componentes del c-vector fuerza (ecuación(5.19))

fα = (f0, f1, f2, f3) = γ(u)(1

cf · u, f) (8.16)

en donde u es la velocidad de la partícula sobre la cual esta actuando lafuerza física f . Bajo la transformación de Lorentz que estamos consideran-do, las componentes de la c-fuerza medidas por Σ0 están relacionadas conlas correspondientes componentes de la c-fuerza medidas en Σ, por las rela-ciones:

f0 = γ(−v)(f 00 + βf 01) (8.17)

Page 160: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

150 CAPÍTULO 8. ELECTRODINÁMICA

f1 = γ(−v)(f 01 + βf 00) (8.18)

f2 = f 02 (8.19)

f3 = f 03 (8.20)

siendo −v la velocidad de Σ respecto a Σ0, β = v/c y γ(−v) = γ(v). Teniendoen cuenta la ecuación (8.16) y recordando la forma como el factor γ(u0) setransforma (ver ecuación (4.13)), las ecuaciones de transformación para lascomponentes de la fuerza física f están dadas por:

fx =f 0x + v

c2f 0 · u0

1 + vu0xc2

(8.21)

fy =f 0y

γ(v)³1 + vu0x

c2

´ (8.22)

fz =f 0z

γ(v)³1 + vu0x

c2

´ (8.23)

Dado que la velocidad u0 de las cargas q2 y q3, que las denotaremos poru01 y u02 respectivamente, están dadas por:

u01 = (−v, 0, 0) (8.24)

u02 = (−v, 0, 0) (8.25)

con respecto al sistema de referencia Σ0, tenemos que las componentes de lafuerza física respecto a Σ son:

fx12 = f 0x12 = 0 (8.26)

fy12 = γ(v) f 0y12 = γ(v)q1q2y02

(8.27)

fz12 = f 0z12 = 0 (8.28)

para la carga q2, y

fx13 = f 0x13 =q1q3x02

(8.29)

fy13 = f 0y13 = 0 (8.30)

fz13 = f 0z13 = 0 (8.31)

Page 161: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

8.3. CAMPO MAGNÉTICO COMO UN EFECTO RELATIVISTA 151

para la carga q3. Puesto que bajo la transformación de Lorentz consideraday0 = y y x0 = γ(v)x, obtenemos que las componentes no nulas de la fuerzaen Σ, sobre las cargas de prueba q2 y q3, están dadas por:

fy12 = γ(v)q1q2y2

(8.32)

fx13 =1

γ2(v)

q1q3x2

(8.33)

respectivamente. A partir de estos resultados, es fácil intuir la forma generalpara la fuerza eléctrica en un instante dado sobre una partícula de pruebaq2 en reposo en un punto de coordenadas (x, y, z), debido a una carga q1 quese desplaza a velocidad constante v a los largo del eje de las x y que pasapor el origen de coordenadas en ese instante:

f = q1q2γ(v)r

(γ2(v)x2 + y2 + z2)3/2(8.34)

en donde r es el vector posición instantáneo que une la carga q1 con lacarga de prueba q2. Así, podemos definir el campo eléctrico producido poruna partícula móvil, situada instantáneamente en el origen de coordenadas,como:

E = q1γ(v)r

(γ2(v)x2 + y2 + z2)3/2(8.35)

Notemos en primer lugar, que el campo eléctrico sigue siendo radial,aún cuando ya no es esféricamente simétrico como en el caso del campoeléctrico producido por una carga en reposo, pues de la ecuación anterior sededuce que el campo eléctrico se intensifica en un factor γ(v) para puntosdel espacio situados en el plano perpendicular a la dirección de movimientode la partícula, mientras que se hace un factor 1/γ2(v) más pequeño parapuntos situados a lo largo de la dirección de movimiento de la carga q1.

Consideremos ahora dos cargas q1 y q2 como se muestra en la Figura 8.3,en donde la carga q1 se mueve con velocidad v a lo largo del eje x positivocon respecto al sistema de referencia Σ y la carga q2 se mueve con velocidadu = (ux, uy, uz) respecto a Σ y supongamos que en el instante t = 0, la cargaq1 pasa por el origen de coordenadas y q2 por el punto (x, y, z) . Similar alcaso anteriormente discutido, sea Σ0 un sistema de referencia inercial quese desplaza con velocidad v en la dirección positiva de las x respecto a Σ.Entonces, con respecto al observador Σ0 la carga q1 se encuentran en reposoen el origen de coordenadas de Σ0 y q2 pasa por el punto de coordenadas

Page 162: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

152 CAPÍTULO 8. ELECTRODINÁMICA

Figura 8.3: Interacción entre cargas con movimiento arbitrario

(x0, y0, z0) en el instante t0 = 0, moviendose con una velocidad u0. De la leyde Coulomb, las componentes de la fuerza medidas por el observador inercialΣ0 están dadas por:

f 0x12 =q1q2x

0

(x02 + y02 + z02)3/2(8.36)

f 0y12 =q1q2y

0

(x02 + y02 + z02)3/2(8.37)

f 0z12 =q1q2z

0

(x02 + y02 + z02)3/2(8.38)

las cuales son independientes de la velocidad u0 de la carga de prueba. Apli-cando las ecuaciones (8.21), (8.22) y (8.23) para la transformación de lascomponentes de la fuerza y teniendo en cuenta la ley de transformación develocidades:

u0x =ux − v

1− vuxc2

(8.39)

u0y =uy

γ(v)¡1− vux

c2

¢ (8.40)

u0z =uz

γ(v)¡1− vux

c2

¢ (8.41)

Page 163: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

8.3. CAMPO MAGNÉTICO COMO UN EFECTO RELATIVISTA 153

obtenemos para las componentes de la fuerza sobre la carga de prueba q2,medidas por el observador inercial Σ:

fx12 =γ(v)q1q2

(γ2(v)x2 + y2 + z2)3/2

³x+

vuyc2

y +vuzc2

(8.42)

fy12 =γ(v)q1q2y

(γ2(v)x2 + y2 + z2)3/2

³1− vux

c2

´(8.43)

fz12 =γ(v)q1q2z

(γ2(v)x2 + y2 + z2)3/2

³1− vux

c2

´(8.44)

Sabemos que la fuerza de Coulomb sobre una carga de prueba es indepen-diente del estado de movimiento de dicha carga de prueba. Sin embargo,comparando la ecuación (8.32) con las ecuaciones (8.42), (8.43) y (8.44)para la fuerza sobre la carga de prueba q2, la primera cuando q2 está enreposo y la segunda cuando está en movimiento, vemos que en el segundocaso aparecen unos términos extras a la fuerza eléctrica (de Coulomb). Paraver esto de una manera más directa, notemos que la fuerza sobre la cargade prueba q2 (ecuaciones (8.42), (8.43) y (8.44)) la podemos escribir en laforma:

f12 = f(elec)12 + f

(mag)12 ; = q2E + q2

u

c×B (8.45)

en donde E es el campo eléctrico producido por la carga q1 dado por(ecuación (8.35)):

E =q1γ(v)r

(γ2(v)x2 + y2 + z2)3/2(8.46)

siendo u la velocidad de la carga de prueba q2 y definimos el campo mag-nético B producido por la carga q1, como:

B : =1

cv × γ(v)q1r

(γ2(v)x2 + y2 + z2)3/2

=1

cv ×E (8.47)

siendo v la velocidad de la carga q1. Teniendo en cuenta que la velocidad dela carga q1, en el caso considerado está dada por v = (v, 0, 0), es fácil ver porun cálculo directo, que la expresión general dada por la ecuación (8.45) sereduce a la expresión para fuerza, encontrada en las ecuaciones (8.42), (8.43)y (8.44). En la ecuación (8.45) se dividió explícitamente la fuerza que actuasobre la carga de prueba en dos términos: El primero corresponde a la fuerzaCoulombiana que actua sobre la carga q2, la cual es independiente del estado

Page 164: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

154 CAPÍTULO 8. ELECTRODINÁMICA

de movimiento de dicha carga de prueba, mientras que el segundo términosí es dependiente de la velocidad de dicha carga. Además, este segundotérmino se anula si cualquiera de las cargas, la carga fuente q1 o la de pruebaq2 están en reposo. Este resultado nos muestra la estrecha relación entrelos fenómenos eléctricos y magnéticos. Es importante tener en mente, queen todo nuestro análisis hemos trabajo bajo la suposición que las cargasno están sometidas a aceleraciones, pues para considerar esta situación esnecesario trabajar con las leyes completas de la electrodinámica.

Es posible continuar con este método de trabajo y obtener la ley de Biot-Sabart y la ley de Ampere para corrientes estacionarias, pero dejaremos estostemas de lado, para concentrarnos en el objetivo fundamental del presentecapítulo.

En la siguiente sección escribiremos las ecuaciones de Maxwell en formaexplícita relativista y encontraremos las leyes generales de transformaciónde los campos electromagnéticos, entre sistemas de referencia inerciales ymostraremos, cómo los resultados anteriormente obtenidos, corresponden acasos particulares de estas leyes de transformación.

8.4. Ecuaciones de Maxwell covariantes

Consideremos en primer lugar la ecuación de continuidad (8.5), la cualpodemos escribir en forma explícitamente covariante, como:

∂µJµ = 0 (8.48)

teniendo encuenta lo establecido en la última sección del capítulo anterior ydonde el c-vector corriente Jν se ha definido en la forma:

Jν := (J0, J1, J2, J3) = (cρ, J) (8.49)

La componente temporal J0 representa la densidad de carga (siendo lacarga un invariante relativista) y las componentes espaciales J i, i = 1, 2, 3corresponden a las componentes del vector densidad de corriente eléctrica.Esta definición del c-vector corriente nos da inmediatamente, las ecuacionesde transformación para las densidades de carga y corriente, medidas por dosobservadores inerciales. En efecto, dados dos sistemas de referencia inercialesΣ y Σ0, con Jν = (cρ, J) y J 0ν = (cρ0, J 0) las componentes del c-vector corri-ente medidas por los dos observadores, entonces Jν y J 0ν están relacionadaspor (ver ecuación (7.2)):

J 0ν = ΛµνJν (8.50)

Page 165: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

8.4. ECUACIONES DE MAXWELL COVARIANTES 155

Para el caso particular de dos sistemas de referencia inerciales, con v lavelocidad del sistema Σ0 respecto a Σ, a lo largo del eje positivo de las x yejes espaciales paralelos, tenemos que las ecuaciones de transformación paralas componentes de la densidad de corriente están dadas por:

J 00 = γ(v)(J0 − βJ1) (8.51)

J 01 = γ(v)(J1 − βJ0 (8.52)

J 02 = J2 (8.53)

J 03 = J3 (8.54)

en donde hemos utilizado las ecuaciones (2.46) para los elementos de la trans-formación de Lorentz Λµν , siendo γ(v) = 1/

p1− β2 y β = v/c. Remplazan-

do las componentes J 0ν y Jν en términos de las densidades de carga (J0 = cρy J 00 = cρ0) y de corriente ( ji = J ≡ (Jx, Jy, Jz) y j0i = J 0 ≡ (Jx0 , Jy0 , Jz0))obtenemos las relaciones:

ρ0 = γ(v)(ρ− v

c2Jx) (8.55)

Jx0 = γ(v)(Jx − vρ) (8.56)

Jy0 = Jy (8.57)

Jz0 = Jz (8.58)

En las ecuaciones de Maxwell escritas en la forma tradicional (ecuaciones(8.1) a la (8.4)) los campos eléctricos E y magnéticos B son vectores carte-sianos usuales y por lo tanto no corresponden a ninguna cantidad relativista,es decir a un escalar de Lorentz, o a un c-vector, o a un tensor. Por otra parte,para describir los campos electromagnéticos producidos por alguna distribu-ción de cargas y corrientes, es necesario conocer seis cantidades independi-entes, esto es, las tres componentes del campo eléctrico y las tres del campomagnético. Esta situación nos conduce a postular, que el objeto matemático(relativista) adecuado para describir al campo electromagnético, es un tensorde segundo orden antisimétrico, pues por lo discutido en el capítulo anteri-or (sección 8.2.3), este tensor posee solo seis componentes independientes.Estos argumentos nos motivan a definir el tensor campo electromagnéticoF medido por un observador inercial Σ, como un tensor de segundo rangoantisimétrico cuyas componente contravariantes están definidas por:

F 12 = −F 21 = Bz F 23 = −F 32 = Bx F 31 = −F 13 = By

F 01 = −F 10 = Ex F 02 = −F 20 = Ey F 03 = −F 30 = Ez

Fαα = 0 ∀α = 0, 1, 2, 3(8.59)

Page 166: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

156 CAPÍTULO 8. ELECTRODINÁMICA

Con esta definición, podemos escribir las dos primeras ecuaciones deMaxwell (ecuaciones (8.1) y (8.2)) en la forma:

∂αFαβ = −4π

cJβ (8.60)

la cual es una ecuación covariante relativista, pues el lado izquierdo es elproducto del operador gradiente ∂α por el tensor electromagnético Fαβ con-traido en su primer índice α, para obtener así un c-vector contravariante, elcual es proporcional al c-vector densidad de corriente. Esto significa que estaecuación tiene la misma forma en todos los sistemas de referencia inerciales,es decir, en un sistema de referencia Σ0, para el cual F 0αβ y J 0β son las cor-respondientes componentes del tensor campo electromagnético y densidadde corriente, las dos primeras ecuaciones de Maxwell tienen la forma:

∂0αF0αβ = −4π

cJ 0β (8.61)

en donde las componentes de la densidad de corriente J 0β medidas en Σ0, es-tán relacionadas con las medidas en Σ, por las ecuaciones de transformación(8.50) ( o las ecuaciones (8.51), (8.52), (8.53) y (8.54) o también las ecua-ciones (8.55), (8.56), (8.57) y (8.58) en el caso particular usual). Las compo-nentes del tensor campo electromagnético medidas por los dos observadoresinerciales Σ y Σ0 están relacionadas por las ecuaciones de transformación(ver el capítulo anterior ecuación (7.3)):

F 0µν = ΛµαΛνβF

αβ (8.62)

Estas relaciones nos dan entonces, las ecuaciones de transformación paralos campos eléctricos y magnéticos medidas por dos observadores inerciales.Consideremos de nuevo, el caso particular de transformaciones de Lorentzentre sistemas de referencia con ejes paralelos y velocidad relativa a lo largode los ejes xx0, en donde los elementos de la transformación de Lorentz estándados por (ecuación (2.47)):

Λ00 = Λ11 = γ (8.63)

Λ01 = Λ10 = −βγ (8.64)

Λ22 = Λ33 = 1 (8.65)

con β = v/c y γ =p1− β2 y los demás elementos cero. Sean

E = (Ex, Ey, Ez) (8.66)

Page 167: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

8.4. ECUACIONES DE MAXWELL COVARIANTES 157

B = (Bx, By, Bz) (8.67)

E0=(Ex0 , Ey0 , Ez0) (8.68)

B0 = (Bx0 , By0 , Bz0) (8.69)

las componentes de los campos eléctricos y magnéticos medidas por Σ y Σ re-spectivamente. Entonces aplicando las ecuaciones de transformación (8.62),con los elementos de la transformación de Lorentz dados por las ecuaciones(8.63), (8.64) y (8.65) y la definición (8.59) de las componentes del tensorelectromagnético, tenemos (para las componentes no nulas de F):

Ex0 = F001 = Λ0αΛ

1βF

αβ

= Λ00Λ10F

00 + Λ00Λ11F

01 + Λ00Λ12F

02 + Λ00Λ13F

03

+Λ01Λ10F

10 + Λ01Λ11F

11 + Λ01Λ12F

12 + Λ01Λ13F

13

+Λ02Λ10F

20 + Λ02Λ11F

21 + Λ02Λ12F

22 + Λ02Λ13F

23

+Λ03Λ10F

30 + Λ03Λ11F

31 + Λ03Λ12F

32 + Λ03Λ13F

33

= Λ00Λ11F

01 + Λ01Λ10F

10

= γ2Ex − β2γ2Ex

= Ex (8.70)

Un cálculo similar se puede hacer para las demás componentes, pero porbrevedad, aquí solo presentaremos los téminos no nulos que surgen en latransformación:

Ey0 = F002 = Λ0αΛ

2βF

αβ = Λ00Λ22F

02 + Λ01Λ22F

12

= γ(Ey − βBz) (8.71)

Ez0 = F003 = Λ0αΛ

3βF

αβ = Λ00Λ33F

03 + Λ01Λ33F

13

= γ(Ez + βBy) (8.72)

Bx0 = F023 = Λ2αΛ

3βF

αβ = Λ22Λ33F

23

= Bx (8.73)

By0 = F031 = Λ3αΛ

1βF

αβ = Λ33Λ10F

30 + Λ33Λ11F

31

= γ(By + βEz) (8.74)

Page 168: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

158 CAPÍTULO 8. ELECTRODINÁMICA

Bz0 = F012 = Λ1αΛ

2βF

αβ = Λ10Λ22F

02 + Λ11Λ22F

12

= γ(Bz − βEy) (8.75)

Antes de considerar aplicaciones de estas ecuaciones de transformaciónde los campos, las cuales serán dadas más adelante, escribamos las otrasecuaciones de Maxwell en notación tensorial.

Las ecuaciones de Maxwell homogéneas (las dos últimas ecuaciones (8.3)y (8.4)), con la ayuda del tensor de Levi-Civita introducido en el capítuloanterior (ecuación (7.75)), las podemos escribir en la forma:

εαβγδ∂βFγδ = 0 (8.76)

en donde en esta última ecuación se ha utilizado el tensor de Minkowskipara bajar los índices del tensor electromagnético F, esto es:

Fγδ = ηαγηβδFαβ (8.77)

las cuales nos representa las componentes covariantes del tensor campo elec-tromagnético. Para recordar más fácilmente la relación entre las compo-nentes contravariantes del tensor F, definidas en la ecuación (8.59) y surelación con las componentes covariantes, definidas en la ecuación (8.77), esútil escribir estas componentes en forma matricial:

(Fαβ) =

F 00 F 01 F 02 F 03

F 10 F 11 F 12 F 13

F 20 F 21 F 22 F 23

F 30 F 31 F 32 F 33

=

0 Ex Ey Ez

−Ex 0 Bz −By

−Ey −Bz 0 Bx

−Ez By −Bx 0

(8.78)

Aplicando, ahora, la ecuación (8.77), tenemos:

(Fαβ) =

F00 F01 F02 F03F10 F11 F12 F13F20 F21 F22 F23F30 F31 F32 F33

=

0 −Ex −Ey −Ez

Ex 0 Bz −By

Ey −Bz 0 Bx

Ez By −Bx 0

(8.79)

Page 169: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

8.4. ECUACIONES DE MAXWELL COVARIANTES 159

Ilustremos como se aplicó la ecuación (8.77) para llegar a la ecuación an-terior, calculando explícitamente dos términos, por ejemplo F02 y F21. Recor-dando, para simplificar, que los elementos del tensor métrico de Minkowskise anulan si los índices son diferentes, vemos que de los 16 sumandos queaparecen por la doble suma en la ecuación (8.77), solo un término es no nulo:

F02 = ηα0ηβ2Fαβ = η00η22F

02 = −Ey (8.80)

F21 = ηα2ηβ1Fαβ = η22η11F

21 = −Bz (8.81)

Veamos ahora que efectivamente la ecuación (8.76) reproduce las ecua-ciones de Maxwell homogeneas. Notemos en primer lugar que la ecuación(8.76) contiene cuatro ecuaciones, una para cada α = 0, 1, 2, 3 y cada unaa su vez (debido a la triple suma sobre los índices repetidos β, γ y δ) estáconformada por 64 sumandos. Sin embargo, dado que las componentes deltensor de Levi-Civita se anulan para cualquier par de índices repetidos, encada ecuación sobreviven solo cuatro sumandos. Así, para α = 0 los términosno nulos son:

0 = ε0123∂1F23 + ε0132∂1F32 + ε0213∂2F13 +

ε0231∂2F31 + ε0312∂3F12 + ε0321∂3F21

= 2∂Bx

∂x+ 2

∂By

∂y+ 2

∂Bz

∂z= 2∇ ·B (8.82)

obteniendo la ecuación de Maxwell para la divergencia del campo magné-tico. Para la última ecuación de Maxwell, la ley de Faraday, consideremosexplícitamente solo el caso de α = 1, pues el resultado se puede extrapolarfácilmente a α = 2 y 3. Entonces, para α = 1 los términos no nulos son:

0 = ε1023∂0F23 + ε1032∂0F32 + ε1203∂2F03 +

ε1230∂2F30 + ε1302∂3F02 + ε1320∂3F20

= −2∂Bx

∂ct+ 2

∂Ez

∂y− 2∂Ey

∂z= −2

c

Bx

∂t− 2(∇×E)x (8.83)

en donde hemos utilizado el hecho que x0 = ct, obteniendo así la componentex de la ley de Faraday.

Finalmente consideremos la ecuación de la Fuerza de Lorentz (segundaecuación en (8.6)), la cual podemos escribir en forma covariante como:

fα =dpα

dτ=

q

cηβγF

βαdxγ

dτ=

q

cF αγ

dxγ

dτ(8.84)

Page 170: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

160 CAPÍTULO 8. ELECTRODINÁMICA

en donde pα es el c-momentun de la partícula de carga q, τ el tiempo propio,xγ sus coordenadas de posición y F α

γ las componentes mixtas del tensorcampo electromagnético definidas por:

F αγ = ηγσF

σα (8.85)

Desarrollemos explícitamente la ecuación (8.84), para interpretar los tér-minos que de ella surgen, pues si bien afirmamos que esta ecuación es equiv-alente a la fuerza de Lorentz, notemos que, siendo la fuerza de Lorentz unaecuación vectorial, contiene tres ecuaciones escalares independientes, mien-tras que la ecuación (8.84) es cuadri-vectorial y por tanto contiene cuatroecuaciones. En primer lugar calculemos, utilizando la ecuación (8.85), lascomponentes mixtas Fα

γ del tensor campo electromagnético:

(F αβ ) =

F 00 F 0

1 F 02 F 0

3

F 10 F 1

1 F 12 F 1

3

F 20 F 2

1 F 22 F 2

3

F 30 F 3

1 F 32 F 3

3

=

0 Ex Ey Ez

Ex 0 Bz −By

Ey −Bz 0 Bx

Ez By −Bx 0

(8.86)

Remplazando estas cantidades en la ecuación (8.84), y desarrollandolaexplícitamente en componentes, tenemos:

f0 =q

c(Ex

dx1

dτ+Ey

dx2

dτ+Ez

dx3

dτ) (8.87)

f1 =q

c(Ex

dx0

dτ+Bz

dx2

dτ−By

dx3

dτ) (8.88)

f2 =q

c(Ey

dx0

dτ−Bz

dx1

dτ+Bx

dx3

dτ) (8.89)

f3 =q

c(Ez

dx0

dτ+By

dx1

dτ−Bx

dx2

dτ) (8.90)

Para interpretar estas ecuaciones, recordemos el significado físico de lascomponentes de la cuadri-fuerza dado en el capítulo 5 (ver ecuación (5.19)).Las componentes de la c-fuerza se pueden escribir en la forma:

fα = γ(u)(1

cf · u, f) (8.91)

Page 171: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

8.4. ECUACIONES DE MAXWELL COVARIANTES 161

en donde f = dp/dt es la fuerza física sobre la partícula, u su velocidady la componente temporal representa el trabajo por unidad de tiempo querealiza la fuerza física f sobre la partícula. Recordando que

dt

dτ= γ(u) :=

1p1− u2/c2

(8.92)

(ver capítulo 4 ecuación (4.5)), podemos reescribir las ecuaciones (8.87),(8.88), (8.89) y (8.90), en la forma siguiente:

1

cf · u = q

cE · u (8.93)

f = qE + qu×B (8.94)

Notemos que el factor de Lorentz γ(u) se cancela. La componente tem-poral de la c-fuerza, corresponde al hecho de que solo el campo eléctricorealiza trabajo sobre las partículas, una situación que está contemplada enla expresión para la fuerza de Lorentz, puesto que la fuerza debida al campomagnético es de la forma qu×B y por lo tanto:

f · u = (qE + q

cu×B) · u = E · u (8.95)

Resumiendo, las leyes de la electrodinámica (que incluyen las ecuacionesde Maxwell, la ecuación de continuidad y la fuerza de Lorentz) escritas enforma relativista covariante son:

∂αFαβ = −4πJβ (8.96)

εαβγδ∂βFγδ = 0 (8.97)

∂µJµ = 0 (8.98)

fα =q

cF αγ

dxγ

dτ(8.99)

Veamos ahora, algunas aplicaciones sencillas de estas ecuaciones y de laspropiedades de transformación de los campos. Consideremos en primer lugarlos ejemplos tratados en la sección anterior. Supongamos que una partículade carga q1 se mueve con velocidad constante v respecto a un sistema dereferencia inercial Σ, a lo largo del eje positivo de las x y pasa por el origenen el intante t = 0. Sea Σ0 otro sistema de referencia inercial, el cual semueve con velocidad v respecto a Σ en la dirección del eje positivo de lasx. Entonces, la carga q1 se encuentra en reposo en el origen de Σ0 y por lo

Page 172: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

162 CAPÍTULO 8. ELECTRODINÁMICA

tanto el campo electromagnético, en un punto de coordenadas (x0, y0, z0) yen cualquier instante, producido por q1 se reduce a:

E0 =q1r03

r0 ; B0 = 0 (8.100)

de acuerdo con la ley de Coulomb, en donde r0 = (x0, y0, z0) y r0 = (x02+y02+z02)1/2. Para calcular el campo electromagnético medido por el observadorinercial Σ, calculamos primero las componentes del tensor campo electro-magnético en Σ0 y luego aplicamos las propiedades de transformación deltensor F 0µν . De la ecuación (8.100) tenemos (en notación matricial):

(F 0αβ) =

0 q1x0

r03q1y0r03

q1z0r03

− q1x0r03 0 0 0

−q1y0r03 0 0 0

− q1z0r03 0 0 0

(8.101)

Aplicando las ecuaciones de transformación para las componentes deltensor F 0µν (ecuación (8.62)), pero teniendo en cuenta que ahora estamostransformando del sistema Σ0 al Σ:

Fµν = ΛµαΛνβF

0αβ (8.102)

en donde los elementos de la transformación de Lorentz Λµα están dados porlas ecuaciones (8.63), (8.64) y (8.65), cambiando β = v/c por −β, y teniendoen cuenta que γ(−v) = γ(v).

Consideremos primero los término F 0i, i = 1, 2, 3 que corresponden a lascomponentes del campo eléctrico medido enΣ. Entonces, como Λ02 = Λ

03 = 0

y Λiβ = 0 para β 6= 0 y β 6= i y teniendo en cuenta que F 0ij = 0, i, j = 1, 2, 3(no hay campo magnético en Σ0), tenemos que los términos no nulos de laecuación (8.102) son:

F 0i = Λ0αΛiβF

0αβ

= Λ00ΛiβF

00β + Λ01ΛiβF

01β

= Λ00ΛiiF00i + Λ01Λ

i0F

010 (8.103)

Notemos que en el primer término de la última igualdad no hay sumasobre el índice i, pues está repetido tres veces. Esto surgió del hecho queΛij = 0 si i 6= j; i, j = 1, 2, 3. Remplazando explícitamente los diferentestérminos, tenemos que las componentes del campo eléctrico medidas por elobservador Σ están dadas por:

Ex = γ2(v)Ex0 − β2γ2(v)Ex0 = Ex0 (8.104)

Page 173: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

8.5. TRANSFORMACIONES GAUGE 163

Ey = γ(v)Ey0 (8.105)

Ez = γ(v)Ez0 (8.106)

Notemos que en el instante t = 0 medido en Σ, la carga está en el origeny la relación entre las coordenadas del punto donde estamos observando elcampo eléctrico es (x0, y0, z0) = (γ(v)x, y, z) en ese instante. Entonces, si ex-presamos el campo eléctrico medido por Σ en términos de las coordenadasde Σ, obtenemos el resultado ya encontrado en la sección anterior, ecuación(8.35). Calculemos ahora las componentes del campo magnético en el sis-tema de referencia Σ. Procediendo de forma similar, escribamos primero lascomponentes no nulas de la ecuación (8.102) que corresponden al campomagnético, notando que i 6= j; i, j = 1, 2, 3 y no hay suma sobre tres índicesrepetidos:

F ij = ΛiαΛjβF

0αβ

= Λi0ΛjjF

00j + ΛiiΛj0F

0i0 (8.107)

Remplazando, tenemos que las componentes del campo magnético son:

Bx = F 23 = 0 (8.108)

By = F 31 = −βγ(v)Ez0 (8.109)

Bz = F 12 = βγ(v)Ey0 (8.110)

Este resultado lo podemos escribir en forma condensada como:

B =1

cv ×E (8.111)

en completo acuerdo con el resultado obtenido en la sección anterior, ecuación(8.47), teniendo en cuenta las ecuaciones (8.104), (8.105) y (8.106) y que lavelocidad está dada por:

v = (v, 0, 0) (8.112)

8.5. Transformaciones Gauge

Hay dos teoremas del cálculo diferencial en varias variables, que nospermiten escribir las ecuaciones de Maxwell en forma más compacta:

Teorema 9.1: Sea F una función vectoria tal que su rotacional es cero,i.e., ∇ × F = 0, entonces la función F se puede escribir como el gradientede una función escalar Ψ(r), esto es:

F = ∇Ψ(r) (8.113)

Page 174: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

164 CAPÍTULO 8. ELECTRODINÁMICA

Teorema 9.2: Sea F una función vectorial tal que su divergencia es cero,i.e., ∇ · F = 0 , entonces la función F se puede escribir como el rotacionalde una función vectorial Υ(r), esto es:

F = ∇×Υ(r) (8.114)

Apliquemos estos dos resultados del cálculo vectorial a los campos eléctricoy magnético. La tercera ecuación de Maxwell (8.3) establece que

∇ ·B = 0 (8.115)

entonces podemos escribir el campo magnético como el rotacional de unafunción vectorial, es decir:

B = ∇×A (8.116)

en donde la función vectorial A se le llama el potencial vectorial.Ahora, si reemplazamos el campo magnético en la última de las ecua-

ciones (8.4) en términos del potencial vectorial A, tenemos:

∇× (E + ∂A

∂t) = 0 (8.117)

esto significa, de acuerdo con el Teorema 9.2, que la función vectorialE + ∂A/∂t la podemos escribir como el gradiente de una función escalar Φ,es decir

E +∂A

∂t= −∇Φ (8.118)

en donde Φ es el potencial escalar. El signo menos en la ecuación anteriorpermite interpretar directamente al potencial Φ, para el caso de camposindependientes del tiempo, como el trabajo por unidad de carga realizadopor el campo eléctrico, llamado potencial electrostático, el cual es un campoconservativo.

Estos dos teoremas del cálculo vectorial, corresponden a casos particu-lares de un teorema más general de tensores:

Teorema 9.3: Sean Tαβ las componentes covariantes de un tensor desegundo rango antisimétrico, tal que

εαβγδ∂βTγδ = 0 (8.119)

entonces el tensor Tαβ se puede escribir como el “rotacional” (ver ecuación(7.108)) de una función cuadri-vectorial W γ , es decir

Tαβ = ∂[αWβ] = ∂αWβ − ∂βWα (8.120)

Page 175: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

8.5. TRANSFORMACIONES GAUGE 165

Como vimos en la sección 9.4 de este capítulo, las dos ecuaciones deMaxwell homogeneas (∇ · B = 0 y ∇× E + ∂B/∂t = 0) se pueden escribiren la forma

εαβγδ∂βFγδ = 0 (8.121)

en donde Fγδ es el tensor campo electromagnético. Entonces, de acuerdo conel Teorema 9.3, el tensor campo electromagnético Fγδ se puede escribir enla forma

Fγδ = ∂γAδ − ∂δAγ =∂Aδ

∂xγ− ∂Aγ

∂xδ(8.122)

en donde el cuadri-vector Aµ, definido como:

Aµ := (Φ, A) (8.123)

es llamado el cuadri-potencial,con A el potencial vectorial y Φ el potencialescalar definidos en la ecuaciones (8.116) y (8.118) respectivamente.

Con esta definición del c-potencial Aµ, podemos escribir las ecuacionesde Maxwell inhomogeneas (ver ecuación (8.60)):

∂αFαβ = −4πJβ (8.124)

en términos del c-potencial Aµ. Remplazando la ecuación (8.122) en laecuación anterior y teniendo en cuenta que Fαβ = ηαµηβνFµν y Jγ = ηγβJ

β,obtenemos:

∂µ∂µAγ − ∂µ∂γAµ = −4πJγ (8.125)

De esta manera, esta última ecuación es equivalente a las ecuaciones decampo de Maxwell, pues dadas las fuentes de los campos Jα y resolviendola ecuación (8.125), conocemos el c-potencial Aµ y así los campos electro-magnéticos.

Por otra parte, de la ecuación de definición de Fγδ en términos del po-tencial c-vectorial, notemos que podemos cambiar Aµ, adicionandole unafunción cualquiera de la forma ∂µϕ, sin que cambia el tensor campo electro-magnético Fγδ. Es decir, si realizamos la transformación

Aµ Aµ = Aµ + ∂µΛ (8.126)

en donde Λ es una función cualquiera de las coordenadas, la ecuación (8.122)

Page 176: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

166 CAPÍTULO 8. ELECTRODINÁMICA

nos conduce a:

Fγδ =∂Aδ

∂xγ− ∂Aγ

∂xδ

=∂

∂xγ(Aδ + ∂δΛ)− ∂

∂xδ(Aγ + ∂γΛ)

=∂

∂xγAδ − ∂

∂xδAγ +

∂2Λ

∂xγ∂xδ− ∂2Λ

∂xδ∂xγ

=∂

∂xγAδ − ∂

∂xδAγ = Fγδ (8.127)

lo cual significa que la función Fγδ permanece invariante bajo la transfor-mación (8.126) y así también los campos electromagnéticos E y B. A latransformación (8.126) se le llama una transformación “gauge”. Este tipode transformaciones juega un papel fundamental en la teoría cuántica decampos y en las llamadas teorias de unificación de las interacciones funda-mentales de la naturaleza.

Para finalizar este capítulo, veamos como esta característica de la teoríaelectromagnética (cuando se formulan las ecuaciones de Maxwell en términosdel c-potencial), de permanecer los campos físicos E y B invariantes bajouna transformación gauge, nos permite simplicar las ecuaciones que rigen elcomportamiento del c-potencial Aµ.

Dado que el c-potencial Aµ no está definido de manera única, entonces,podemos imponer sobre él una condición o ecuación de ligadura, llamadala elección de un gauge particular, la cual por lo establecido anteriormente,no cambia la física, es decir no cambian los campos E y B. Así, podemosescoger la función arbitraria Λ en la ecuación (8.126), de tal manera que elpotencial c-vectorial Aµ cumpla con la ecuación:

∂µAµ = 0 (8.128)

llamado el gauge de Lorentz, de tal manera que la ecuación (8.125) se sim-plifica, reduciendose a la ecuación:

¤Aµ = −Jµ (8.129)

que es la ecuación de ondas inhomogénea. Recordando la definición del oper-ador ¤, ecuación (7.106), vemos que la teoría electromagnética de Maxwell,expresada por la ecuación (8.129) contiene al postulado de la constancia dela velocidad de la luz, pues dado que el operador ¤ definido por:

¤ = 1

c2∂2

∂t2−∇2 (8.130)

Page 177: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

8.5. TRANSFORMACIONES GAUGE 167

es un invariante bajo transformaciones de Lorentz, entonces el coeficiente1/c2, que representa la velocidad de propagación de los campos electromag-néticos, es una constante independiente del observador. Este último resulta-do ilustra con toda claridad y sin restarle meritos a la genialidad de AlbertEinstein, como la teoría de la relatividad especial estaba ya presente en lafísica.

Page 178: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

168 CAPÍTULO 8. ELECTRODINÁMICA

Page 179: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

Capítulo 9

Bibliografía

La literatura disponible sobre relatividad es tal vez de las más amplias,tanto en el campo especializado como en el divulgativo. Se listarán a con-tinuación algunas referencias, desde literatura de divulgación, pasando portextos elementales, obras de valor histórico, hasta textos y libros avanzadosque, sin pretender ser exaustivas, si cubren globalmente la temática de lateoría especial de la relatividad.Referencias de caracter divulgativo:Bucker R. B., Geometry, Relativity and the fourth dimension. Dover Pub-lications, Inc. N. Y. 1977Lilley S., Discovering Relativity for yourself. Cambridge University Press1981Russell B., ABC de la Relatividad. Ed. Ariel Barcelona 1978Williams L. P., La Teoría de la Relatividad. Alianza Universidad 1977Textos elementales, a nivel universitario, sobre relatividad especial:Mook D. E. and Vargish T., La Relatividad. Espacio, Tiempo y Movi-miento. McGraw Hill 1993Resnick R., Introducción a la Teoría Especial de la Relatividad. Limusa1981Skinner R., Relativity for Scientist and Engineers. Dover Publishing N. Y.1982Smith J. H., Introducción a la Relatividad Especial. Ed. Reverté 1978Textos universitarios de relatividad a nivel intermedio:Enrique L., Física Relativista. Buenos Aires 1955French A. P., Special Relativity. Massachusetts Institute of Technology1968

169

Page 180: Sobrelateoríaespecialdelarelatividad - FISICA …³n La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma

170 CAPÍTULO 9. BIBLIOGRAFÍA

Rindler W., Essential Relativity. Special, General and Cosmology. Sprin-ger-Verlag 1977Taylor E. F. and Wheeler J. A., Spacetime Physics. Freeman, San Fran-cisco 1966Libros y textos avanzados sobre relatividad. Algunos de ellos incluyen, tam-bién, elementos básicos de la Relatividad General:Aharoni J., The Special Theory of Relativity. Oxford University Press 1965Bressan A., Relativistic Theories of Materials. Springer-Verlag 1978Fock V., The Theory of Space Time and Gravitation, Pergamon Press 1959Gill T. P., The Doppler Effect. Academic Press 1965Kopczynski W. and Trautman A., Spacetime and Gravitation. JohnWiley & Sons 1992Matveev A. N., Mechanics and Theory of Relativity. Mir Publishers Moscow1989Rosser W. G. V., An Introduction to the Theory of Relativity. Butter-worth, London 1964Ugarov V. A., Special Theory of Relativity. Mir Publishers Moscow 1979Libros avanzados de relatividad, con un fuerte énfasis en aspectos matemáti-cos:Hagendorn R., Relativistic Kinematics. W. A. Benjamin, Inc. 1963Misner C. W., Thorne K. S. and Wheeler J. A., Gravitation. W. H.Freeman and Co. 1973Naber G. L., The Geometry of Minkowski Spacetime. Springer-Verlag 1992Woodhouse N. M. J., Special Relativity. Springer-Verlag 1992Libros clásicos de relatividad y obras formales de carácter histórico:Born M., Einstein’s Theory of Relativity. Dover Publications, Inc. 1965 (1a

ed. 1920)Einstein A., The Principle of Relativity. Dover N. Y. 1958Poincaré H., La Mécanique Nouvelle. Conference Mémoire et note sur laThéorie de la Relativité. Editions Jacques Gabay 1989Rocard J. M., Newton et la Relativité. Press University France 1986Sard R. D., Relativistic Mechanics. W. A. Benjamin, Inc. 1970Silberstein L., The Theory of Relativity. Great Britain 1914Synge J. L., Relativity: The Special Theory. North-Holland PublishingCompany 1958Whittaker Sir E. T., History of the Theories Aether and Electricity. Harp-er and Row, N. Y. 1960