Download Relatividad de Galileo - Curso de Relatividad Especial
Document related concepts
Transcript
CURSO DE RELATIVIDAD ESPECIAL Hugo A. Fernández – hafernandez@fibertel.com.ar Universidad Tecnológica Nacional - República Argentina http://www.fisica-relatividad.com.ar Enfoque del curso El presente curso de Relatividad Especial está dirigido a alumnos universitarios que están en la etapa de formación básica. Se presupone que ya tienen conocimientos de Mecánica de Newton, Electricidad y Magnetismo, y Cálculo Diferencial, pero no han cursado Mecánica Analítica ni Cálculo Tensorial. En consecuencia, no se presentará la Teoría de Relatividad Especial en el espacio de Minkowski (formulación tensorial), ni se usarán herramientas propias de la mecánica analítica en general, salvo en ciertos temas particulares que serán incluidos en una carpeta intitulada “Temas Especiales”. No piense el lector que este enfoque representa una pérdida conceptual de la teoría. En algunos aspectos podrá ser más laborioso para obtener conclusiones, pero el contenido profundo y completo de la teoría puede ser descrito totalmente con este formalismo. Es opinión del autor que la Teoría de Relatividad Especial debe ser incorporada en la enseñanza secundaria, para lo cual este curso puede ser valioso para la elaboración de la bibliografía adecuada en ese nivel. Bibliografía La siguiente bibliografía es la recomendada para profundizar el estudio de la teoría. 1. "The Theory of Relativity", C. Möller, Oxford, 1952. 2. "Curso de Teoría de la Relatividad y de la Gravitación", A. Logunov, URSS, Moscú, 1998. 3. "Theory of Relativity", W. Pauli, Pergamon Press, New York, 1958. Nota importante En los últimos veinte años se ha generado una discusión en torno al uso de la masa relativista. En particular, los físicos e investigadores que trabajan en partículas elementales suelen rechazar el uso de dicha magnitud relativista, por lo cual hay una tendencia general a evitar su inclusión en artículos de investigación. Lo contradictorio de esta postura es que para evitar el uso de la masa relativista se debe modificar la definición de la cantidad de movimiento y limitar la validez del Principio de Equivalencia entre masa y energía. Todo ello puede hacerse válido pero resulta más complicado y, sin duda alguna, es un capricho. Esta postura arbitraria no tiene fundamentos ya que el uso adecuado de la masa relativista no implica error alguno, ni conceptual ni de cálculo. Más aún, en cualquier formulación teórica la variación de la masa con la velocidad (masa relativista) surge naturalmente para la conservación de la cantidad de movimiento (sin modificar su definición) y da validez general al Principio de Equivalencia entre masa y energía. En la Carpeta de Temas Especiales se incorporarán trabajos inéditos con desarrollos que muestran la necesidad y utilidad conceptual de la masa relativista. Queda claro que en este curso usaremos masa relativista y la definición clásica de cantidad de movimiento. Introducción En 1905 Albert Einstein (1879-1955), que era un empleado técnico de una oficina de patentes en Suiza, publicó en una revista científica alemana el trabajo denominado “Sobre la electrodinámica de los cuerpos en movimiento”. En este singular y extraordinario artículo se plantea la inconsistencia de resultados obtenidos con las ecuaciones de Maxwell en la resolución de conocidos problemas electromagnéticos para cuerpos en movimiento. La solución propuesta para dilucidar esa cuestión consistió en una revisión completa y la modificación profunda de los conceptos más básicos del conocimiento, el espacio y el tiempo, y resultó la formulación inicial de la Teoría de Relatividad Especial. Estos cambios conceptuales resultan como consecuencia del desarrollo de la Teoría, elaborada para sistemas inerciales, a partir de dos Postulados basados en hechos experimentales. Uno establece que cualquier fenómeno natural responde a la misma ley en todos los sistemas inerciales, y el otro postula la constancia de la velocidad de la luz en el vacío para todos los observadores. El primer postulado establece la imposibilidad de distinguir entre el reposo y el movimiento rectilíneo uniforme, en el sentido que son estados de movimiento naturales equivalentes, haciendo inconsistente la existencia de un sistema de referencia absoluto, y además provee la herramienta operativa fundamental para encontrar y validar todas las leyes relativistas. El segundo postulado afecta directamente a la Teoría de Relatividad de Galileo, publicada en 1637 y aceptada como una formulación de validez universal, con consecuencias directas en la mecánica de Newton, madre de todas las teorías físicas existentes. La Teoría formulada en ese trabajo científico es de una belleza inusual en la Física Teórica, particularmente por la sencillez del cálculo requerido y sus consecuencias en los conceptos más arraigados en el conocimiento del momento. Esta simpleza en el cálculo no es representativa de las grandes dificultades conceptuales que encierra su estudio, que requiere modificar el concepto previamente adquirido sobre el espacio y el tiempo. En el año 1916 Einstein presentó la Teoría de Relatividad General, luego del fracaso por incorporar el campo gravitatorio en la Relatividad Especial. Este tema será tratado posteriormente. La formulación y desarrollo de la Relatividad General conducen a una ecuación tensorial de segundo orden no lineal, para el campo gravitatorio, sin lograrse una solución general de la misma. A pesar de ello su aplicación en casos particulares dio resultados y predicciones de tanta importancia (conocidos como curvatura de la luz, corrimiento al rojo y desplazamiento del perihelio de Mercurio), que práctica y lamentablemente se abandonaron otras líneas de investigación del campo gravitatorio. La Teoría General de Relatividad de Albert Einstein, que esencialmente es una teoría de gravitación, ha sido el modelo seguido por varias Teorías Cosmológicas actuales. No obstante, en los últimos años resultados experimentales no compatibles con las predicciones teóricas han generado una incipiente resistencia a este modelo físicomatemático. En este sentido es interesante reconocer la existencia de otras teorías competitivas, entre las que se destaca la Teoría Relativista de Gravitación (2002) del notable físico ruso Anatoly Alekseyevich Logunov. El presente trabajo sobre la Teoría de Relatividad Especial está concebido como un enfoque físico para la enseñanza en un primer nivel universitario, prestando especial atención al orden y la forma en que deben ser tratados los distintos temas, que en muchos casos difieren de la bibliografía usual. Por razones didácticas varios aspectos son tratados de manera distinta al enfoque original, incluyendo discusiones conceptuales y deducciones propias. Los temas a tratar serán: 1 – Sistemas Inerciales 2 – Relatividad de Galileo 3 – Postulados de la Teoría de Relatividad Especial. Fundamentación 4 – Transformaciones de Lorentz 5 – Simultaneidad. Causalidad 6 – Contracción Espacial y Dilatación Temporal 7 – Cinemática Relativista. Efecto Doppler 8 – Cantidad de movimiento. Masa Relativista 9 – Dinámica Relativista. Fuerzas 10 – Trabajo y Energía 11 – Principio de Equivalencia entre Masa y Energía 12 – Complementos de Energía 13 – Masa Propia y Potencia Este orden en la formulación de la teoría es beneficioso pues, como veremos, evita elaborar argumentaciones complicadas usando varillas, relojes, haces luminosos y espejos, como suele figurar en la bibliografía convencional, incluido el genial trabajo original de Einstein, en un intento de elaborar conceptos nuevos sobre el espacio y el tiempo. Sistemas Inerciales La descripción del movimiento de un cuerpo requiere ineludiblemente la introducción de un sistema de coordenadas espaciales que permitan identificar unívocamente cada punto del espacio físico de interés, y una coordenada temporal que permita determinar el orden cronológico de sucesos en cualquier punto del espacio. A este conjunto de coordenadas espacio-temporal se lo denomina sistema de referencia. El número de coordenadas espaciales necesarias dependerá de los vínculos del sistema físico. Por ejemplo, cuando el movimiento esté limitado a una superficie, tal como sucede con objetos sobre una mesa, bastará con 2 coordenadas espaciales. Históricamente, hasta el advenimiento de la Teoría de Relatividad Especial, se aceptó que la coordenada temporal era la misma para todos los sistemas de referencia posibles, lo que la hacía independiente de la posición y del estado de movimiento relativo entre diferentes sistemas de referencia. Por otro lado, la descripción de los fenómenos (leyes) y el valor de las magnitudes involucradas resultaban diferentes dependiendo del sistema de referencia elegido, dando lugar a distintos grados de dificultad. Fue la obra de Galileo (“Diálogos acerca de Dos Nuevas Ciencias”) la que permitió asumir la existencia de un grupo particular de sistemas de referencia, llamados inerciales o galileanos, en los que los fenómenos mecánicos sucedían de la misma manera y las leyes tomaban la forma matemática más simple posible. Galileo estableció, a través de sus notables observaciones sobre reposo y movimiento rectilíneo uniforme de cuerpos libres de fuerza, que eran dos estados de movimiento equivalentes, relativos al observador. Supongamos tener dos cuerpos, uno en reposo y el segundo en movimiento rectilíneo uniforme, respecto de un observador O. Para otro observador O' que se moviera con la misma velocidad del segundo objeto, éste estaría en reposo y el primero, que supusimos en reposo, ahora tendría un movimiento rectilíneo uniforme. Además, postuló que en estos privilegiados sistemas se cumplía que los fenómenos mecánicos sucedían de la misma forma, respondiendo a las mismas (idénticas) leyes, por lo cual no era posible distinguir mediante experiencias mecánicas cual de ellos estaba en reposo y cual en movimiento. Isaac Newton le dio forma a estos conceptos a través del “Principio de Inercia”, cuyo significado profundo es postular la equivalencia entre sistemas inerciales. Existen dos definiciones de sistemas inerciales de uso cotidiano que son aceptadas en forma recurrente. La primera de ellas (históricamente) es la que establece que cualquier sistema de referencia que esté en reposo respecto de las estrellas fijas es un sistema inercial. La segunda postula que un sistema inercial es aquel en el que las leyes de la física adoptan la forma más simple posible. Ambas definiciones adolecen de inconsistencias y/o falta de rigor científico. Analicemos brevemente ambas definiciones tratando de establecer si son operativas y funcionales. La primera hace mención de estrellas fijas. Obviamente esto es una reminiscencia del modelo del éter y el sistema absoluto, que tuvo vigencia hasta el inicio del siglo XX. Asumiremos como estrellas fijas a aquellas que están tan alejadas que su movimiento relativo se hace imperceptible a simple vista, es decir que la distancia aparente entre ellas permanece invariable. En este caso la definición resulta adecuada para los sistemas de referencia que rotan respecto de ellas, dado que todos ellos son no inerciales pues aparecen fuerzas, denominadas ficticias (centrífuga y coriolis), que provocan que no se cumpla ninguno de los tres Principios de la Mecánica de Newton. Sin embargo, la definición falla si se trata de discriminar entre dos sistemas de referencia que, sin rotar respecto de las estrellas alejadas, tienen aceleración relativa rectilínea entre ellos, pues la posición aparente de las estrellas alejadas no sufre alteración perceptible, salvo que las velocidad relativa entre los sistemas de referencia sea muy elevada o cercana a la velocidad de la luz, en cuyo caso se detectarán modificaciones de posición de las estrellas alejadas. En resumen, con esta definición no es posible determinar (operativamente) si un sistema es inercial o no. La otra definición hace referencia a un concepto subjetivo, tal cual es lo de la forma más simple posible. Este mero hecho hace que la definición no sea precisa aunque, desde un punto de vista didáctico, tal vez sea la más recomendable si se la expone adecuadamente. En general la “simpleza” que adoptan las leyes depende del fenómeno particular al cual se apliquen. Nótese, por ejemplo en fuerzas centrales, el clásico problema de dos cuerpos que se atraen. Por conservación de momento angular el movimiento de ambos cuerpos sucede en un plano. Si usamos un sistema de referencia (no inercial) que rota con una adecuada velocidad angular y con su origen en el centro de masa del sistema de dos cuerpos, se obtiene un problema unidimensional de una única masa en un campo de fuerzas centrales, mucho “más simple” de resolver y analizar (véase Goldstein.”Mecánica Clásica”, Cap. III). Una definición más precisa es la siguiente: sistema de referencia inercial es todo sistema que esté en reposo o con movimiento rectilíneo uniforme respecto de un objeto material sobre el cual no actúa fuerza alguna, cualquiera sea su posición en el espacio. La dificultad (insalvable) de esta definición está en la imposibilidad física de disponer de un cuerpo libre de interacciones. Al no contar con una definición que operativamente permita determinar sin ambigüedad si un dado sistema de referencia es inercial o no, debe considerarse que la existencia de sistemas de referencia inerciales es una abstracción que no puede ser demostrada experimentalmente. El Principio de Inercia fue elaborado en una época en que se asumía que las interacciones entre cuerpos eran por contacto o por “acciones a distancia”, a velocidad infinita. No estaba desarrollada la Teoría electromagnética de Maxwell ni la noción de campo como un ente físico real. Los experimentos sobre fricción realizados por Galileo mostraron que si una esfera se hacía rodar sobre una tabla horizontal ella llegaría más lejos si las superficies estaban pulidas y lustradas. Por ello Galileo, contradiciendo las ideas aristotélicas, aseveró que la fricción era la que frenaba a la esfera, que si no hubiera rozamiento no sería necesario estar empujándola para mantener su velocidad y el cuerpo seguiría con movimiento rectilíneo uniforme eternamente. Pero en este caso tendríamos un movimiento sin que hubiera una acción aplicada en la dirección del movimiento, condición idéntica a la de los cuerpos en reposo. Si a estos conceptos le agregamos sus disquisiciones sobre cómo suceden los fenómenos mecánicos (caída de los cuerpos) sobre un barco que se desplaza suavemente en línea recta y sin aceleraciones, obtenemos el significado del Principio de Inercia, esto es que los sistemas inerciales son equivalentes y que no hay manera mecánica de distinguir cual de los dos está en reposo o en movimiento. Todas las leyes de la mecánica tienen la misma forma en dichos sistemas y las magnitudes involucradas, cuyo valor puede ser distinto en dos sistemas inerciales, se relacionan a través de las Transformaciones de Galileo. Actualmente el Principio de Inercia tiene una significación más general en virtud del conocimiento que se agregó durante 400 años. En primer lugar Einstein lo extendió a todos los fenómenos, es decir que todas las leyes de la física tienen la misma forma en los sistemas inerciales. Además, luego de la incorporación de la acción a través de campos, debida a Maxwell, y la constancia de la velocidad de la luz en el vacío para todos los sistemas inerciales, se modificó la relación entre estos sistemas que ahora se vinculan con las Transformaciones de Lorentz. Los sistemas inerciales pueden ser considerados una proposición arbitraria y artificial generada por el desconocimiento sobre las leyes que cumplen las interacciones de tipo gravitatorio. Si se dispusiera de un modelo matemático que describiera al campo gravitatorio en un sistema inercial y se conocieran los campos que generan los objetos materiales en movimiento, las fuerzas inerciales tales como la centrífuga y la de coriolis, que aparecen en los sistemas de referencia que rotan respecto de las estrellas alejadas, podrían ser tratados como efectos provocados por la rotación de la materia. Corresponde aclarar que el último enfoque está en contradicción aparente con la Teoría General de Relatividad pues en ella la gravitación está íntimamente ligada con el espacio y el tiempo, relación que se pierde al tratar al campo gravitatorio como un campo clásico como el eléctrico. No obstante, no debemos olvidar que las teorías son modelos elaborados para describir la realidad lo mejor posible, que serán reemplazados por modelos superiores. Por último, cabe preguntarse si el concepto de equivalencia de sistemas inerciales no puede generalizarse a todos los sistemas de referencia, incluso los acelerados, postulando que dos sistemas son equivalentes si el movimiento relativo entre ellos es a velocidad constante, y en ellos las leyes conservan la forma asumiendo que los sistemas se relacionan a través de las Transformaciones de Lorentz (u otras adecuadas). Para ello debería disponerse de las ecuaciones (leyes) que corresponden a las distintas interacciones y los campos correspondientes, incluidos los gravitatorios, válidas en un sistema y que conserven la forma ante Transformaciones de Lorentz. Lamentablemente tenemos una descripción completa sólo para el caso electromagnético (ecuaciones de Maxwell). La idea resulta muy interesante pues, si fuera consistente, permitiría aplicar la física relativista de la Teoría de Relatividad Especial en cualquier sistema de referencia. Relatividad de Galileo La primera Teoría de Relatividad fue desarrollada por Galileo Galilei (1564-1642), creador del método científico, como resultado de sus estudios sobre movimiento de cuerpos, rozamiento y caída libre. En sus obras “Diálogo sobre los principales sistemas del mundo" (1632) y “Diálogos acerca de Dos Nuevas Ciencias” (1636), dio las características de los sistemas de referencia inerciales o “galileanos”, con una notable descripción de experimentos y su interpretación para dos observadores en movimiento relativo, uno de ellos sobre un barco que se desplaza suavemente (sin aceleración), y el otro en tierra firme. Las conclusiones obtenidas permiten postular en sistemas inerciales la equivalencia entre reposo y movimiento rectilíneo uniforme para dos observadores en movimiento relativo, sentando las bases del Principio de Inercia. Asimismo, enunció la relatividad de las trayectorias y de las velocidades de objetos respecto del observador. Veamos como se desarrolla esta Teoría. Caída de los cuerpos La primera demostración rigurosa sobre que todos los cuerpos caen con la misma aceleración la dio Galileo mediante un razonamiento por el absurdo. Supongamos tener dos cuerpos de distinto peso, material y forma, que los dejamos caer partiendo del reposo en un sistema inercial. De acuerdo a las ideas aristotélicas el más pesado caería más rápido, como muestra la figura. Ahora realicemos la misma experiencia pero agregando un nuevo cuerpo formado por dos objetos idénticos a los iniciales, ligados entre si (pegados). Para este nuevo objeto durante su caída el de mayor peso está siendo frenado por el pequeño, que cae más despacio, mientras que el pequeño está siendo acelerado por el grande, que cae más rápido. En consecuencia el nuevo cuerpo caerá ubicado entre los cuerpos originales, resultando una contradicción pues es el más pesado. La única solución lógica posible es que todos caigan igual. Resuelto el tema anterior, Galileo encaró descubrir la ley de caída, es decir encontrar la función que permita relacionar la posición con el tiempo durante la caída. Para ello, siendo Profesor en la Universidad de Pisa (1589), diseñó un modelo experimental que contemplaba obtener un conjunto de pares de datos correspondientes a posición y tiempo, que obtendría soltando objetos desde los distintos pisos de la Torre de Pisa. La dificultad principal resultó la medición del tiempo de caída, que era obtenida con el pulso de un abate. Los resultados no eran precisos ni repetitivos y no permitieron obtener la ley. Luego del fracaso inicial decidió determinar los tiempos utilizando una “clepsidra”, que es un recipiente con agua que tiene una canilla de salida (tapón cónico de madera). El proceso de medición de tiempos consistía en abrir la canilla cuando soltaba el cuerpo y cerrarla cuando el objeto llegaba al piso. La masa del volumen de agua recogida lo determinaba con una balanza y era proporcional al tiempo transcurrido. Lamentablemente, este método tampoco resultó lo suficientemente preciso para asegurar un comportamiento, por lo cual Galileo concluyó que la dificultad central de este proyecto era la rapidez con que caían los cuerpos. Era necesario entonces retrasar la caída de los cuerpos, es decir lograr que caigan más despacio. Luego de unos importantes estudios sobre fricción, con esferas de madera sobre una tabla lustrada, desarrolló el “plano inclinado” como dispositivo para retrasar la rapidez de la caída de los cuerpos. No resulta pretencioso asegurar que el Plano Inclinado de Galileo fue el primer acelerador de partículas en la historia, y el más importante. Con este avance experimental obtuvo un conjunto de pares (x,t) que permiten hacer un gráfico de puntos (x,t) y ajustarle un polinomio, resultando que una parábola es adecuada para dicho ajuste. La ley obtenida por Galileo fue: Siendo e el espacio recorrido en un tiempo t, con aceleración constante a. Nota Sugiero al lector que analice porqué el polinomio de ajuste no puede ser de grado impar. Es muy interesante describir, de acuerdo con datos históricos, algunos aspectos sobre cómo Galileo obtuvo la ley de caída de los cuerpos con el plano inclinado (actividades realizadas en la Universidad de Padua a partir de 1592). Si bien este dispositivo permite retardar la caída disminuyendo al ángulo que el plano forma con la horizontal, dicho ángulo no podía ser muy chico pues, en ese caso, el rozamiento se haría importante y no podría despreciarse. Por otro lado, la determinación de los intervalos no era simple, ya que la clepsidra no brindaba la precisión suficiente y los datos de pruebas repetidas presentaban gran variabilidad, no resultando adecuado para el objetivo propuesto. Aunque resulte increíble, Galileo decidió usar un péndulo para medir los tiempos..., y una metodología genial. Determinar con precisión lapsos breves con un péndulo suena a disparate, a menos que dichos lapsos se inicien y terminen exactamente coincidentes con la bolita del péndulo en un extremo de la oscilación, pues ello es una condición fácilmente distinguible y precisa. Por ejemplo, si con el péndulo oscilando se suelta la esfera en el plano inclinado (inicio de la caída) exactamente en el instante en que la oscilación cambia de sentido, y luego se logra que la caída de la esfera concluya con el péndulo en idéntica posición al cabo de un período completo, el error de medición se minimiza. Luego se repite el método para dos períodos, y así sucesivamente. Obviamente, se deben seleccionar los espacios recorridos en el plano inclinado para que se cumpla la condición anterior, para 1, 2, 3,..., n oscilaciones. Para ello Galileo usó un tope móvil de madera y ajustó su posición correcta del final de la caída que corresponda, con el sonido del choque entre la esfera y el tope, coincidente con la posición del péndulo en un extremo de la oscilación. Así obtuvo la ley de caída de los cuerpos, que inicialmente se llamó la “Ley de los números impares”, debido a que los espacios recorridos en cada oscilación del péndulo tenían esa sucesión numérica (ver figura). Dado que la suma de los n primeros términos de la sucesión de números impares es n2, se obtiene que el espacio recorrido es directamente proporcional al cuadrado del tiempo. Transformaciones de Galileo Sean dos sistemas de referencia inerciales (O y O’). Llamaremos V (en mayúscula) a la velocidad relativa entre ellos, v (en minúscula) la velocidad de un objeto respecto de O, y v’ la velocidad respecto de O’. Las coordenadas espaciales x,y,z se refieren al sistema de O, siendo x’,y’,z’ las correspondientes al sistema del observador O’. En general, todas las variables no primadas corresponderán al sistema O y las primadas al O’. Supongamos que en el instante inicial ambos sistemas coinciden. Para una mejor visualización los esquemas tendrán al sistema O´debajo del O, y por simplicidad supondremos arbitrariamente que el O está en reposo y el O´con velocidad constante V en la dirección del eje x. Supongamos un objeto en reposo en O. Para un observador fijo en O’ este objeto se mueve con velocidad v' = -V , con movimiento rectilíneo uniforme según el eje x’. La posición del objeto para O’ irá variando según la relación x' = x-V t , pues V es constante. En general, la relación funcional entre las coordenadas de ambos sistemas, conocidas como Transformaciones de Galileo, serán: La coordenada temporal es la misma en ambos sistemas. Estas transformaciones son la base conceptual que fundamentan la “Dinámica del punto material”, desarrollada por Newton. Relatividad de las trayectorias Se deja caer un objeto partiendo del reposo y con coordenadas iniciales (x0 ,y0 ,0), en el sistema O. Su trayectoria es rectilínea en dicho sistema, como muestra la figura, y se pretende determinar cómo es para un observador en O’. En el sistema O el movimiento del cuerpo cumple con En el sistema O’ la trayectoria estará dada en forma paramétrica. Resolviendo este sistema de dos ecuaciones se obtiene la forma explícita Esta es la ecuación de una parábola invertida como muestra el siguiente gráfico. La conclusión es que la trayectoria de un objeto es relativa al sistema de referencia. Lo que es una caída libre rectilínea para un observador será un arco de parábola para otro en movimiento respecto del primero. Un ejemplo interesante y cotidiano lo ofrece la lluvia. Asumamos que está lloviendo y no hay viento. Para un observador “en reposo” la lluvia cae verticalmente, mientras que para un observador en movimiento con velocidad constante las trayectorias de las gotas de agua son rectas inclinadas como muestra la figura. Se deja planteado demostrar que las trayectorias para O’ no son arcos de parábola debido a que las gotas no caen en caída libre (MRUV) sino a velocidad constante por la fricción con el aire. Teorema de adición de velocidades Este importante Teorema fue demostrado por Galileo en una época en que aún no se conocían las derivadas. El problema consiste en determinar, para un mismo objeto, como se relacionan las velocidades que le miden dos observadores inerciales en movimiento relativo. Su demostración es muy simple y sus consecuencias eran muy conocidas pues se lo aplicaba cotidianamente. Por ejemplo, para subirse a un carro en movimiento lo mejor es correr hasta ponerse en reposo respecto del carro. La importancia de este Teorema radica en que Galileo mostró matemáticamente su validez en todos los sistemas inerciales. Con las Transformaciones de Galileo podemos relacionar fácilmente las velocidades de un mismo objeto medidas desde O y O’, resultando: Teorema de Adición de velocidades Es decir: La conclusión es que la velocidad de un móvil es diferente para dos observadores en movimiento relativo. Las aceleraciones son absolutas Siendo la aceleración de un punto material la derivada de su velocidad respecto del tiempo, resulta muy simple encontrar qué valor tendrá en dos sistemas inerciales en movimiento relativo. Derivando la expresión obtenida en el Teorema de adición de velocidades, obtenemos: La aceleración de un punto material es absoluta, es decir que su valor es el mismo medido en cualquier sistema de referencia inercial. Este resultado junto a la invariancia de la masa de un punto material fundamenta la aseveración de que mediante experimentos mecánicos no hay posibilidad alguna de determinar cual sistema está en reposo y cual en movimiento, pues las magnitudes Fuerza, Masa y Aceleración son absolutas. Postulados de la Teoría de Relatividad. Fundamentación Supongamos tener una fuente luminosa en reposo respecto de un observador O1 en un sistema inercial, y otros dos observadores en movimiento relativo constante respecto del primero, tal que el O2 se acerca y el O3 se aleja, como muestra la figura. Los tres observadores miden la velocidad de la luz proveniente de S. Asumiendo que están en el vacío el observador O1 mide c (300.000 Km/seg). De acuerdo a la Teoría de Relatividad de Galileo, aplicando el teorema de adición de velocidades, el observador O2 debería medir c+V, y el O3 mediría c-V. Una serie de experimentos ópticos muy precisos, realizados con un interferómetro por los investigadores norteamericanos Michelson y Morley, dieron reiteradamente como resultado que los tres observadores miden la misma velocidad C. Ante este hecho se plantean dos soluciones posibles: 1 – La medición está mal realizada. 2 – Las transformaciones de Galileo son incorrectas. Resulta obvio que los científicos especialistas de la época se inclinaron masivamente por la opción 1, pues la otra implica la invalidez del soporte de la mecánica de Newton. Uno de los intentos más elaborado que tuvo aceptación parcial fue hecho por H. Lorentz (1853-1928), que propuso que dado que cualquier equipamiento que se use para medir velocidad debe inexorablemente medir espacio y tiempo, el movimiento relativo entre observadores, respecto del "éter" en un sistema de referencia "absoluto", provocaba modificaciones físicas en sus respectivos equipos, tales que los espacios recorridos y los tiempos empleados se determinaban con error. Completó sus argumentos fundamentándolos con su Teoría del electrón (publicada un tiempo después) y haciendo el cálculo de las modificaciones espaciales y temporales que debía sufrir el dispositivo, encontrando las relaciones de espacio y tiempo en función de la velocidad del observador respecto de la fuente. Estas leyes se conocieron como “Transformaciones de Lorentz”. No todos los científicos compartían esta postura. Existe una anécdota atribuida al gran físico matemático francés Henri Poincaré (1854-1912), que habría dicho: “Es más probable que sea un error de cuenta cada vez que la hicieron, que sea cierta la propuesta de Lorentz de errores inteligentes”. En el año 1900 Poincaré hace conocer su análisis sobre la proposición de Lorentz, indicando que "si la Teoría de Lorentz es correcta habría que abandonar probablemente algunos principios de la mecánica newtoniana". Agrega: "la teoría del electrón no sólo viola el principio de acción y reacción sino la conservación del momento" (Berkson, 1981). Esto último es la principal e insalvable inconsistencia pues la conservación del momento era (y sigue siendo) un principio universal. Sobre este tema volveremos más adelante. Albert Einstein, que aparentemente desconocía las Transformaciones de Lorentz, eligió la opción 2. En su trabajo científico "Sobre la Electrodinámica de Cuerpos en Movimiento", luego rebautizado como Teoría de Relatividad (por sugerencia de Max Planck), dedujo las transformaciones espacio temporales que vinculaban a dos sistemas inerciales, que paradójicamente resultaron ser las Transformaciones de Lorentz, aunque con una interpretación absolutamente diferente. En su trabajo original Einstein hace inicialmente un análisis sobre simultaneidad de eventos y lo vincula con la medición de distancias y tiempos, detallando un método adecuado para sincronizar relojes en distintos puntos de un sistema inercial, válido bajo condiciones de isotropía y homogeneidad del espacio y uniformidad del tiempo. Por razones didácticas un análisis sobre espacio y tiempo lo trataremos por separado en este mismo capítulo. Aceptemos, por el momento, que en un sistema inercial la métrica está establecida y el tiempo está sincronizado. Un objeto en reposo mide lo mismo en cualquier posición del espacio y orientación del objeto (homogeneidad e isotropía), y un evento o fenómeno bajo las mismas condiciones tarda lo mismo en cualquier lugar y momento en que ocurra (uniformidad). Los postulados de La Teoría de Relatividad Especial enunciados por Einstein son: 1. Principio de Relatividad Las leyes que describen los cambios de los sistemas físicos no resultan afectadas si estos cambios de estado están referidos a uno u otro de dos sistemas de coordenadas en traslación con movimiento uniforme. 2. Principio de invariancia de la velocidad de la luz Cualquier rayo de luz se mueve en el sistema estacionario con velocidad "c", tanto si el rayo es emitido por un cuerpo en reposo o en movimiento. El primer postulado está indicando que en todos los sistemas inerciales todos los fenómenos ocurren de la misma forma, es decir que tienen el mismo comportamiento, por lo cual todos los sistemas inerciales resultan absolutamente equivalentes e indistinguibles. No hay posibilidad alguna de determinar cual está en reposo o en movimiento. Sin duda, este enunciado hace innecesario e incluso contradictorio la existencia de un sistema de referencia absoluto. Asimismo, incorpora implícitamente el Principio de Inercia. No debe confundirse lo anterior con que una magnitud física tomará el mismo valor en todos los sistemas inerciales, pues una magnitud no es una ley. Supongamos, por ejemplo, un fenómeno eléctrico simple, una carga puntual en reposo en el origen de coordenadas de un sistema inercial. En este sistema un observador medirá un campo eléctrico E estacionario y un campo magnético B=0, dado que no hay corrientes ni imanes. Otro observador en movimiento relativo constante medirá un campo eléctrico E’ que no es estacionario, pues para este observador la carga se está moviendo, y un campo magnético B’ distinto de cero debido a que la carga que está en movimiento es una corriente. O sea, las magnitudes involucradas tienen diferente valor para dos observadores en movimiento relativo. Sin embargo, las leyes (Ecuaciones de Maxwell) que describen el fenómeno son las mismas en los dos sistemas. Su aplicación en cada uno de los sistemas dará el resultado correcto, siendo diferente en cada sistema los valores de las magnitudes que intervienen. El segundo Postulado acepta la constancia de la velocidad de la luz como un Principio Universal, sustentado en resultados experimentales, resultando la clave para vincular dos sistemas inerciales ya que permite encontrar las transformaciones de coordenadas necesarias para que la velocidad de la luz sea la misma en ambos sistemas. Espacio y Tiempo La Teoría de Relatividad no es un modelo sobre el movimiento de los cuerpos, o de la Mecánica o del Electromagnetismo, ni sobre alguna disciplina particular de la Física. Es una teoría sobre el espacio y el tiempo, que trata sobre sus propiedades y de qué manera ellas inciden y regulan las leyes sobre el comportamiento de los fenómenos naturales. Tratemos de describir brevemente algunos aspectos de interés sobre la evolución que sufrieron estos conceptos básicos fundamentales. La experiencia mostró que el espacio físico (tridimensional) posee una simetría particular por la cual el tamaño y la forma de los objetos materiales en reposo respecto de un observador no dependen de la posición ni de la orientación del objeto. Este simple hecho permite determinar empíricamente una unidad de medida espacial e introducir el concepto de distancia, requisito necesario para reconocer la geometría correspondiente al espacio, que resultó la euclídea, válida para todo observador. Estas propiedades se conocen hoy como homogeneidad e isotropía del espacio. Análogamente, por observación de los fenómenos naturales periódicos se asumió que el tiempo físico, concepto que permite ordenar la ocurrencia de sucesos (“antes” y “después”), era una magnitud unidimensional mensurable que admite una definición similar a la de distancia, llamada intervalo o duración. La experiencia mostró también que el tiempo físico poseía una simetría particular por la cual la duración de un dado evento causal, bajo idénticas condiciones, no dependía del lugar de ocurrencia ni del instante de inicio. Esta propiedad actualmente se denomina uniformidad del tiempo. Hasta fines del siglo XIX se suponía que el espacio y el tiempo eran magnitudes independientes con valores absolutos, por lo cual toda medición de distancia o de intervalo era idéntica para todo observador. Nuestro Universo era tridimensional, de geometría euclídea, y solamente su evolución requería el análisis temporal, sin que ello incidiera en las propiedades del espacio. La métrica del espacio (euclídeo tridimensional) era invariante, condición que puede expresarse en coordenadas cartesianas mediante: ds2 = dx2 + dy2 + dz2 Invariante Esta interpretación, aceptada durante más de dos milenios, puede ser entendida con un ejemplo cotidiano. Supongamos tener una dada secuencia de fotos de un móvil, obtenidas a intervalos conocidos y cámara fija, tal que el movimiento del objeto puede estudiarse por comparación y así conocer la evolución del fenómeno dinámico. Cada foto será distinta pero ellas siguen siendo bidimensionales, su métrica espacial es la misma (y su escala se conserva). Los trabajos de Lorentz y Poincaré, aparecidos alrededor del año 1900, mostraron que las “distancias” e “intervalos”, medidos sobre un mismo fenómeno por observadores en movimiento relativo, daban resultados distintos y dependientes de la velocidad entre observadores. La geometría espacial seguía siendo euclídea para cada observador (para cuerpos en reposo) pero las distancias y los intervalos medidos no eran idénticos (nacía la relatividad post Galileo), es decir que la métrica euclídea tridimensional no era invariante. Con el advenimiento de la Teoría de Relatividad de Einstein (1905) quedó claramente establecido que para todo observador inercial el espacio y el tiempo conservaban las históricas propiedades, pero sus métricas (espacial y temporal) diferían entre sistemas de referencia con movimiento relativo constante. Las transformaciones de Lorentz eran las relaciones funcionales que vinculaban dos sistemas de referencia inerciales. Sin embargo, inicialmente no se entendió que esta relación funcional (Lorentz) entre sistemas de referencia inerciales implicaba algo mucho más profundo: el Universo era esencialmente de cuatro dimensiones. Este descubrimiento se debió a Minkowski (1908) quien se percató que la pérdida de invariancia de la métrica euclídea espacial era debida a la relación existente entre el espacio y el tiempo, por lo cual la métrica correcta debía contener al tiempo. La adecuada métrica invariante en cuatro dimensiones se deduce fácilmente de las Transformaciones de Lorentz, resultando: ds2 = c2dt2 – (dx2+dy2+dz2) Invariante Debido a los signos distintos de las partes espacial y temporal en el segundo miembro, esta métrica se denominó seudo euclídea a propuesta de Klein y Hilbert. Importantes estudios contemporáneos han mostrado que las propiedades de simetría del espacio y el tiempo, representadas mediante su métrica en un espacio de cuatro dimensiones (y su invariancia), son suficientes para fundamentar la Teoría de Relatividad Especial, sin necesidad de recurrir a los postulados propuestos por Einstein. Específicamente se ha demostrado que si aceptamos que los fenómenos que ocurren en nuestro Universo responden a una métrica cuadridimensional seudo euclídea del espacio-tiempo, entonces el Principio de Relatividad y la existencia de una velocidad tope y absoluta pueden ser obtenidos como consecuencias. De acuerdo con el notable físico ruso A. Logunov, la Teoría de Relatividad queda rigurosamente establecida postulando que los fenómenos físicos suceden en un espacio cuadridimensional cuya geometría es seudo euclídea. Consecuencias Esta formulación moderna de la Relatividad Especial (Logunov, 1996) reviste una extraordinaria importancia ya que establece rigurosamente que las condiciones de validez de la teoría dependen única y exclusivamente de las propiedades del espacio y el tiempo asignadas. No es necesario postular la constancia de la velocidad de la luz ni el Principio de Relatividad. Es fundamental resaltar que la homogeneidad e isotropía del espacio, la uniformidad del tiempo, y la métrica seudo euclídea invariante, que convalidan la Teoría Especial de Relatividad, son exactamente los mismos postulados que fundamentan los llamados Principios Universales de conservación (Teorema de Emmy Noether, 1915), por lo cual todas las leyes válidas en esta teoría poseen la misma jerarquía que las leyes de conservación de la energía, de la cantidad de movimiento y del momento angular. En consecuencia, el extraordinario descubrimiento hecho por A. Logunov nos pone frente a una integración histórica de las leyes relativistas de la Física y los Principios Universales, generando una situación crítica, ya que el incumplimiento de cualquiera de estas leyes relativistas que signifique invalidar sus fundamentos obligará a revisar todo el conjunto, pues todas ellas se derivan de los mismos postulados básicos. Asimismo, la existencia de una velocidad máxima posible, única y absoluta, obtenida como consecuencia de asumir una geometría seudo euclídea del espacio-tiempo y su métrica invariante, clarifica que cualquier modelo teórico que proponga otra alternativa, tal como atribuir velocidades máximas diferentes a la gravedad y al electromagnetismo (T. van Flandern, "The speed of gravity - What the experiments say", 1998; S. Kopeikin, "Bi-metric theory of gravity", 2006, etc.), poseerá una métrica espacio temporal diferente a la seudo euclídea. Dado que la forma matemática de una ley tiene implícita la geometría utilizada, las leyes que describen el comportamiento de los fenómenos serán distintas en marcos teóricos que usen diferentes métricas. Destaquemos la evidente incompatibilidad entre las teorías General y Especial, debida a que las propiedades establecidas en cada caso para el espacio y el tiempo son contradictorias y antagónicas entre sí. Ante la presencia de masa ambas teorías tienen métricas espacio temporales distintas, lo que implica que los fenómenos se interpretan de manera distinta y, por supuesto, responden a leyes diferentes. Como vemos, existe una profunda sutil diferencia entre cambiar de sistema de referencia espacio temporal, procedimiento usual, útil y lícito, a modificar sus propiedades cambiando la métrica. No debemos extrañarnos, entonces, que en la Teoría General de Relatividad no se cumplan ni los Principios Universales ni la Relatividad Especial, dado que la métrica (espacio curvo) es dependiente de la distribución de materia. Más aún, ninguna ley relativista en el espacio de Minkowski es válida en la Teoría General, y ello incluye al Electromagnetismo de Maxwell. En este sentido digamos que hay una discusión centenaria respecto de la validez de la mal denominada Paradoja de Born, sobre que un electrón en movimiento hiperbólico no irradia en el espacio curvo de la Teoría General y sí lo hace en el espacio de Minkowski. Este tema puede ser profundizado con los siguientes trabajos: 1. “Curso de Teoría de la Relatividad y de la Gravitación”, A. Logunov, Lecciones 1 y 2, 1998. 2. "Relativity without light", N. Mermin, Am. J. Phys. 52 (2), 1984. 3. "Special Relativity in the 21st century", S. Cacciatori, V. Gorini, A. Kamenshchik, 2008. 4. "The Theory of Relativity - Galileo's Child", Mitchell J. Feigenbaum, 2008. Transformaciones de Lorentz Los Postulados de Einstein no son consistentes con las Transformaciones de Galileo, ya que la constancia de la velocidad de la luz para todos los observadores inerciales resulta incompatible con el Teorema de adición de velocidades de Galileo. Considerando que la medición de velocidades implica medir espacio recorrido y tiempo empleado, no debemos anticipar o prejuzgar características espaciales y/o temporales para las transformaciones de coordenadas entre sistemas inerciales. Resulta interesante remarcar que el primer desarrollo lógico como continuación inmediata de la Teoría cuyos Postulados acabamos de ver, sería encontrar, si es posible, las Transformaciones que satisfacen ese requerimiento. Debe tenerse muy presente que las transformaciones que vinculan a los sistemas inerciales serán la base fundamental y soporte de todas las leyes físicas, dado que las leyes deberán conservar su forma ante esas transformaciones. Además, dado que las transformaciones buscadas son relaciones funcionales entre las coordenadas (espacio y tiempo) de dos sistemas inerciales cualesquiera, veremos que su análisis e interpretación permitirán obtener un mayor conocimiento sobre estos dos conceptos fundamentales. Consecuentemente, corresponde establecer las hipótesis necesarias para encontrar tales transformaciones para dos sistemas inerciales en movimiento relativo, y que posean la propiedad de que en los sistemas el valor de la velocidad de la luz en el vacío sea el mismo. Existen varias deducciones distintas de estas transformaciones de coordenadas en la bibliografía específica, con distintos grados de dificultad y enfoque. De acuerdo a mi larga experiencia docente, cualquiera de estas deducciones resulta muy complicada al alumno tipo. Al respecto, he desarrollado una demostración que, en mi opinión y por razones didácticas, resulta ser la más simple sin perder rigor o generalidad, que veremos a continuación. Hipótesis (fundamentadas por experimentos) En todo sistema inercial se cumple: 1. El espacio es isótropo y homogéneo. 2. El tiempo es uniforme. 3. La velocidad de la luz en el vacío es absoluta y vale 300000 Km/seg (Postulado de Einstein). Las primeras dos hipótesis garantizan que el tamaño de un objeto ideal rígido en reposo sea el mismo en cualquier posición y orientación del espacio, y que la duración de un fenómeno bajo idénticas condiciones sea independiente del momento y lugar en que ocurre. Estas hipótesis, que deberían ser elevadas a la categoría de postulados universales, están fundamentadas en 400 años de experiencias. Su importancia se hace notoria con los siguientes razonamientos: 1) si un objeto conserva su tamaño ello permite definir una unidad de longitud; 2) si la duración de un determinado fenómeno causal no depende del instante inicial del mismo, podremos definir una unidad de tiempo. Estas dos propiedades del espacio y el tiempo son las que definen la "métrica" del sistema de referencia. Ello nos limita a que las transformaciones de coordenadas (x,y,z,t) entre dos sistemas inerciales deben ser lineales, pues de lo contrario se perdería la homogeneidad y/o la uniformidad. Aclaremos un poco más esta última aseveración. Las transformaciones de coordenadas que permiten pasar de un sistema de referencia (x,y,z,t) a otro (x’,y’,z’,t’) están dadas por 4 relaciones funcionales, que en el caso más general pueden expresarse por: x’=f1(x,y,z,t) y’=f2(x,y,z,t) z’=f3(x,y,z,t) t’=f4(x,y,z,t) Tratemos de analizar cómo deben ser estas funciones para que el espacio y el tiempo posean los mismos atributos en ambos sistemas. Supongamos que la función x’=f1(x,y,z,t) es la siguiente relación cuadrática: x’=a.x2, siendo a una constante. En este caso un objeto rígido de longitud L=x2-x1 en el sistema O, cuyo tamaño es el mismo en cualquier posición sobre el eje x, en el sistema O’ tendrá una longitud dada por L’=(x’2-x’1)= a(x22 - x12), cuyo valor depende de la posición en que esté ubicado sobre el eje x. Nótese que si desplazo el objeto en la dirección del eje x’ su longitud cambia. Es decir que en el sistema primado el espacio no es homogéneo. El mismo análisis puede hacerse con las otras coordenadas, llegando a la conclusión de que la única manera de mantener similares propiedades del espacio y el tiempo en ambos sistemas es que las transformaciones sean lineales, cuya expresión más general para la coordenada x' es: x’= a1 x+a2 y+a3 z+a4 t+a5 Nota Muchas de estas constantes podrán anularse con la elección particular de ambos sistemas. Por ejemplo, si establecemos que en el instante t=t'=0 los sistemas coinciden, los términos independientes (a5) se anularán. Sean dos sistemas de referencia inerciales (O y O’), inicialmente coincidentes. Llamaremos V (en mayúscula) a la velocidad relativa entre ellos. Cuando exista un objeto en movimiento, será v (en minúscula) su velocidad medida en el sistema O, y v’ su velocidad respecto de O’. Las coordenadas (x,y,z,t) se refieren al sistema de O y las coordenadas (x’,y’,z’,t’) son las correspondientes al sistema O’. En general, todas las variables no primadas corresponderán al sistema O y las primadas al O’. Supongamos que en el instante inicial ambos sistemas coinciden. Para una mejor visualización los esquemas tendrán al sistema O’ debajo del O. Por simplicidad supondremos arbitrariamente que el O está en reposo y el O’ con velocidad constante V en la dirección del eje x, como muestra la figura. Esta selección de movimiento relativo según el eje x hace que las coordenadas (y’; z’) sean idénticas a las (y; z), de acuerdo con las hipótesis establecidas. Las transformaciones lineales de coordenadas para relacionar ambos sistemas son de la forma: Mediante un cálculo simple podemos hallar la relación de velocidades (de un objeto) entre sistemas, obteniendo: Siendo a1; a2; a3; a4 constantes arbitrarias que determinaremos mediante cuatro (4) experimentos pensados. Experimento 1 - Objeto en reposo en O Para un observador en O’ este objeto se mueve con velocidad v´=-V, con movimiento rectilíneo uniforme según el eje x’. Experimento 2 - Objeto con vx = V en O Para un observador fijo en O’ este objeto está en reposo. Experimento 3 – Un haz de luz se propaga según el eje x en O En ambos sistemas la velocidad medida resulta c. Experimento 4 – Un haz de luz se propaga según el eje y en O En ambos sistemas la velocidad medida resulta c. Halladas las constantes quedan determinadas las transformaciones de coordenadas que vinculan ambos sistemas, resultando ser las Transformaciones de Lorentz, pero con diferente significado, ya que son las transformaciones lineales que relacionan la métrica de dos sistemas de referencia inerciales. Tienen la propiedad de que la velocidad de la luz resulta la misma (c) en todos los sistemas inerciales. Esta deducción tiene la ventaja que utiliza como argumento principal la constancia de la velocidad de la luz y el Teorema de Pitágoras. Las mismas nos permiten pasar del sistema O al O’. Si quisiéramos encontrar las transformaciones que permiten pasar del O’ al O bastaría con despejar las variables (x, y, z, t) en función de (x’, y’, z’, t’). Transformaciones de Lorentz Estas transformaciones no son generales pues corresponden al caso particular en que la velocidad relativa entre sistemas es colineal con el eje x. Algunos temas particulares requieren que la dirección de la velocidad entre sistemas de referencia inerciales sea cualquiera. En este caso las Transformaciones de Lorentz generales son más complicadas, resultando una expresión simple si se usan las coordenadas tangencial y transversal a la velocidad V, respectivamente (Pauli, “Theory of Relativity”, pág. 10): Importante: Nótese que si la velocidad relativa entre sistemas es mayor que c se obtienen valores imaginarios de espacio y tiempo, perdiendo su significado físico. Asimismo, hacer la velocidad del sistema igual a c genera una indeterminación pues el denominador se anula en las Transformaciones de x y t. En consecuencia, asignar a un sistema de referencia inercial una velocidad relativa V mayor o igual a la velocidad de la luz carece de significado y no puede ser tratado en el marco de esta Teoría. Se podría pensar erróneamente que esto último conforma una limitación de validez de la Teoría de Relatividad Especial. Si se analiza cuidadosamente se concluye que proponer una velocidad invariante tiene como consecuencia que dicha velocidad (c) es una cota máxima para un espacio-tiempo real, pues fija el dominio del parámetro V tal que -c < V < c. En consecuencia, proposiciones tales como fijar un sistema de referencia a un haz de luz o a un fotón en el vacío, es un error conceptual. Algunas otras importantes conclusiones podemos obtener de un primer análisis. Las Transformaciones de Lorentz convergen a las de Galileo si V << c. Esto resulta importante pues nos permite asegurar que la mecánica clásica es valedera para velocidades bajas respecto de la de la luz. Cuando V es mucho menor que c el tiempo resulta absoluto (t'=t). La experiencia posterior a la Teoría de Relatividad nos ha mostrado que todas las leyes relativistas convergen a las leyes clásicas correspondientes cuando las velocidades involucradas son mucho menor que c, lo que se tradujo en el Principio de Correspondencia. El Principio de Correspondencia establece como condición necesaria de validez que todas las leyes relativistas tiendan a las clásicas cuando V/c tiende a cero, proveyendo una importante herramienta operativa para el desarrollo de leyes relativistas en cualquier línea de trabajo. Tiempo y espacio están vinculados. Como veremos luego en forma más detallada, esta relación funcional permitirá mostrar que la evolución temporal es diferente entre sistemas inerciales en movimiento relativo. Este hecho genera uno de los cambios conceptuales necesarios más importante, que trataré de explicar con un experimento pensado. Supongamos tener un péndulo oscilando con pequeñas amplitudes. El sistema cuelga de un clavo en reposo respecto a nuestro sistema. El movimiento resulta periódico y su período T medido es constante, dependiendo de la longitud del hilo (l) y de la aceleración de la gravedad (g). Su expresión matemática es: Ahora imaginemos otro péndulo oscilando, de igual longitud de hilo, que pasa frente a nosotros con velocidad V constante. Midiendo adecuadamente el (pseudo) período del péndulo en movimiento encontramos, como demostraremos más adelante, que oscila más lentamente que el nuestro. Medir adecuadamente significa tener en cuenta que la posición inicial y la final de una oscilación del péndulo móvil son distintas para nosotros y que, cualquiera sea la técnica de medición usada, corregiremos efectos aparentes, tales como retrasos debido a la velocidad de la luz, paralaje, etc. Más aún, dado que la longitud de los péndulos es la misma (y'=y) debemos asumir que la aceleración de la gravedad es diferente en los sistemas en movimiento relativo. Antes de la Teoría de Relatividad Especial medir implicaba tener un instrumento de medición y un objeto. Ahora medir involucra también al observador. Todo parece indicar que "casi" todas las magnitudes físicas (sus valores) son relativas al sistema de referencia, como resultado de que los sistemas en movimiento relativo tienen métricas espacio temporales distintas. Las magnitudes que tienen carácter absoluto, además de la velocidad de la luz en el vacío, son pocas y se especula que juegan un papel fundamental en la estructura de nuestro universo. Para hallar estas magnitudes supuestamente "claves", es necesario disponer de modelos teóricos relativistas de los distintos tipos de interacciones. En particular, las ecuaciones de Maxwell cumplen este requisito, lo que permitió deducir que la carga es un invariante. Un electrón tendrá el mismo valor de carga eléctrica en cualquier sistema de referencia inercial. Como veremos más adelante en detalle, ésta creencia más la formulación de la Teoría de Relatividad en un espacio de cuatro dimensiones (Minkowski), influyó en muchos especialistas generando una diferencia de criterios importante respecto de la masa, aún no resuelta. En el ítem siguiente veremos otro caso de invariancia como consecuencia de las Transformaciones de Lorentz, que conforma una propiedad fundamental de la métrica de los sistemas inerciales. Invariancia del Intervalo Se define suceso al conjunto (x, y, z, t) que determinan el punto en el espacio y el instante en que ocurre. Los sucesos pertenecen a un espacio (matemático) tetradimensional donde cada punto, llamado punto del universo, representa un suceso. El movimiento de una partícula puntual en este espacio será una curva denominada curva de universo. Tomemos ahora dos sucesos (x1, y1, z1, t1) y (x2, y2, z2, t2). El cuadrado de la distancia espacial entre los sucesos está dada por: Llamaremos Intervalo al valor S obtenido de la relación Con las Transformaciones de Lorentz podemos calcular sin dificultad el intervalo de estos dos sucesos medidos por dos observadores inerciales cualesquiera, resultando: Llegamos a una conclusión muy importante: El intervalo entre sucesos es igual en todos los sistemas inerciales. Queda planteado demostrar que dos sucesos pueden ser causales sólo si S es real. Se propone también, a modo de ejercicio usando cálculo diferencial, que se demuestre con las Transformaciones de Lorentz que el intervalo elemental es un invariante. ds2 = c2dt2 – (dx2+dy2+dz2) Invariante Discusión Las Transformaciones de Lorentz fueron desarrolladas en el año 1900 como un avance para establecer las leyes del electromagnetismo para sistemas inerciales en movimiento relativo. Lorentz mostró (parcialmente) que estas Transformaciones dejaban invariantes las ecuaciones de Maxwell, sin lograr una interpretación conceptual. La propuesta de Lorentz mantenía implícitamente la validez de las Transformaciones de Galileo, la métrica espacial y la coordenada temporal eran absolutas en los sistemas inerciales, asumiendo que por alguna razón física, que relacionaba con las interacciones electromagnéticas, los objetos modificaban su tamaño y los relojes alteraban su marcha, provocando una "aparente" constancia de la velocidad de la luz. Las propiedades del espacio y el tiempo no eran alteradas (espacio-tiempo absoluto). Estas interpretaciones, tanto para el electromagnetismo como para la invariancia de la velocidad de la luz, tenía serias e irreconciliables inconsistencias generadas principalmente por su interpretación dentro de un marco espacio temporal absoluto (teoría del éter). La deducción elaborada por Einstein se apoyaba en resultados experimentales (Postulados) y no requería conjeturas auxiliares, tales como sistema de referencia absoluto, arrastre del éter, deformación de objetos, o mal funcionamiento de relojes. Pero este premio no era gratis, había que cambiar el concepto establecido sobre el espacio y el tiempo. Analizando las Transformaciones de Lorentz bajo la óptica de Einstein lo primero que hay que destacar es que las coordenadas (x, y, z, t) representan un punto del espacio y un instante, correspondientes a un sistema inercial O, y que las coordenadas (x', y', z', t') representan ese punto del espacio y ese instante, pero correspondientes a un sistema inercial O' que se mueve respecto del primero. No son coordenadas particulares de un evento, ni la posición de un objeto o el instante inicial de un fenómeno. Son coordenadas que dan la métrica espacio-temporal del sistema correspondiente. Es decir que las transformaciones relacionan las métricas del espacio y el tiempo entre dos sistemas inerciales. La interpretación de las Transformaciones de Lorentz como relación entre las métricas espacio temporales de los sistemas inerciales debe ser considerada como uno de los avances más importantes del conocimiento universal. La gran revolución conceptual la genera (principalmente) que t' no es igual a t, como era en el marco galileano, sino que está relacionada también con la posición. Aclaremos un poco más este tema. Cuando decimos que el tiempo t es uniforme estamos indicando que la evolución temporal de los fenómenos causales es constante en el sistema O. Un dado proceso, como la caída de una piedra o el crecimiento celular, transcurre en el mismo lapso bajo idénticas condiciones, cualquiera sea el momento en que se inicie el proceso. Además, al indicar que t es la coordenada temporal del sistema O hemos asumido arbitrariamente que el sistema está sincronizado, y en un instante cualquiera tenemos el mismo valor temporal en cualquier punto del espacio. Lo mismo vale para el sistema O', con su coordenada t' uniforme y sincronizada. La gran novedad aparece cuando vinculamos ambas coordenadas (t', t) con las transformaciones de Lorentz. Solamente hay coincidencia en el origen en el instante inicial (t'=t=0) porque así lo establecimos en la deducción de dichas transformaciones, concluyendo que para que la velocidad de la luz sea invariante tenemos que aceptar que los sistemas inerciales en movimiento relativo tienen diferente evolución temporal y distinta métrica espacial, y que esas diferencias dependen de la velocidad relativa entre ellos. La dependencia de la coordenada temporal de un sistema con el tiempo y la posición del otro sistema provoca pérdida de sincronización en el sistema móvil pues no da un mismo valor t' para puntos (x) diferentes. Es decir que el sincronismo, que requiere fijar el valor temporal simultáneamente en todo punto del espacio, es relativo al sistema. Dicho más claramente, cada observador O y O' ve sincronizado su sistema, en el cual está en reposo, y sin sincronismo el sistema móvil. Si ahora consideramos un fenómeno, como por ejemplo la caída de un cuerpo, habrá una posición inicial y una final para cada sistema de referencia, con trayectoria y duración distintas para dos observadores en movimiento relativo constante. Será necesario analizar en detalle las mediciones espaciales y temporales de los fenómenos físicos. Simultaneidad Dos eventos son simultáneos cuando suceden en el mismo instante. Supongamos que un observador O en un sistema de referencia inercial detecta dos sucesos ocurridos en (x1, y1, z1, t1) y (x2, y2, z2, t2) respectivamente. Para que estos sucesos sean simultáneos debe cumplirse: t1 = t2 Si ahora pretendemos saber como registra estos mismos sucesos un observador O’ que se mueve respecto de O con velocidad V constante, bastará con determinar los valores (x’, y’, z’, t’) de cada uno de ellos mediante las Transformaciones de Lorentz. Ello nos permite calcular la diferencia t’2 - t’1 resultando: Estos sucesos serán simultáneos para O’ si t’1 = t’2, condición que sólo se cumple en el caso x1 = x2. Se deja planteado demostrar que si dos eventos que suceden en distintos puntos (x), son simultáneos para un observador O, siempre es posible encontrar dos sistemas de referencia inerciales en los cuales el orden de los sucesos está invertido. Con esto queda demostrado que la simultaneidad es relativa al sistema de referencia, siendo absoluta en el caso en que los eventos sucedan en el mismo punto (choque). Esta es la razón por la cual un observador inercial O comprueba que otro sistema O’ en movimiento relativo no presenta su tiempo t’ sincronizado. También la simultaneidad de sucesos adquiere carácter absoluto en el caso de dos eventos que ocurren sobre un plano perpendicular a la velocidad V relativa entre los observadores O y O’, sin necesidad de que haya choque. Es decir que dos pelotas que golpean a diferente altura contra una pared simultáneamente para un observador en reposo respecto de la pared, también serán sucesos simultáneos para cualquier observador que se mueva perpendicularmente a la pared con velocidad constante. Analicemos ahora un caso interesante. Supongamos que ocurre un proceso “causal” como sería por ejemplo lanzar una piedra en el instante t1 y romper un vidrio en t2. Un fenómeno causal presenta las siguientes características: contiene siempre dos sucesos que, si ocurren en distintos puntos del espacio, están separados cronológicamente, y el orden de los eventos no puede invertirse. Demostraremos que todo fenómeno causal es absoluto. Para ello debe cumplirse (t’2 - t’1) > 0 para todo observador. Sea (t2 – t1) la diferencia de tiempos entre el lanzamiento de la piedra en x1 y la rotura del vidrio en x2. Calculemos que diferencia temporal le mide un observador O’ en movimiento relativo. Para que (t’2 - t’1) > 0 debe ser Dividiendo por (t2 – t1) obtenemos Siendo la variación espacial (x2 - x1) sobre la temporal (t2 – t1) el valor de la velocidad media del objeto, que en nuestro caso corresponde a la piedra en su viaje hacia el vidrio, será: Dado que el segundo término del primer miembro es menor que 1 pues las velocidades del observador y de la piedra siempre son menores que la velocidad de la luz, la desigualdad es valedera y queda demostrado que un fenómeno causal es absoluto. Causalidad y Determinismo No se tiene conocimiento del origen ni el momento histórico en que se incorpora en la humanidad el concepto de causalidad, en el sentido de que cualquier cambio del estado de un sistema está provocado por una causa anterior. Más aún, el entrenamiento de animales domésticos ha demostrado que este concepto está incorporado en los ejemplares adultos, y se especula que todas las especies animales adquieren su conocimiento durante la gestación y en la primera etapa de su vida, como consecuencia de la repetibilidad de los fenómenos naturales, teniendo incidencia en su comportamiento particular e incluso con el “sentido” de preservación de la especie. La causalidad en su acepción básica más general es un concepto fundamentado en la observación de procesos o fenómenos que reúnen las siguientes características: 1. Siempre que ocurre un fenómeno se pueden encontrar dos eventos distinguibles (A y B), que están separados cronológicamente y cumplen: 2. Asignemos que A sea el primer suceso. Siempre que ocurre A, luego sucede B, y se conserva el orden de los sucesos. En este caso se postula que A y B son causa (A) y efecto (B). Además, si reiteramos el fenómeno y se repite de forma idéntica para la observación, entonces se dice que el proceso es “causal” y “uniforme”. La aceptación de la existencia de procesos causales uniformes es el soporte lógico de la definición rigurosa de “tiempo”. Se puede definir la magnitud tiempo (objetivo) como aquella que permite establecer el orden en la ocurrencia de sucesos. Resulta evidente que, por tratarse de sucesos numerables, la magnitud es escalar. Los procesos causales uniformes, que bajo las mismas condiciones tienen la propiedad de repetirse en forma idéntica, permiten establecer una unidad de medida, proveyendo una métrica temporal, estableciendo cuantitativamente el pasado y el futuro, y dándole al tiempo la propiedad de magnitud mensurable. La consideración usual del tiempo como “coordenada unidimensional continua”, dentro de la física clásica, es una abstracción no demostrada, sustentada principalmente por la mecánica de Newton y el éxito de los modelos teóricos posteriores desarrollados. Es decir, que este atributo matemático (continuidad) debe ser postulado y su validez limitada al modelo teórico correspondiente. La física cuántica actual plantea modelos con la posibilidad de que la magnitud tiempo sea discreta. Resulta evidente que la estrecha e indisoluble relación entre la magnitud tiempo y el concepto de causalidad incidió en el desarrollo científico, cuya consecuencia principal fue la postulación del Principio de Causalidad, aceptada como una ley inviolable de la naturaleza, desde principios del siglo XIX. El Principio de Causalidad postula que todo efecto debe tener siempre una causa. Asimismo, en ese siglo se completó la falsa interpretación de “causalidad lineal” que, a grandes rasgos, afirma que los efectos de un dado proceso resultan ser las causas de otros efectos futuros, por lo cual los fenómenos naturales pueden interpretarse como una sucesión ininterrumpida de procesos causales. Esta línea de pensamiento más la infundada creencia de una relación biunívoca entre causa y efecto desembocaron en el “determinismo” a ultranza, del matemático P. Laplace (1749 - 1827). Los fenómenos naturales muestran infinidad de procesos causales periódicos, cuya ocurrencia repetida generó mitos y creencias en la conciencia popular (“el destino está escrito”), que fueron incentivados por el determinismo mecanicista de Laplace, el que propone que si se tiene el conocimiento completo del estado de un sistema en un momento dado, sería formalmente posible conocer el estado del sistema en cualquier momento futuro. Esta postura radical hizo que determinismo y causalidad fueran confundidos e, incluso, considerados la misma cosa. Como veremos en este mismo capítulo, la causalidad es una ley inviolable, el determinismo no lo es. En consecuencia, cualquier ley, teoría o modelo físico debe cumplir con el Principio de Causalidad y puede no ser determinista. El enfoque matemático de la causalidad, en mi opinión el más profundo, útil y preciso, se debe al genial matemático estadounidense Norbert Wiener (1894 - 1964), conocido como padre de la cibernética por su libro “Cibernética o el Control y Comunicación en animales y máquinas“, publicado en 1948. En el introduce la noción de “circularidad” mediante un concepto utilizado en la teoría de control, el feedback (retroalimetación), con el cual interpreta la causalidad como la respuesta de todo sistema cuando es perturbado, y su reiteración (circularidad) en la búsqueda de un estado de equilibrio. Wiener estableció que el Principio de Causalidad es consecuencia de una "simetría" particular en los procesos de la naturaleza (circulares en el tiempo), por lo cual este Principio actualmente es considerado Universal y, a los efectos de que se entienda su importancia, de la misma jerarquía que los Principios de conservación de la energía, de la cantidad de movimiento y del momento angular. Asimismo, mostró la falsedad de la causalidad lineal y estableció para los sistemas lineales, es decir aquellos que pueden ser representados por ecuaciones diferenciales lineales, la condición matemática que debe cumplir una función dependiente del tiempo para ser causal. La deducción de la condición de Paley-Wiener puede verse en el libro de A. Papoulis, “The Fourier Integral and its Applications”. Contracción espacial y Dilatación temporal Hemos establecido a través de las Transformaciones de Lorentz que las métricas de dos sistemas inerciales en movimiento relativo son diferentes. En consecuencia, debemos analizar qué pasa con el tamaño de los objetos y la duración de los fenómenos, cuando están o suceden en movimiento respecto de nosotros. Por convención pondremos un subíndice 0 a todas las magnitudes que midamos en reposo respecto nuestro, y las llamaremos propias. Por ejemplo, una longitud propia será la que midamos en reposo respecto del objeto. Contracción de longitudes Un observador inercial mide el largo (longitud propia) de un objeto en reposo, determinando las coordenadas espaciales de sus extremos según indica la figura, resultando l0 = x2 – x1. Se pretende determinar qué longitud le mediría otro observador O’ en movimiento relativo con velocidad constante. Debemos eliminar o corregir las ilusiones ópticas producidas por la velocidad finita de la luz. Por ejemplo, si quisiéramos determinar la longitud de un objeto en movimiento sacándole una foto cuando se está acercando o alejando, tendríamos que corregir las medidas obtenidas pues una foto, en esas condiciones, dará un tamaño aparente (ilusión óptica). Se propone al lector que muestre que la foto dará un tamaño mayor cuando se acerca y menor cuando se aleja. Como el objeto está en movimiento para el observador O´ debemos ser cuidadosos y adoptar un criterio de medición adecuado, como sería determinar ambas coordenadas “simultáneamente” en el sistema O’, lo que implica t’1 = t’2. Luego debemos comparar la longitud l’ = x’2 – x’1 con la longitud propia mediante las Transformaciones de Lorentz. Aquí aparece algo interesante para la resolución de problemas. Considerando que las Transformaciones de Lorentz directas o inversas son conceptualmente la misma cosa, podemos elegir usar las que nos convengan. En nuestro caso usaremos las inversas porque ello simplifica los cálculos debido a que t’1 = t’2, resultando: Despejando l’ obtenemos: Conclusión La longitud de un objeto en movimiento es menor que cuando el mismo objeto está en reposo pues V/c es siempre menor que 1. No debe entenderse esto como un efecto óptico o aparente, sino como el tamaño del objeto medido en movimiento, que resulta tanto menor cuanto más rápido se mueva respecto del observador. Ésta es una adecuada ocasión para discutir a qué se llama realidad en física. En primer lugar digamos que la Física como ciencia intenta explicar cómo suceden las cosas y no porqué suceden. Todo lo que estamos elaborando y todas las teorías ya desarrolladas son modelos que procuran describir el comportamiento de los distintos fenómenos naturales lo mejor posible, pero los modelos no son el fenómeno. Esta postura es la científica y quedó plasmado desde el inicio mismo del método científico, creado por Galileo, cuando distinguió que la filosofía natural no incluye los mitos. El gran físico-matemático argentino Jorge Staricco, en la introducción del magistral curso de Mecánica que dio en la Facultad de Ingeniería de la Universidad de Buenos Aires en 1965, al cual asistí como alumno, dijo: la importancia de la Ley de atracción universal enunciada por Newton no es la relación funcional entre la fuerza y la distancia, que por otro lado hubiera sido resuelta por Cavendish un ratito después, sino cómo la introdujo: Todo pasa como si existiera una fuerza… Ahora permítanme que haga una pregunta directa sobre realidad: ¿Existe la fuerza de gravedad? Recordemos que con el conocimiento funcional de la fuerza gravitatoria Newton demostró las Leyes de Kepler. Todo parece indicar que dudar de la existencia de la fuerza de gravedad es demencial. En el año 1916 apareció otra Teoría que postulaba que la fuerza gravitatoria no existe, que las masas no se atraen pero tienen la propiedad de alterar la métrica espacio temporal. Con ella también se demostraron las Leyes de Kepler. Su autor fue Albert Einstein y la Teoría es la de Relatividad General. Al no tener una respuesta lógica única, el concepto de realidad en la física se modificó durante el siglo XX, principalmente por el desarrollo de la Mecánica Cuántica y la Teoría de Relatividad, de tal manera que su interpretación fuera única. El concepto de realidad es un tema filosófico que depende de la línea de pensamiento particular. Realidad, para la ciencia, es lo que muestran las mediciones y es válida solamente en el marco de la teoría correspondiente, cuya bondad y alcance no depende de las creencias del lector. En consecuencia, digamos que todo pasa como si el tamaño “real” de un objeto fuera mayor cuando está en reposo que cuando está en movimiento, pues eso es lo que se mide. En el marco de la Teoría de Relatividad Especial los objetos en movimiento tienen un tamaño menor que en reposo. Dilatación temporal Un observador inercial mide la duración (tiempo propio) de dos sucesos que ocurren en un punto fijo (x0; y0; z0), como por ejemplo prender una lámpara en el instante t1 y apagarla en t2, estando en reposo respecto de la lámpara. Esta duración resulta T0 = t2 – t1, y se pretende determinar qué valor T’ le medirá otro observador O’ en movimiento relativo con velocidad constante. En este caso usaremos las Transformaciones directas porque ello simplifica los cálculos debido a que x1 = x2 = x0 resultando: Resulta evidente que T’ > T0 pues la velocidad relativa V debe ser menor que c Conclusión Cualquier lapso medido (t2 – t1) de dos sucesos es relativo al sistema de referencia. Asimismo, se demuestra que el tiempo propio de cualquier fenómeno es el menor valor posible de la duración de dicho evento. Dado que este razonamiento es válido para todos los fenómenos naturales, todo observador verá que los procesos transcurren más lentamente cuando suceden en movimiento respecto de él, y este hecho será tanto más pronunciado cuanto mayor sea la velocidad relativa entre el sistema donde ocurre el fenómeno y el observador. Nota Hemos calculado la contracción de la longitud de un objeto y la dilatación temporal de un reloj, ambos en reposo en el sistema O. Por supuesto que si estuvieran en reposo en el sistema O’ obtendríamos idénticas conclusiones simétricas pues todos los sistemas inerciales son equivalentes. Tiempo propio Cuando un cuerpo o sistema físico se mueve arbitrariamente, el tiempo propio de un proceso que ocurra en dicho objeto debe calcularse asumiendo que se tiene un reloj fijo en el objeto. Un sistema de referencia fijo a un cuerpo que se mueve arbitrariamente puede no ser inercial, por lo cual en general no podremos aplicar las Transformaciones de Lorentz para comparar las métricas. Sin embargo, si aceptamos que la aceleración no tiene influencia en la evolución temporal en dicho sistema no inercial, veremos que es posible calcular el tiempo propio buscado. Destaquemos que esta suposición no tiene respaldo teórico alguno (ver Möller “The Theory of Relativity”, pág. 49) y no es verificada por determinaciones experimentales incuestionables (GPS), por lo cual este tema será tratado en detalle por separado. Lo que sigue es el tratamiento usual del tema en la bibliografía clásica tradicional, sin que ello implique que sea correcto rigurosamente. De acuerdo con la suposición históricamente aceptada podemos asumir que en cada instante hay un sistema inercial cuya velocidad relativa coincide con la velocidad del cuerpo o sistema físico, lo que permitirá calcular el tiempo propio como la suma de las variaciones infinitesimales (dt’) en dicho sistema. Las Transformaciones de Lorentz que hemos deducido oportunamente no son generales puesto que hemos puesto arbitrariamente la velocidad relativa entre sistemas coincidente con el eje x. Dado que esta condición no se cumplirá para un movimiento arbitrario, debemos usar las Transformaciones de Lorentz generales, cuya expresión para la coordenada temporal es: Teniendo en cuenta que el proceso cuyo tiempo propio estamos midiendo está sobre el objeto en movimiento y que la velocidad del cuerpo corresponderá en cada instante a la velocidad del sistema inercial que le fijemos, será v=V. En consecuencia, diferenciando la expresión anterior llegamos a: El tiempo elemental dt’ que medirá un reloj fijo al objeto será menor que el correspondiente dt que medimos en nuestro sistema inercial. Integrando obtenemos el tiempo propio mediante: Es importante destacar que en esta expresión la velocidad corresponde a la del objeto y puede ser función del tiempo dependiendo del movimiento que realice el objeto. Además, dado que el integrando es siempre menor que 1, el tiempo propio siempre es el menor valor posible, cualquiera sea el movimiento del objeto. Debe tenerse en cuenta que no podemos comparar las métricas entre sistemas pues solamente requerimos que uno sea inercial, sino que hallamos la expresión general para el cálculo de tiempo propio de un objeto, cualquiera sea su movimiento, a través de mediciones temporales hechas desde el sistema inercial. Veamos un ejemplo simple: Un objeto rota alrededor de un observador inercial con movimiento circular uniforme. Se sincronizan dos relojes en t=t’=0, uno (t’) fijo al objeto y el otro (t) en el sistema inercial. Al cabo de una vuelta se comparan los tiempos resultando que el reloj fijo al cuerpo atrasó. El cálculo es simple pues el módulo de la velocidad v es constante. Este atraso (cualitativo) no es relativo al sistema, es absoluto, y ello ocurrirá sobre cualquier reloj acelerado respecto de uno inercial. Una vez comprendido el concepto (histórico) de tiempo propio y la forma de calcularlo, la maltratada "Paradoja de los gemelos" deja de ser un misterio y puede ser analizada sin dificultad. Recomiendo su análisis aunque advierto que este tratamiento es incompleto pues no considera los efectos temporales debidos a la aceleración. Nota Las correcciones temporales que se programan en el Sistema de Posicionamiento Global (GPS) para mantener el sincronismo entre satélites dedicados y la Tierra, suelen describirse como efectos debidos al "cambio temporal" de la Relatividad Especial y al "retraso temporal" causado por el campo gravitatorio, predicho por la Teoría General. En mi opinión esta manera de enfocar el tema esconde el error cometido en este tema dentro de la Teoría de Relatividad Especial, cual es asumir que las aceleraciones no tienen influencia en la marcha de los relojes. Cinemática relativista. Efecto Doppler La cinemática relativista no presenta gran dificultad en la parte operativa debido a que los cálculos son similares a los que se realizan en cinemática clásica. Si un dado problema de movimiento de un cuerpo es complicado en el modelo relativista, también lo es en la mecánica newtoniana. No sucede lo mismo desde el punto de vista conceptual cuando se pretende comparar un determinado movimiento de un cuerpo desde dos sistemas de referencia inerciales en movimiento relativo. La razón de que ello ocurra es que en cinemática relativista la velocidad de la luz es un valor finito. La primera gran dificultad está con la posición de un punto material que se desplaza respecto de un observador inercial. Lo “vemos” en un punto del espacio pero sabemos que está en otro, debido al tiempo que tardó en llegarnos la información. Es decir que tenemos dos panoramas posibles: el “aparente”, que es el que vemos, y el que llaman “real”, que sería el que corresponde a la supuesta posición calculada, teniendo en cuenta el tiempo que tarda en llegarnos la información. En realidad el que conocemos con certeza es el aparente, que es el que medimos. La mayoría de los cálculos se hacen con las posiciones que denominamos reales, en razón de que las Transformaciones de Lorentz relacionan la métrica espacio temporal de dos sistemas inerciales sin contemplar lo que mediría un observador que no tuvo en cuenta las correcciones relacionadas con la velocidad de la luz. Este hecho parece resolver la cuestión estableciendo un criterio para la descripción de los movimientos, haciendo referencia siempre a posiciones reales. Sin embargo, veremos que ello resulta inadecuado en determinados casos. En la dinámica relativista las interacciones entre cuerpos materiales ocurren a través de campos cuya descripción corresponde a la posición aparente de los cuerpos y no a las posiciones reales, debido a que los campos se propagan también a velocidad finita, que asumimos idéntica a la de la luz. En consecuencia, si suponemos conocidas las posiciones reales, debemos calcular las aparentes para obtener el resultado correcto. En electromagnetismo las interacciones entre partículas cargadas en movimiento se calculan utilizando los “potenciales retardados”, que son funciones relacionadas con el campo que corresponde a las posiciones aparentes, resolviendo el planteo anterior, y ello podemos hacerlo porque disponemos de las ecuaciones de Maxwell. En los otros tipos de interacciones (fuerzas gravitatorias y nucleares), no tenemos las ecuaciones de campo válidas en sistemas inerciales, simplemente porque no hemos logrado desarrollar aún un modelo teórico adecuado, por lo cual ni siquiera sabemos si es posible obtener la expresión teórica de los potenciales retardados correspondientes. En particular, los problemas que presentan interacciones gravitatorias suelen tratarse con la Ley de Newton en el marco de la Relatividad General, aunque en rigor dicha ley es válida solamente para cuerpos en reposo. Otro aspecto complicado, que extrañamente la bibliografía usual no trata, se refiere a la posición real de un objeto en movimiento respecto de dos sistemas inerciales. Analicemos un caso particular: Dos observadores inerciales O y O’ están en movimiento relativo. Supongamos que sus sistemas de referencia están alineados y sus orígenes de coordenadas espaciales coinciden en el instante t=t’=0. Cada observador tiene sincronizado su sistema, lo que significa que en un instante cualquiera su coordenada temporal tiene el mismo valor en todo el espacio, pero ambos observan que en el otro sistema de referencia el tiempo indicado por el otro observador tiene valores distintos en diferentes puntos del espacio, es decir que no está sincronizado. Asumamos arbitrariamente que O está en reposo y O’ en movimiento uniforme según el eje x, con velocidad V respecto de O, y que tenemos un cuerpo que se mueve con velocidad v respecto de O, según muestra la figura. Sea x0 la coordenada x del cuerpo en el instante t=0. Se pretende saber cuál es la posición x’ del objeto para O’ en el instante t’=0. Usando las Transformaciones de Lorentz obtenemos lo que mediría O’: Nótese que la posición del objeto en nuestro caso está determinada para t’0 < 0, es decir que O’ no obtiene la posición del objeto (x’0) cuando ambos sistemas están coincidentes en el espacio, sino un rato antes (t’0) de que O’ se cruce con O. En consecuencia, para determinar la posición que ambos observadores le miden a un objeto en movimiento en el instante t=t’=0, en que ambos sistemas son coincidentes, debemos conocer el movimiento completo en alguno de los dos sistemas, es decir su trayectoria y tipo de movimiento, que nos permita calcular dónde estará en el otro. Veamos un caso simple. Si el objeto se mueve con velocidad v constante podemos hacer el cálculo de cuánto avanzaría respecto de O’ hasta que los sistemas coincidan, y así obtener la posición x’t’=0 que le mediría O’ en t’=0, resultando: Siendo v’ la velocidad del objeto medida por O’, cuyo cálculo se mostrará luego con el teorema de adición de velocidades. En el segundo miembro de la igualdad, el último término representa lo que avanzó el objeto. Esta expresión puede ponerse de la siguiente forma: Si el cuerpo está en reposo respecto de O, la velocidad v’ medida por O’ será -V, y la coordenada x’0 valdrá: Este resultado muestra el efecto de la contracción de longitudes ya visto. De éste análisis obtenemos una consecuencia muy importante para el estudio de los sistemas de muchos cuerpos no estacionarios, como por ejemplo el Universo. Supongamos que en un sistema inercial queremos obtener la configuración dinámica de un determinado conjunto de cuerpos puntuales en movimiento. Para ello debemos conocer simultáneamente la posición y la velocidad de cada uno de los puntos materiales. Si ahora deseamos saber qué configuración se obtendría en otro sistema inercial en movimiento relativo, deberemos hacer correcciones que contemplen le pérdida de sincronismo entre sistemas. Nota En el apartado de Temas Especiales se adjunta un desarrollo original (no publicado) que demuestra que la expansión del Universo es absoluta, es decir que en todos los sistemas inerciales las galaxias se alejan de un punto (centro), y en todos ellos se cumple la forma de la Ley de Hubble (velocidad proporcional a la distancia). Teorema de adición de velocidades Dado un cuerpo que se mueve con velocidad v respecto de un sistema inercial O, se pretende determinar qué velocidad le mide otro observador O’ en movimiento relativo uniforme. En la figura, por razones didácticas, se indica solamente la componente en la dirección x. Usando las Transformaciones de Lorentz podemos calcular las velocidades medidas por un observador O’. Se destacan las siguientes particularidades: 1. Para velocidades del objeto (v) y del sistema (V) mucho menores que c se obtienen las relaciones de Galileo. 2. Las velocidades transversales (vy; vz) dependen de la velocidad según x. 3. Si el objeto fuera luz en el vacío, los dos sistemas medirían lo mismo (c). El cálculo de las aceleraciones se deja planteado como ejercicio, destacando que se obtienen con el mismo procedimiento empleado y que la aceleración no resulta una magnitud absoluta (como sucede en la mecánica clásica). Efecto Doppler La frecuencia de una onda emitida por una fuente resulta diferente si dicha fuente está en reposo o en movimiento relativo al observador, aumenta cuando la fuente se acerca y disminuye cuando se aleja. El fenómeno fue descrito y explicado teóricamente en forma clásica (no relativista) por el físico y matemático austríaco Christian Doppler (1803-1853) en el año 1842, en una monografía sobre espectroscopía en estrellas binarias. La ley original obtenida relaciona la frecuencia de una onda luminosa con la velocidad relativa entre el observador y la fuente de las ondas, y no es consistente con la teoría de relatividad (desarrollada posteriormente) pues se fundamenta en las Transformaciones de Galileo. La formulación relativista rigurosa del fenómeno fue elaborada por Einstein en su principal publicación de 1905. El efecto es de naturaleza ondulatoria y su estudio aparentemente resulta complejo en virtud de que intervienen tres actores: la fuente de ondas, la onda que se propaga y el observador. Sin embargo, veremos que el fenómeno puede ser explicado como un efecto relativista sobre la propagación ondulatoria. Por razones prácticas, en general sólo nos interesará el punto de vista del observador, es decir la frecuencia que un observador inercial le mide a una onda emitida por una fuente móvil, y su relación con la frecuencia propia y velocidad instantánea de dicha fuente. Los procesos ondulatorios fueron convenientemente explicados por el matemático francés D’Alembert (1717-1783), cuyos aportes en el planteo y solución de ecuaciones diferenciales a derivadas parciales le permitieron elaborar la teoría matemática de las ondas en 1747, estableciendo su famosa “ecuación de ondas”: Toda solución Ф(x,y,z,t) de esta ecuación es una onda cuya velocidad de propagación es v. Asimismo, si una función no satisface esta ecuación no puede ser asignada a un fenómeno ondulatorio. La solución más simple posible, conocida como “onda armónica simple”, que se propaga en el sentido positivo de las x, corresponde a la expresión: Al respecto, aunque en este curso se asume que el lector conoce la teoría de ondas, es conveniente recordar algunas particularidades: x (dirección de propagación) es un punto del espacio y t un instante de tiempo. Al argumento (kx-w t) se lo denomina fase y debe ser un número adimensional, es decir sin unidades. En consecuencia, k (número de onda) tiene unidades de 1/longitud y w (frecuencia angular) de 1/tiempo. El sentido de propagación queda determinado por el signo de los 2 términos de la fase. Si son distintos la onda se propaga en el sentido creciente de x; si son iguales será en sentido opuesto. La función verifica la ecuación de ondas si se cumple v=w/k. A es la amplitud máxima de la onda. Sus unidades quedarán determinadas por el tipo de onda que se trate. Por ejemplo, si es una onda sonora, A podrá tener unidades de presión. En ambos sistemas inerciales la onda tiene la misma forma funcional pues la ecuación de ondas es relativista. Se deja planteado demostrar que dicha ecuación conserva su forma ante Transformaciones de Lorentz. Primero mostraremos que la frecuencia de una onda, cualquiera sea su naturaleza, es una magnitud relativa al sistema de referencia. Supongamos tener dos observadores inerciales en movimiento relativo, como muestra la figura, que miden la frecuencia y la velocidad de una onda armónica simple que se propaga de izquierda a derecha en la dirección del eje x. Aplicando las Transformaciones de Lorentz podemos encontrar la correspondiente expresión en el sistema primado: En el sistema en movimiento se cumple: Comparando con la relación anterior se obtiene: Para evitar confusiones llamaremos vP a la velocidad de propagación. Reemplazando k = w / vP obtenemos la relación buscada: Si se trata de ondas luminosas en el vacío la velocidad de propagación es la misma en ambos sistemas de referencia pues la luz se propaga con la misma velocidad c en todos los sistemas inerciales. En este caso tenemos: Fácilmente puede verse que w’ < w si el sistema primado se mueve en la dirección de propagación, y w’ > w si es en sentido contrario (V<0). Este resultado muestra que la frecuencia de una onda es una magnitud relativa al observador, y ello es independiente del movimiento de la fuente de ondas. En rigor, la frecuencia de cualquier sistema o proceso físico periódico resulta ser una magnitud relativa al sistema de referencia en el que se mide. Dos observadores con distinto estado de movimiento medirán distinta frecuencia de un mismo proceso periódico. Por supuesto que si la fuente se encuentra en reposo en uno de los dos sistemas de referencia, el observador en dicho sistema medirá la misma frecuencia de la onda y de la fuente (frecuencia propia), mientras que el observador en movimiento medirá distintas frecuencias no coincidentes, tanto de la fuente en movimiento como de la onda. La conclusión global será que la frecuencia de una onda aumenta si la fuente se mueve hacia el observador, disminuye si se aleja, y en estos casos no coincide con la frecuencia de la fuente en movimiento. Finalmente, siendo w0 la frecuencia propia y (Vf ) la velocidad de la fuente de ondas, que arbitrariamente definimos positiva si la fuente se aleja al observador y negativa si se acerca, la relación funcional entre la frecuencia medida (w) y la velocidad de la fuente (Vf ), estará dada por: Esto último parece estar en contradicción con el hecho aceptado por el cual la frecuencia de una onda debe ser la misma que la de la fuente que la produce, cosa que solo sucede para un observador en reposo respecto de la fuente periódica. La explicación de esta aparente contradicción es sutil pero simple. Nótese que la forma en que se miden las frecuencias de la fuente y de la onda es diferente: la correspondiente a la onda se mide en un punto fijo (reposo) respecto del observador, mientras que la de la fuente se mide en movimiento. La frecuencia de un sistema periódico, medida por un observador en movimiento relativo, se modifica de acuerdo a la ley de “dilatación temporal”: Siendo T0 el período propio del sistema periódico y T el “pseudo” período que le mide el observador inercial al sistema periódico en movimiento, que resulta siempre mayor que el período propio e independiente del sentido de la velocidad del sistema físico. Por otro lado, una onda es un proceso espacio temporal y su frecuencia se determina como la inversa del tiempo que tarda en pasar una longitud de onda por un punto fijo respecto del observador. Efecto Doppler Transversal Se denomina así al cambio de frecuencia de una onda que ocurre cuando la fuente de ondas se mueve en dirección transversal a la recta que une la fuente y el observador. Este efecto, predicho por Einstein, fue detectado experimentalmente en 1938. La explicación relativista es muy simple: la fuente que se mueve transversalmente está sujeta a la “dilatación temporal”, por lo cual su frecuencia se modifica de acuerdo a la última relación vista y coincide con la frecuencia de la onda medida debido a que la fuente no se aleja ni se acerca del observador: Siendo w0 la frecuencia propia de la fuente, w la frecuencia (de la onda y de la fuente) medida por el observador, y V la velocidad transversal de la fuente. Nótese que el efecto Doppler transversal siempre da corrimiento al rojo (w < w0). Este planteo último y el tratamiento anterior pueden inducir al error de creer que el efecto Doppler tangencial y transversal son dos fenómenos distintos, cuando en realidad se trata de un único efecto: el cambio de frecuencia de una onda debido al movimiento relativo entre la fuente y el observador. En el planteo inicial por razones didácticas se propuso arbitrariamente que la onda se propagaba según el eje x, para luego tratar en forma independiente el caso de una fuente con movimiento transversal. Si hubiéramos analizado los cambios que se producirían sobre una onda cuando la fuente se mueve en cualquier dirección, obtendríamos una única relación general válida para el Doppler transversal y longitudinal respectivamente. Esto lo haremos a continuación. Tratamiento general del efecto Doppler luminoso (enfoque ondulatorio) Nos interesa determinar la frecuencia medida por un observador inercial de una onda emitida por una fuente móvil con velocidad vs, en relación a la frecuencia propia de la fuente (en reposo). Supongamos tener una fuente de ondas monocromática en reposo en un sistema inercial y un observador O en el punto A, como muestra la figura. El observador medirá la misma frecuencia a la onda y a la fuente (w0). Para evitar confusiones llamaremos ux y uy a las componentes de la velocidad (c) de propagación de la onda. A los efectos de estudiar solamente el cambio de frecuencia que medirá un observador O’ en movimiento respecto de O, la onda (con simetría esférica) que llega al punto A puede ser considerada una onda escalar plana (fuente alejada). La dirección de propagación queda determinada por los cosenos directores del vector velocidad de propagación (c). La expresión matemática es de la forma: Para un observador O’ con velocidad V respecto de O, la fuente de ondas se mueve con vS = -V, formando un ángulo con la dirección de propagación. Podemos calcular la función de la onda para O’ aplicando las Transformaciones de Lorentz. En el sistema primado la función de onda tendrá la misma forma matemática, aunque sus parámetros pueden tomar valores distintos que en el sistema O. Ahora podemos dar la expresión general del efecto Doppler (tangencial y transversal) y una regla para evitar posibles errores de signos. Si establecemos arbitrariamente que la velocidad de la fuente VS sea positiva si se aleja del observador y negativa si se acerca, y el coseno del ángulo lo tomamos siempre positivo, la frecuencia que éste le mide está dada por: Dado que , siendo e el versor con la dirección y sentido de propagación de la luz, la relación anterior puede expresarse (Möller, "The Theory of Relativity", pág 62): Nota Este efecto también puede ser tratado desde el punto de vista corpuscular, considerando a la luz formada por fotones con cantidad de movimiento y energía. En este caso se puede realizar el mismo tipo de análisis anterior y determinar cómo se modifica la energía del fotón, llegando al mismo resultado final del efecto Doppler. Se propone al lector que haga el cálculo utilizando las transformaciones de Lorentz de la cantidad de movimiento y la energía (E/c), que tienen la misma forma que las del espacio y el tiempo respectivamente. Cantidad de movimiento En Mecánica Clásica la forma más usual de introducir la cantidad de movimiento es mediante su definición como el producto de la masa de un cuerpo material por su velocidad, para luego analizar su relación con la ley de Newton a través del teorema del impulso y la variación de la cantidad de movimiento. No obstante, luego del desarrollo de la Física Moderna, esta manera de hacerlo no resultó la más conveniente para abordar esta magnitud fundamental. El defecto principal es que esta forma esconde el concepto inherente a la magnitud, que resulta ser una propiedad de cualquier ente físico con o sin masa, necesaria para describir las interacciones. Los modelos actuales consideran que no sólo los cuerpos masivos poseen cantidad de movimiento, también resulta ser un atributo de los campos y los fotones. Para abordar el tema con un enfoque más moderno primero se deben analizar las interacciones en sus diferentes manifestaciones de acuerdo a los modelos clásicos convencionales: La primera, que resulta clásica en mecánica racional, es considerar el choque entre cuerpos materiales, aceptando implícitamente que entre ellos no hay fuerzas atractivas o repulsivas, siendo fortuito el encuentro. Aquí aparece la cuestión sobre choque elástico perfecto y choque plástico con pérdida de energía. El siguiente tipo, campo-partícula sin pérdida de energía (choque elástico), resulta de considerar que cada partícula posee un campo asociado capaz de interactuar con la otra, modificando sus trayectorias, velocidades y energías. Un ejemplo típico es el estudio de fuerzas centrales en mecánica analítica. En este modelo se considera que los campos actúan instantáneamente, es decir a velocidad infinita, perdiendo su significado como ente físico real, para ser un formalismo auxiliar que simplifica su análisis. En esta categoría están la Ley de Coulomb y la Ley de gravitación universal de Newton. El caso de interacción campo-partícula con pérdida de energía resulta más complejo pues aparece un tercer participante, un fotón con la energía disipada. Un ejemplo importante e ilustrativo que permite explicar el espectro continuo de emisión de rayos x, es el estudio de la radiación de frenado que ocurre con electrones rápidos obligados a cambiar bruscamente de dirección por acción del campo eléctrico de un núcleo atómico, con pérdida de energía por emisión de radiación (fotón de radiación x). La interacción radiación-materia es el caso más ilustrativo de la limitación de la definición usual de la cantidad de movimiento (p=mv). El efecto Compton, que ocurre entre fotones de rayos x o rayos gamma con electrones cuasi libres, es explicado convenientemente si el fotón posee una cantidad de movimiento cuyo módulo está dado por: p h , siendo h la constante de Planck y v la frecuencia. c El fotón y la partícula material modifican sus trayectorias, cantidades de movimiento y energías como resultado de una interacción. Los cuatro casos descriptos tienen en común la transferencia de energía durante la interacción y/o cambios de dirección del movimiento. A los efectos de poder predecir las consecuencias de una interacción de acuerdo a lo mostrado por la experiencia, es necesario hacer extensivo el concepto de cantidad de movimiento a todos los entes físicos capaces de transferir energía, siendo una magnitud vectorial con dirección y sentido de la velocidad de la partícula y cuyo comportamiento responde a leyes de conservación. Esta magnitud, que nos permitirá calcular el estado final de los participantes luego de una interacción, resulta ser: 1. Para partículas masivas p m v 2. Para fotones en el vacío p h c c2 Las leyes de conservación postuladas como Principios, necesarias para el análisis de las interacciones entre partículas en un sistema aislado (sin fuerzas exteriores), sean partículas masivas o no, son: 1. El Principio de conservación de la energía 2. El Principio de conservación de la cantidad de movimiento 3. El Principio de conservación del momento angular La gran matemática Emmy Noether (1882-1935) demostró en 1915 que estos Principios son propiedades de leyes de simetría del espacio y el tiempo. Una demostración de estos "Principios" en el marco de la mecánica analítica puede verse en el libro 1 de Landau-Lifshitz "Curso abreviado de Física Teórica". Se demuestra que: 1. La conservación de la energía sale de la uniformidad del tiempo. 2. La conservación de la cantidad de movimiento es consecuencia de la homogeneidad del espacio. 3. La conservación del momento angular resulta de la isotropía del espacio. Vamos a dedicarle atención al de la conservación de la cantidad de movimiento. En el apartado que sigue incorporo una demostración propia, válida para sistemas inerciales en el marco de la mecánica newtoniana. Conservación de la cantidad de movimiento (no relativista). La isotropía y la homogeneidad espacial requieren que las transformaciones de coordenadas entre sistemas inerciales sean lineales. La uniformidad del tiempo y la suposición de que su evolución es la misma en todos los sistemas inerciales hace que la coordenada temporal sea absoluta. Estas propiedades del espacio y el tiempo permiten deducir fácilmente las Transformaciones de Galileo. Veamos su desarrollo: Sean dos sistemas inerciales O y O’ en movimiento relativo con velocidad V según el eje x, coincidentes en el instante t=0. Las transformaciones lineales son x’ = a1 x + a2 t y’ = y z’ = z Consideremos un objeto en reposo en O en la coordenada x. Para cualquier observador de O’ el objeto se mueve con velocidad v’x’ = - V Derivando obtenemos: v’x’ = - V = a1 vx + a2 = a2 a2 = -V Consideremos ahora un objeto con velocidad V en O. Para el observador O’ el objeto está en reposo respecto de él. Derivando obtenemos: v’x’ = 0 = a1 vx + a2 = a1 V – V a1 = 1 Reemplazando resultan las Transformaciones de Galileo x’ = x - V t y’ = y z’ = z Mostraremos ahora que el Principio de conservación de la cantidad de movimiento se obtiene como consecuencia de las Transformaciones de Galileo. Estas transformaciones tienen una propiedad muy interesante: la diferencia de dos velocidades cualesquiera, sean de un objeto o de cuerpos diferentes y en el mismo instante o en instantes distintos, es la misma para todo observador inercial, es decir que es absoluta. Ello se debe a que las velocidades medidas por dos observadores inerciales están relacionadas por: v’x’ = vx – V v’y’ = vy v’z’ = vz Nótese que cuando se calcula la diferencia entre dos velocidades se simplifica la velocidad V, con lo cual se hace independiente de la velocidad relativa entre sistemas. Ahora analicemos el caso de una interacción entre dos cuerpos. Consideremos dos partículas (1 y 2) que interactúan. Midiendo su velocidad antes (a) y después (d) de la interacción podemos plantear las siguientes relaciones absolutas, válidas para las tres componentes: v1d – v1a = cte = k1 v2a – v2d = cte = k2 Si las partículas son masivas, con masas m1 y m2 respectivamente, puede determinarse la relación k1 / k2 en concordancia con la definición de masa relativa de Mach (1838-1916). Se define como masa inercial relativa entre dos partículas que interactúan, a la relación de los módulos de las aceleraciones medias sufridas en la interacción. m21 = m2 / m1 = a1 / a2 Siendo la aceleración media la diferencia de velocidades dividida el tiempo de interacción, que es el mismo para ambas partículas, resulta: m21 = m2 / m1 = a1 / a2 = Δv1 / Δv2 = k1 / k2 En consecuencia, reemplazando obtenemos el Principio de conservación de la cantidad de movimiento. m1 v1a + m2 v2a = m1 v1d + m2 v2d Nota Un aspecto interesante es que la demostración es aplicable a todo tipo de partículas, incluyendo aquellas cuya masa propia sea nula (fotones). Sin embargo, si consideramos válida la definición de masa dada por Mach, toda partícula con la capacidad de interactuar tiene masa asociada. Este hecho genera un nuevo dilema, pues en el caso de fotones se acepta que no son masivos (masa propia nula). Más adelante, en dinámica relativista, veremos que este tema admite distintos tratamientos y es actualmente un motivo de discusión. Conservación de la cantidad de movimiento en Relatividad Especial. Masa relativista. El Principio de Relatividad establece que las leyes válidas de la física deben ser invariantes ante transformaciones de Lorentz, esto es que conserven su forma en todo sistema inercial. Las leyes describen comportamientos mediante ecuaciones que relacionan magnitudes, las cuales pueden tomar valores distintos respecto de diferentes sistemas, es decir ser relativas al sistema de referencia. En consecuencia, el Principio de Relatividad nos brinda una herramienta muy importante para la formulación y/o verificación de leyes. El procedimiento es el siguiente: definidas las magnitudes involucradas en una ley clásica, válida en un sistema inercial, se aplican las transformaciones de Lorentz y se determina cómo deben modificarse dichas magnitudes para que la ley conserve su forma. Luego, usando el Principio de Correspondencia, se verifica que la ley relativista se transforme en la clásica para c tendiendo a infinito. Finalmente, se analiza la conveniencia que dicha formulación tiene frente a otras opciones posibles. Puede suceder que existan diferentes opciones para obtener una dada ley. De hecho ese fue el caso cuando se intentó establecer le ley fundamental de la mecánica relativista. Einstein utilizó inicialmente la Ley de Newton expresada mediante F=ma. La forma en que se transforman la Fuerza y la aceleración cuando se pasa de uno a otro sistema de referencia es diferente, y esa diferencia es distinta según se trate de las componentes paralelas a la velocidad relativa entre sistemas o transversales a ella. En consecuencia, si se pretende que la ley de Newton así expresada (F=ma) sea relativista, la masa debe tomar valores distintos según sea una dirección paralela a su velocidad o transversal a ella. Esta pérdida de isotropía de la masa no resultó “atractiva” conceptualmente, y se resolvió proponiendo F=dp/dt como ley de la mecánica, pues esta forma de expresar la Ley de Newton conserva su forma ante Transformaciones de Lorentz, sin que la masa pierda su isotropía. Si aceptamos como definición de cantidad de movimiento p=mv, siendo m la masa, debemos determinar cómo se modifican las magnitudes involucradas para que la ley de conservación de la cantidad de movimiento sea válida en todos los sistemas de referencia inerciales. La modificación de las velocidades ya fue resuelta con el teorema de adición de velocidades, por lo cual nos queda por determinar cómo debería modificarse la masa para que la Ley tenga la misma forma en todos los sistemas inerciales. Existen diversas maneras de encarar el tema. La mayoría (sino todos) de los enfoques existentes en la extensa bibliografía sobre Relatividad Especial lo analizan mediante choque entre dos partículas, ya sea elástico con cambio de dirección o inelástico. Al respecto, desarrollé una demostración que se distingue por su simpleza y porque no requiere choque entre partículas. Veamos su desarrollo: Dos partículas idénticas se mueven según muestra el esquema. Por isotropía espacial sus masas deben ser iguales. En estas condiciones el centro de masa del sistema permanece en reposo y su cantidad de movimiento es nula. Al sistema de referencia en el cual el centro de masa está en reposo se lo denomina Sistema de centro de masa (o inercia). Dado que es un planteo unidimensional (x;x’) no indicaremos los subíndices de los ejes. Para otro observador que se mueva con velocidad V = v, la partícula 1 está en reposo y el centro de masa posee una velocidad v’CM = -v. A este sistema de referencia en el cual una partícula está en reposo se lo denomina Sistema de Laboratorio. La cantidad de movimiento en el Sistema de Laboratorio es: Siendo m’ la masa de la partícula 2, con velocidad v’2 y m0 la masa de la partícula 1, en reposo. Aquí la condición de simetría no corresponde pues las partículas tienen distinto estado de movimiento. Despejando obtenemos: Aplicando las transformaciones de las velocidades podemos calcular v’2 Resolviendo esta ecuación algebraica podemos hallar v’CM en función de v’2. Por tratarse de una ecuación de segundo grado tendrá dos soluciones, pero una sola con significado físico (pues v'CM < v'2 ). Con la condición de que el módulo de la velocidad del centro de masa debe ser menor que el de la velocidad de la partícula 2, obtenemos: Reemplazando en la expresión de la masa y operando obtenemos: Siendo m0 la masa de la partícula 1, en reposo, y m’ la masa de la partícula 2 en movimiento. Dado que las partículas son idénticas en reposo, podemos generalizar la expresión anterior y aplicarla para una partícula en movimiento. Esta masa variable con la velocidad, junto al Principio de Equivalencia entre masa y energía, dieron lugar a la definición de masa relativista. Volveremos a tratar el tema luego del estudio sobre energía relativista. Es muy importante destacar dos cosas: 1. En la expresión anterior no aparece explícitamente la velocidad relativa entre sistemas de referencia. La masa relativista expresa el valor de la masa en función de la velocidad que posee respecto de cada observador inercial. La inercia de un cuerpo material es relativa al observador y depende de su velocidad. 2. Hemos supuesto que la masa propia de la partícula m0 es invariante, es decir que toma el mismo valor en cualquier sistema de referencia inercial. Ello no es arbitrario pues si así no fuera los sistemas inerciales no serían equivalentes ya que habría una forma de distinguirlos. Operando la última expresión y usando la definición clásica de cantidad de movimiento (p=mv), obtenemos: Siendo m la masa relativista y m0 la masa en reposo que, rigurosamente, debería llamarse masa propia. La formulación de la Relatividad en un espacio de 4 dimensiones (Minkowski, 18641909) dio lugar, en los últimos 20 años, a que especialistas reconocidos tuvieran extensas, caprichosas e innecesarias discusiones, sobre la conveniencia o no de utilizar la masa relativista. En el caso en que se quiera evitar el uso de masa relativista debe redefinirse la cantidad de movimiento (ver la expresión siguiente). Finalmente llegamos a la conclusión que la cantidad de movimiento es válida en el marco de la Relatividad Especial si en cualquier sistema de referencia inercial queda determinada por la relación: Siendo m0 la masa en reposo y v la velocidad de la partícula en dicho sistema. Esta definición de cantidad de movimiento es compatible con p=mv sólo si aceptamos que la masa varía con la velocidad. Por ello resulta conveniente, cuando se traten relaciones o leyes que involucren a la masa, indicar a la masa en reposo con el subíndice 0. En este Curso utilizaremos m en el sentido de masa relativista y m0 para la masa en reposo, manteniendo la definición “newtoniana” de la cantidad de movimiento. Luego de este análisis es fácil mostrar para una interacción entre dos partículas en un sistema aislado, que el Principio de conservación de la cantidad de movimiento se cumple en todos los sistemas de referencia inerciales. Nota De acuerdo con la definición clásica de cantidad de movimiento (p=mv) debemos aceptar que esta Ley de conservación resulta válida si aceptamos que la masa de un cuerpo depende de su velocidad (más rigurosamente de su contenido energético). El concepto de masa establecido por la mecánica clásica es que su valor es una medida de su inercia, es decir la tendencia a conservar su velocidad. Aceptar que la inercia de un cuerpo material aumenta con la velocidad, hecho que fue confirmado experimentalmente, tiene otras implicancias muy profundas. Tal vez la más importante sea su relación con la masa gravitatoria. El estudio de caída libre relativista da resultados diferentes si el campo gravitatorio se aplica sobre la masa relativista (caso correcto) o sobre la masa en reposo. En la carpeta Temas Especiales se trata la “Caída libre relativista”, con ambos tratamientos. Dinámica relativista La Teoría Mecánica puede ser formulada de manera axiomática de varias maneras, lo que históricamente dio lugar a diferentes enfoques (Newton, Lagrange, Poincaré, Einstein). Sin embargo, todos ellos tienen en común que sus postulados básicos, de una u otra forma, se fundamentan en los mismos tres aspectos distintivos del comportamiento de la naturaleza, que son: 1. Cómo suceden los fenómenos para observadores distintos (relatividad). 2. Cómo responden cuerpos distintos ante un mismo requerimiento (causalidad). 3. Cómo se comportan los cuerpos entre sí (interacciones). Para Newton (1643-1727) la formulación es con sus tres leyes (Principios), que en conjunto responden exactamente a cada uno de los puntos anteriores, y es de validez limitada a sistemas de referencia inerciales. Este enfoque no requiere de ningún otro postulado básico, que alguna bibliografía redundantemente incorpora, como por ejemplo el llamado Principio de independencia de los movimientos, que resulta una consecuencia matemática del carácter vectorial de las magnitudes (velocidad, aceleración, fuerza). Muchos autores, particularmente los correspondientes a la denominada “escuela americana” (Sears, Ingard y Kraushaar, Feynman), no suelen analizar en profundidad la fundamentación de la Mecánica, y tratan al Principio de Inercia (primera ley) como si estuviera contenido en la segunda ley de Newton, despreciando o ignorando un aspecto fundamental del enunciado, por el cual la primera ley es un Principio. Como veremos, esta paupérrima interpretación induce a cometer dos errores graves: no comprender el significado del Primer Principio y creer que un Principio es demostrable. Veamos más en detalle el tema en cuestión. La primera ley de Newton establece que "Si sobre un cuerpo no actúa fuerza alguna éste permanece en su estado de reposo o de movimiento rectilíneo uniforme (MRU)". No hay duda que el mismo describe explícitamente la ley de inercia de los cuerpos, desarrollada por Galileo. Sin embargo, un aspecto muy significativo de este enunciado es que implícitamente contiene el Principio de Relatividad de los movimientos, ya que trata a ambos estados (reposo y MRU) como estados naturales equivalentes (ver A. Sommerfeld, "Lectures on Theoretical Physics - Mechanics"). Este simple hecho tiene varias consecuencias importantes: Relaciona a observadores inerciales en movimiento relativo, pues un cuerpo en reposo para un observador se moverá con MRU para el otro. Incorpora las transformaciones de Galileo, ya que son las únicas que satisfacen la equivalencia entre reposo y MRU conservando el carácter absoluto del tiempo. Generaliza la teoría a todos los sistemas inerciales conteniendo, en consecuencia, el Principio de Relatividad de Galileo. En mi opinión, postular la equivalencia entre el reposo y el MRU es el aspecto clave de este enunciado y le da entidad de Principio a la primera ley de Newton. Si el objetivo de la primera ley tan sólo fuera establecer que la velocidad es constante cuando no hay fuerzas aplicadas, ello ya estaría contenido en la segunda ley y no haría falta referirse al estado de reposo (V=0) pues éste sería un caso particular. Obviamente, con esta interpretación parcial la primera ley de Newton no tendría razón de ser. Probablemente esta interpretación incompleta del Principio de Inercia tenga su origen en la forma en que fuera enunciado por Newton, quién debió desterrar las ideas aristotélicas propias de esa época, por las cuales se asumía que para que un cuerpo se mueva hay que estar empujándolo. Aunque este Curso de Relatividad no requiere el conocimiento de Mecánica Analítica (Euler, Lagrange, Hamilton), señalemos que su formulación se basa en un Principio extremal que resulta válido en cualquier sistema de referencia (inercial o no), mientras que las interacciones se tratan asumiendo que pueden ser descritas por funciones continuas que cumplen ciertos requisitos. Este enfoque es más general que el newtoniano y su estudio es necesario para la fundamentación y desarrollo de la Mecánica Cuántica. Siguiendo las ideas de Poincaré y Einstein, la teoría de la mecánica, ya sea clásica o relativista, puede fundamentarse en las propiedades de simetría del espacio y del tiempo, y en el Principio de Relatividad, indicando con esto último que las leyes de la mecánica son las mismas en todos los sistemas inerciales. La homogeneidad e isotropía del espacio y la uniformidad del tiempo, aceptados como postulados válidos para los sistemas inerciales, permiten deducir como teorema las transformaciones de coordenadas que correspondan, las de Galileo (mecánica clásica) si asumimos que el tiempo es absoluto, o las de Lorentz (mecánica relativista) si aceptamos que la velocidad de la luz en el vacío es la misma para todos los observadores inerciales (ver Transformaciones de Lorentz). En este enfoque la segunda ley de Newton ya no es un Principio, es la definición de fuerza. Resumiendo, los axiomas de la teoría mecánica bajo este encuadre son: Principio de Relatividad. Homogeneidad e isotropía del espacio. Uniformidad del tiempo. Válidos para todo observador inercial. Nota importante Estudios más profundos sobre las propiedades del espacio y el tiempo, iniciados por Poincaré (1904) y Minkowski (1908), y continuados por N. Mermin ("Relativity without light", Am. J. Phys. 52 (2), February 1984) y A. Logunov (1998), permitieron mostrar que la Teoría de Relatividad queda rigurosamente establecida postulando que los fenómenos físicos suceden en un espacio cuadridimensional cuya geometría es pseudo euclídea. Al fijar la métrica no es necesario incorporar el Principio de Relatividad ni la constancia (absoluta) de la velocidad de la luz, pues ello se obtiene como consecuencia. Un análisis completo puede verse en el extraordinario libro de A. Logunov ("Curso de Teoría de la Relatividad y de la Gravitación", lecciones 1 y 2). La condición de invariancia de la velocidad de la luz en el vacío provocó la revisión de los conceptos sobre el espacio y el tiempo, modificando la formulación de la mecánica desde sus cimientos. Las Transformaciones de Lorentz ocuparon el lugar de las de Galileo y el Principio de Relatividad brindó la herramienta para la formulación de leyes relativistas. Una ley clásica resulta relativista sólo si conserva su forma en los sistemas inerciales. Como vimos, esto condiciona a las variables físicas que intervienen en ella pues, ante transformaciones de Lorentz, deben modificarse de tal manera que la expresión de la ley sea la misma. Pedir que las leyes conserven su forma no es un nuevo requisito. Cuando en mecánica clásica decimos que las leyes de Newton son válidas en todos los sistemas inerciales es exactamente decir que conservan su forma ante transformaciones de Galileo. Tal vez esto no era tan notorio en la mecánica clásica debido a que la fuerza, la masa y la aceleración son magnitudes invariantes ante transformaciones de Galileo, es decir, no modifican su valor al cambiar de un sistema inercial a otro inercial. Lo nuevo en Relatividad Especial es el grupo de transformaciones que utilizamos (Lorentz), cuya aplicación usualmente provoca que las magnitudes involucradas en una ley sean relativas al sistema de referencia. En consecuencia, corresponde ser muy cuidadoso en la definición de las mismas. M as a El concepto básico que asumiremos es que la masa de un cuerpo, partícula o ente físico capaz de interactuar con otro, es una medida de su inercia, y su definición debe ser compatible con la conservación de la cantidad de movimiento, tema ya tratado. Llamaremos partículas masivas a toda partícula que posea masa en reposo distinta de cero. Por razones históricas, las radiaciones (campos y fotones) se denominan arbitrariamente no masivas pues no poseen masa propia, aunque sí poseen masa relativista si se adopta p=mv como definición de cantidad de movimiento. Como veremos oportunamente, la masa inercial de un cuerpo depende de su contenido energético, por lo cual el concepto de masa como cantidad de materia no resulta muy adecuado en esta formulación. La definición de Newton, como la constante de proporcionalidad entre la fuerza y la aceleración, que se mide con una balanza, hay que descartarla totalmente pues la fuerza y la aceleración no resultan colineales en mecánica relativista. Dado que ésta definición es utilizada por algunos pocos autores, digamos que en ese caso la masa deja de ser una magnitud escalar pues toma valores distintos según la dirección que se trate. Una definición adecuada parece ser la de Maupertuis (m=p/v): la masa inercial es el cociente entre los módulos de la cantidad de movimiento y de la velocidad de la partícula. Esta definición fue analizada por el matemático Hermann Weyl (1885-1955) y puede adaptarse para partículas no masivas (fotones). Tiene el inconveniente que requiere previamente la definición de la cantidad de movimiento. La definición operativa de Mach de masa relativa, utilizada en un apartado anterior, tiene una restricción formal menor, su definición no puede aplicarse a un sistema de más de dos cuerpos. Sin embargo, resulta una opción atractiva y es posible adecuarla incluso para partículas no masivas (fotones). En todos los casos las mediciones se deben realizar antes y después de la interacción. Nosotros vamos a mantener el concepto de masa como una medida de la inercia. Nota Un análisis más profundo nos demuestra que el fenómeno de inercia de los cuerpos tiene dos causas de distinta naturaleza: la masa relativista, que es una propiedad del cuerpo, y la imposibilidad de superar la velocidad de la luz, que es una consecuencia de las propiedades del espacio y del tiempo. Por el momento, para partículas masivas, adoptaremos la definición de masa de Mach. Esta magnitud es relativa al sistema de referencia, y queda determinada por la expresión de masa relativista, ya vista en el apartado anterior. Para partículas no masivas (fotones) aceptemos por ahora que su masa inercial está dada por: El caso de masa inercial distribuida sobre un campo de radiación electromagnética es más complejo y requiere el conocimiento del vector de Poynting, por lo cual no será tratado en este curso inicial. Luego, cuando veamos energía y el Principio de equivalencia entre masa y energía, daremos una definición precisa, más amplia y general, aplicable en todos los casos. Cantidad de movimiento Definimos como cantidad de movimiento a la magnitud vectorial p=mv, siendo m la masa inercial. Fuerza La mecánica relativista puede formalmente proponerse partiendo de la definición de fuerza a través de la relación vectorial: Siendo p=mv la cantidad de movimiento, con m la masa inercial que es la masa relativista, recientemente vista. Considerando que ésta ley debe conservar su forma ante Transformaciones de Lorentz, se pueden obtener las fórmulas de transformación de las tres (3) componentes de la fuerza, resultando expresiones complicadas (ver Möller, “The Theory of Relativity”), debido a que la fuerza y la aceleración pueden no ser paralelas. Desarrollando la expresión anterior obtenemos: Resulta evidente que la fuerza y la aceleración no son colineales en general. Ésta característica es una de las principales diferencias con la mecánica clásica y es la razón por lo que se dice que la fuerza es “conceptualmente” diferente en relatividad a la aceptada en la mecánica newtoniana. Asimismo, corresponde reiterar que la expresión F=ma no es válida pues no es equivalente a la definición de fuerza que hemos adoptado y no debería ser utilizada. El Teorema del Impulso y la variación de la cantidad de movimiento sale naturalmente de la definición de fuerza. Resulta claro que si no hay fuerzas exteriores aplicadas se cumple la conservación de la cantidad de movimiento. Permítanme ahora tratar una relación muy importante, derivada de la definición de fuerza, cuya demostración será dada luego de tratar el tema de energía relativista. Ella es: Siendo v la velocidad de la partícula. Si descomponemos esta relación vectorial en dos componentes, transversal y tangencial a la velocidad, obtenemos: Esta última expresión muestra claramente que si la velocidad de una partícula tiende a la velocidad de la luz (c), la aceleración en la dirección del movimiento tiende a cero (0), cualquiera sea el valor de la fuerza aplicada. En consecuencia, ningún cuerpo material puede alcanzar la velocidad de la luz en un tiempo finito. Ahora supongamos que tenemos una partícula (fotón) que se desplaza a la velocidad de la luz, sobre la cual actúa una fuerza. Las expresiones vistas muestran claramente que la aceleración tangencial siempre será nula, por lo cual no es posible modificar el módulo de su velocidad (c). Sólo es posible modificar su dirección pues la aceleración transversal puede no ser nula. Como veremos, la masa relativista del fotón es mf = hv/c2. En la carpeta Temas Especiales se tratará el tema “Curvatura de la luz en Relatividad Especial". Por otro lado, si reemplazamos la masa relativista y despejamos F, resulta: Estas expresiones han dado lugar a que algunos autores que usan solamente la masa en reposo consideren, erróneamente, que la partícula posee una inercia “longitudinal” diferente de la “transversal”. Obviamente el error consiste en aceptar como válida la expresión F=ma. En la formulación planteada en este curso la masa que mide la inercia es la masa relativista, que es isótropa. Conclusiones Ningún cuerpo material puede alcanzar la velocidad de la luz en el vacío. Ninguna radiación puede modificar el módulo de su velocidad en el vacío. Las radiaciones poseen masa inercial m>0 y masa propia nula. Fuerza y aceleración no son colineales en general. Nota Un fotón puede ser considerado una partícula pues reúne las tres características necesarias: 1. Posee energía (hv). 2. Posee cantidad de movimiento (hv/c). 3. Posee estructura (campo, longitud de coherencia). Trabajo y Energía Comenzaremos el estudio sobre energía tratando el caso de una partícula (puntual) de masa propia m0, en estado libre en un sistema inercial. Cuando aplicamos una fuerza externa ello provocará un cambio de su cantidad de movimiento que podemos calcular con el Teorema del Impulso, como vimos en el apartado anterior. Ahora vamos a profundizar el estudio de las modificaciones dinámicas que sufre la partícula sobre la que actúa una fuerza externa, a través del Trabajo (W) que realiza la fuerza aplicada. El trabajo elemental de una fuerza se define como: Usando la definición de fuerza obtenemos: Recordando la expresión de la masa relativista, tenemos: En consecuencia, despejando m v dv, quedará Reemplazando en la ecuación del trabajo elemental dW, queda una expresión muy sencilla: Resulta evidente que el trabajo elemental realizado se tradujo en una variación de su masa relativista. Dado que la misma sólo depende de la velocidad, es inmediato ver que la variación de la masa se debe a la variación de la velocidad de la partícula. El Trabajo de la Fuerza a lo largo de un camino quedará expresado por: Siendo m1 y m2 la masa de la partícula en el punto inicial y final, respectivamente. Reemplazando la masa relativista queda: En mecánica clásica el trabajo realizado por la fuerza es igual a la variación de la energía cinética de la partícula (Teorema de las fuerzas vivas). Veamos si el cálculo relativista es compatible con dicho Teorema, como debería ser de acuerdo al Principio de Correspondencia. Para ello debemos analizar qué sucede cuando . Debemos ser cuidadosos como hacemos este análisis, pues si tomamos límite para , resulta W=0. En la aproximación hemos tirado el agua de la tina con el bebé (v) y el patito (c), es decir que directamente eliminamos las velocidades. Para evitar esto último desarrollemos en serie de McLaurin (1698 - 1746) la siguiente expresión genérica: Haciendo cálculos y quedándonos con la aproximación de primer orden, tenemos: Reemplazando en la ecuación original y operando, se obtiene el resultado esperado. En consecuencia, para una partícula sobre la cual aplicamos una fuerza a lo largo de un camino, el Trabajo de la fuerza es igual a la variación de su energía cinética, y ella está implícitamente incorporada en la variación de la masa relativista. Nótese que la trayectoria, la masa y la posición son relativas al sistema de referencia. En consecuencia, el trabajo de una fuerza será también una magnitud relativa al sistema de referencia. Ahora veamos cómo se calcula la energía cinética que posee una partícula. Si en la posición inicial la partícula está en reposo, entonces el trabajo (W) de la fuerza será igual a la energía cinética final. Es decir: Fuerza relativista En el apartado anterior (el de dinámica) definimos la fuerza por la relación F=dp/dt. Desarrollando esta expresión tenemos: Utilizando la expresión dW=c2dm se obtiene: Despejando se llega a la importante relación Esta expresión tiene varias consecuencias destacables, ya vistas: 1. Demuestra que ningún cuerpo material puede alcanzar la velocidad de la luz en el vacío (ver apartado anterior). 2. Demuestra que ninguna radiación o partícula no masiva puede modificar el módulo de su velocidad (ver apartado anterior). 3. Muestra la inconsistencia relativista de la Ley de Newton si la misma es expresada por F=ma (ver apartado anterior). Principio de Equivalencia entre Masa y Energía En un breve trabajo (septiembre de 1905) intitulado “¿Depende la inercia de un cuerpo de su contenido energético?”, Einstein concluye que si un cuerpo irradia luz de energía L, la masa del cuerpo debe disminuir en L/c2, proponiendo una forma de verificación utilizando un elemento radiactivo (Radio). Esta publicación científica condujo a la más célebre fórmula en la historia de la ciencia, conocida como Principio de equivalencia entre masa y energía. E = m c2 Esta relación es considerada un Principio debido a que no tiene una demostración general y se comprobó que es válida universalmente para toda forma de energía. La demostración vista en el apartado anterior solamente vincula la variación de la energía cinética con el incremento de masa de una partícula puntual, equivalente al Teorema de las fuerzas vivas de la mecánica de Newton. La energía total relativista (E) es una propiedad de todo sistema físico, masivo o no masivo, cuyo valor aumenta (disminuye) cuando se le entrega (quita) energía por cualquier proceso, y toma el valor cero sólo cuando el sistema se aniquila (desaparece). En consecuencia, para un determinado sistema de referencia inercial, su valor depende del estado del sistema físico y sólo será constante si el sistema físico está aislado. Resulta evidente, además, que la magnitud Energía total es relativa al sistema de referencia. Calentar un sistema macroscópico, darle cuerda a un reloj, aumentar la velocidad de una partícula, o la absorción de radiación por parte de un gas, son distintos ejemplos de procesos que provocan un incremento de la inercia (masa) del sistema que se trate, que cumple con: Siendo la energía entregada al sistema en el proceso. La magnitud que mide la inercia es la masa relativista. Por supuesto que si el sistema pierde energía por algún proceso cualquiera (radiación, enfriamiento, etc.), el sistema disminuye su masa de acuerdo con la misma relación. Para una partícula puntual, que asumimos sin estructura, el único proceso de transferencia de energía que se considera posible es el trabajo mecánico (fuerza aplicada), producto de una interacción campo-partícula, cumpliéndose la relación dE = dW = F.ds = v.dp. En este caso se considera que toda la energía entregada se transforma en cinética (ver capítulo anterior), variando la masa relativista sin modificar la masa propia. Esta suposición es la única razón por la cual la masa propia resulta constante. Corresponde aclarar que las partículas reales, incluso las fundamentales, podrían no ser puntuales (y tener estructura). En este caso sólo podemos asegurar que la masa propia permanece constante sólo si la partícula está libre de interacciones externas. Por otro lado, si una partícula real está sometida a una interacción tiene fuerzas aplicadas, aspecto que Poincaré analizó para el caso del electrón (tensiones de Poincaré), que muy probablemente modifiquen su morfología y configuración espacial. En consecuencia, en el marco de la Teoría Especial de Relatividad, no es posible asegurar la constancia de la masa propia de una partícula acelerada. Este Principio establece nuevos conceptos que deben destacarse: 1. La energía relativista E representa la energía total que se podría obtener (en forma de radiación) si lográramos convertir toda la masa relativista en energía, tal como sucede en el fenómeno conocido como "aniquilación de pares". Por primera vez se dispone de un cálculo de energía total válido para cualquier sistema físico, cuyo valor tiene significado físico. Se hace notar que las magnitudes tales como Energía interna (Termodinámica), Energía potencial (Campos conservativos), Energía mecánica (Mecánica clásica), están definidas a menos de una constante arbitraria y su valor numérico no tiene significado físico. 2. La energía total de una partícula en reposo, “almacenada” en su masa propia, está dada por E=m0 c2. Los mecanismos de conversión de masa en energía radiante y viceversa, fueron estudiados durante la primera mitad del siglo XX, principalmente con el formalismo de la Teoría Cuántica de Campos (iniciada en la década del 20), actualmente en desarrollo. 3. El Principio permite dar una definición de masa (relativista) compatible con partículas no masivas, es decir sin masa propia (fotones), generando una coherencia lógica, general y sin limitaciones, con la definición de cantidad de movimiento propuesta (p=mv). Se define como masa de cualquier sistema físico, sea puntual o extenso, masivo o no masivo (masa propia nula), al escalar obtenido del cociente entre la Energía total E del sistema y el cuadrado de la velocidad de la luz en el vacío. Su expresión matemática es: m = E/c2 En consecuencia, podemos dar una definición precisa para la cantidad de movimiento, válida para partículas masivas y no masivas: p = E/c2 v, siendo E la energía total En el apartado Temas Especiales se tratará la aplicación de este concepto en el artículo “Curvatura de la luz en Relatividad Especial”. 4. Los Principios de conservación de la masa y de la energía, que se formularon de manera independiente para sistemas aislados, ahora se relacionan en un único Principio pues masa y energía están relacionadas por el Principio de Equivalencia entre masa y energía. En consecuencia, el Principio de Equivalencia podría (y debería) ser formulado de la siguiente manera: El contenido total de energía de un ente físico cualquiera es igual a su masa relativista multiplicada por el cuadrado de la velocidad de la luz Nota Muchos autores, especialmente los dedicados a la física de partículas, proponen su validez solamente para cuerpos en reposo, con argumentos poco convincentes que resultan ser los mismos por los cuales tampoco aceptan la masa relativista. Lo más inexplicable es que luego usan los conceptos que rechazan. En su trabajo original de tres carillas, Einstein analiza la emisión de radiación y la variación de la masa en la forma usual del formalismo de la teoría, es decir desde el punto de vista de dos observadores inerciales, uno en reposo respecto del cuerpo y el otro en movimiento con velocidad constante. Proponer que esa demostración es sólo válida para cuerpos en reposo es falso, sin criterio y ridículo. Creación y Aniquilación de pares Este singular fenómeno no se conocía en el inicio de la Teoría de Relatividad y su descubrimiento se debió justamente a dicha teoría. En 1928 el ingeniero electricista (luego matemático y posteriormente doctor en física) Paul Dirac (1902-1984) predijo la existencia de antimateria al relacionar la mecánica cuántica con la relatividad. El positrón (e+), que es la antipartícula del electrón (e-) y posee sus mismas propiedades salvo la carga, que es positiva, fue observado por primera vez por Anderson en 1932. La creación de pares es el proceso por el cual una partícula (masiva o no), de energía suficiente y bajo ciertas condiciones, crea dos o más partículas diferentes. Este fenómeno es típico en los aceleradores de partículas, en las reacciones nucleares y en la radiación cósmica. Nos interesa tratar el caso de creación de pares obtenidos de fotones de alta energía. La cantidad de movimiento de un fotón es distinta de cero cualquiera sea el sistema de referencia que se elija, mientras que para dos partículas masivas, en el particular sistema de su centro de masa, resulta nula. En consecuencia, teniendo en cuenta que en ausencia de fuerzas exteriores la conservación de la cantidad de movimiento debe ser válida en todos los sistemas inerciales, la creación de pares a partir de un fotón aislado no es viable. Debe recordarse que en este marco teórico la velocidad relativa entre sistemas inerciales (V) siempre es menor que c. Para fotones, la ocurrencia del fenómeno indefectiblemente requiere que el fotón interactúe con algún otro ente físico real, dado que esta condición es consistente con el Principio de conservación de la cantidad de movimiento. A modo de ejemplo vamos a describir la fenomenología de un caso característico, en el sistema de referencia en el que el agente perturbador esté en reposo luego de la interacción: Si un fotón de alta energía (gamma) es perturbado (se desconoce cómo es el proceso disparador del fenómeno) por un núcleo, el fotón se aniquila y se crean dos o más partículas masivas. El caso más frecuente es la creación de un electrón y un positrón. La energía de un electrón (positrón) en reposo es E0 = m0 c2 = 0.511 Mev. En consecuencia, para la creación de un par electrón-positrón la energía del fotón debe ser mayor que 1.022 Mev. Si el fotón es más energético (Efotón > 1.022 Mev) las partículas creadas tendrán también energía cinética (en general idéntica), cumpliéndose las leyes de conservación de la energía y de la cantidad de movimiento. Cuanto mayor sea la energía del fotón madre, mayor será la energía cinética de las partículas creadas. Por conservación del momento angular el fotón gamma inicial, el electrón y el positrón, tienen sus velocidades en un mismo plano. Suponiendo que el plano es el (x,y) y que la dirección inicial del fotón es coincidente con el eje x, tenemos: Este fenómeno, que es tratado en la Teoría Cuántica de Campos (QFT), ha tenido diferentes interpretaciones (Fock, Feynman, Stueckelberg), particularmente en el tratamiento cuántico. En todas ellas se cumplen las relaciones relativistas antes y después del proceso, pero no necesariamente durante el mismo, lo cual puede ser considerado una limitación del modelo teórico utilizado (QFT). En las relaciones anteriores no se ha tenido en cuenta la energía de enlace entre electrón y positrón que se atraen, pues se considera que es despreciable frente a la energía del fotón madre aunque, como veremos, esto es seriamente discutible. Analicemos algunas dificultades del modelo teórico desde el punto de vista relativista. Por el Principio de conservación de la carga, que postula la conservación de la carga total del universo, las dos partículas deben crearse simultáneamente y ello sólo es posible si los eventos ocurren en el mismo punto (ver el capítulo de simultaneidad). Si la aniquilación del fotón y la creación del par ocurren en un mismo punto, la energía necesaria para separarlas se hace infinita por la atracción eléctrica entre electrón y positrón, y no se cumple la conservación de la energía. En el tratamiento cuántico Feynman utilizó el Principio de Incerteza (no se conserva la energía durante el tiempo del proceso de creación ni está definida la posición de cada partícula), y la postulación de fotones "virtuales" con velocidades mayores que c para no violar el principio de causalidad, con lo cual el modelo se ajustó muy bien a los resultados experimentales. No obstante y dadas las transgresiones relativistas, considero que no sabemos mucho sobre el proceso real. Se ha confirmado experimentalmente que una vez creado un positrón su condición más probable es que se vincule con un electrón formando un sistema metaestable excitado, llamado “positronio”, con niveles de energía, y cuya vida media es del orden de 10-7seg. Aparentemente no tiene un nivel fundamental estable. Durante este lapso el positronio (en reposo) decae emitiendo fotones poco energéticos (como cualquier átomo excitado), y finalmente se aniquila en dos fotones gamma idénticos de 0.511 Mev de energía, emitidos en oposición (1800), requisito necesario para la conservación de la cantidad de movimiento. Nótese que a pesar de que la energía del fotón inicial es mayor que la necesaria para crear el par electrón-positrón, luego de su aniquilación obtenemos dos fotones gamma idénticos y de energía exactamente igual a la energía en reposo de cada partícula. El exceso de energía del fotón inicial se consumió luego de la creación del positronio en estado excitado, por decaimiento del mismo con emisión de fotones de baja energía. Sin embargo, hay un caso muy importante en el que el par electrón-positrón no forma el positronio. Si las partículas chocan con velocidades diferentes, ambas cercanas a las de la luz, como puede suceder en experimentos en aceleradores (CERN), éstas se aniquilarán “al vuelo” sin formar un estado metaestable previo. En ese caso, los dos fotones gamma resultantes de la aniquilación serán idénticos, podrán formar ángulos distintos de 180º en sus trayectorias de salida y serán más energéticos (Ef > 0.511 Mev). Este hecho experimental muestra la conversión total de la masa relativista en radiación. En este caso para cada fotón gamma emitido se cumple: Los superíndices e- y e+ son usados para evitar que se confunda la masa relativista con la masa propia. Relación entre Energía y Cantidad de movimiento La equivalencia entre masa y energía puede ser expresada en relación a la cantidad de movimiento. Esta expresión corresponde a un invariante importante que trataremos a continuación. La masa en reposo de una partícula libre debe ser la misma en cualquier sistema de referencia, pues de lo contrario los sistemas inerciales no serían equivalentes ya que podrían ser distinguibles. Lo mismo sucede con la longitud propia de un objeto o el tiempo propio de un fenómeno. En consecuencia, para dos observadores inerciales tendremos: Este invariante es similar al del “Intervalo” tratado en el apartado de Transformaciones de Lorentz. Nota Su demostración en el espacio de Minkowski es elegante y simple, basada en que la cantidad de movimiento se transforma como las coordenadas (x, y, z) y la energía como el tiempo. La masa en reposo En el ítem anterior hemos tratado el caso de la constancia de la masa en reposo para una partícula libre. Veremos que esto no es general y que la masa en reposo puede ser modificada bajo ciertas condiciones. Previamente hagamos algunas aclaraciones para evitar que los amantes de la bella formulación geométrica de la Relatividad se suiciden en masa. Los invariantes obtenidos en ese modelo son rigurosos matemáticamente, tal como sucede con la masa propia (m0), y ello es consecuencia de cómo se transforman las "variables" relacionadas (E,p). La masa propia resulta entonces un invariante que es constante simplemente porque hemos establecido que, para una partícula puntual, la única modificación posible cuando le entregamos energía es que cambie solo su cantidad de movimiento. En consecuencia, aunque poco probable, si encontráramos algún mecanismo de transferencia de energía que no modificara su velocidad, sería inevitable que cambie la masa propia de una partícula puntual. En primer lugar digamos que existen otros procesos (no aplicables a partículas puntuales), además del trabajo mecánico ya visto, capaces de transferir energía (calentamiento, deformación, fricción, absorción, etc). Por ejemplo, si el cuerpo material es un sistema macroscópico en reposo, podemos entregarle o quitarle energía (Q) por intercambio de calor. Dado que este mecanismo puede ser hecho sin necesidad de modificar su velocidad, debemos concluir que tiene que modificarse su masa en reposo, que en el caso en que se le entregue energía será: Si el sistema pierde energía bastará con cambiar el signo en la relación anterior y la masa propia final será menor. Para un sistema macroscópico, la masa en reposo del mismo es función de la temperatura. En general, si a un sistema físico, sea puntual o extenso, podemos entregarle o quitarle energía sin modificar su velocidad, el sistema cambiará su energía total, su masa relativista y su masa propia, de acuerdo con el Principio de Equivalencia entre masa y energía. En la carpeta Temas Especiales se agregarán dos trabajos: “El Corrimiento al Rojo en Relatividad Especial”, y “El Efecto Mössbauer en Relatividad Especial”, vinculados con la variación de la masa de un sistema. De acuerdo al Principio de equivalencia entre masa y energía, cualquier sistema físico formado por componentes que interactúan entre sí debe tener una masa diferente a la suma de las masas de sus componentes en estado libre (no vinculado). Analicemos el caso más simple posible, que consiste en un sistema formado por dos partículas que se atraen, y supongamos que inicialmente están juntas y en reposo. Para separarlas debemos realizar un trabajo mínimo (W), cuyo valor representa la energía que se debe entregar al sistema para desvincular las partículas y que ellas queden en reposo. Si se le entrega más energía que la necesaria (W), las partículas libres (no vinculadas) tendrán energía cinética. En consecuencia, el sistema con las partículas “pegadas” posee menos energía que el mismo sistema de dos partículas cuando ellas no están vinculadas. En general, si el sistema y las partículas (idénticas) están en reposo, en su condición de mínima energía (pegadas), su energía será: Siendo m0 la masa propia de cada partícula y W el trabajo necesario para desvincularlas (separarlas). Es evidente que la masa del sistema es menor que la suma de las masas de sus componentes ( m0 2m0 ). S Cuando el sistema no está vinculado (partículas libres en reposo), su masa será 2m0. Queda planteado mostrar que si las partículas del sistema se repelen, la masa del mismo será mayor cuando estén “pegados” sus componentes. Ahora veamos el caso del átomo de Hidrógeno, formado por un electrón y un protón. La energía de ionización es 13.5984 eV, que representa la energía mínima que debo suministrarle al átomo para desvincular su electrón. Esta energía es muy pequeña para que pueda detectarse la diferencia de masa entre el átomo en estado fundamental y la suma de las masas de sus dos componentes. De acuerdo a lo visto, la masa del átomo de Hidrógeno en estado fundamental debe ser menor que la suma de las masas del protón y el electrón. Hagamos las cuentas: Masa del protón: 1.6726 × 10-27 kg Masa del electrón: 9.11 x 10-31 kg Masa del electrón + Masa del protón: 1.673511 × 10-27 kg Masa del H (est. Fund.): mp+me – 13.5984 eV/c2 = 1.673510976 × 10-27 kg Diferencia de masa: 2.4 x 10-35 kg Nótese que la diferencia de masa es 100 millones de veces menor que la masa del sistema. Considerando que todos los átomos de la Tabla periódica tienen energías de vínculo de electrones del mismo orden que la del Hidrógeno, la diferencia de masa por el enlace con sus electrones no será significativa. Sin embargo, en el átomo hay energías de vínculo muchísimo más grandes, que son las que ligan a las partículas del núcleo atómico (nucleones), relacionadas con las fuerzas nucleares, que trataremos a continuación. Defecto de masa Se denomina defecto de masa a la diferencia de masa de un núcleo atómico, medida experimentalmente (masa del sistema), y la que corresponde a su número atómico (suma de las masas de sus componentes). Esto es exactamente lo que acabamos de analizar en el ítem anterior pero, en este caso, con fuerzas de ligadura muchísimo más grandes. Veamos un caso real, el Deuterio (isótopo del Hidrógeno) ionizado, cuyo núcleo está formado por un protón y un neutrón. Los valores de las masas correspondientes son: Masa protón: 1.0073 u Masa neutrón: 1.0087 u Masa Deuterio: 2.0136 u Defecto de masa: (mp+mn) - mD = 0.0024 u u = uma (unidad de masa atómica) = 1.66053886x10-27 kg La energía correspondiente a un uma es de 931.5 Mev. La energía de ligadura del Deuterio es 2.23 MeV. En este caso la diferencia de masa es 1000 veces menor que la masa del sistema. Si se compara con el caso anterior (átomo de Hidrógeno) se puede obtener una idea cualitativa de la magnitud de las fuerzas nucleares respecto de las electromagnéticas. No obstante, el Deuterio es un núcleo poco ligado si se lo compara con otros. Las mediciones de defecto de masa de los distintos átomos tienen mucha importancia dentro de la Física Nuclear y en el estudio de las reacciones nucleares, como así también en la Astrofísica, en los modelos sobre la evolución de las estrellas. Este último ítem (defecto de masa) puede resultar interesante o no, pues se trata simplemente de información sobre datos reales medidos. Sin embargo, destaco que para los fines de este curso, lo realmente importante es que verifican el Principio de Equivalencia y la variación de la masa propia del sistema. Relatividad de la energía Es evidente que la energía de un sistema físico es una magnitud relativa al sistema de referencia. Tomemos, por ejemplo, la energía total de una partícula libre, de masa propia m0 y velocidad constante v, cuya expresión está dada por Para dos observadores inerciales en movimiento relativo la única magnitud que tiene distinto valor en la expresión anterior es la velocidad de la partícula. Nota En este marco teórico toda magnitud propia de un cuerpo en movimiento uniforme es invariante. De lo contrario los sistemas inerciales serían distinguibles, invalidando el Principio de Relatividad. No debe interpretarse que la masa propia no pueda variar ante determinados procesos, sino que ante Transformaciones de Lorentz la masa propia es la misma para todos los observadores inerciales. Hallemos la ley de transformación de la energía para dos sistemas inerciales, usando el teorema de adición de velocidades. Operando el radicando del denominador en el segundo miembro se obtiene la siguiente igualdad Reemplazando en la expresión de la energía obtenemos Esta expresión es válida sólo si la velocidad relativa (V) entre sistemas inerciales está según el eje x. En el caso general la ley de transformación es: La transformación inversa la obtenemos reemplazando V por -V, quedando: Complementos de Energía - Los Campos Vectoriales En el desarrollo de este capítulo haremos uso de herramientas matemáticas propias del análisis vectorial, cuyo conocimiento resulta indispensable para comprender el comportamiento de los campos físicos vectoriales, tales como el electromagnético y el gravitatorio. Si el lector no maneja estas herramientas deberá “creer” las conclusiones pero no debería saltear este ítem. En el apartado Temas Especiales hay un capítulo extenso sobre las ecuaciones de Maxwell (que son relativistas de nacimiento), que requieren este conocimiento. Un posible y adecuado tratamiento de los fenómenos se logra cuando disponemos de un modelo matemático consistente con los comportamientos observados. Para ello es común definir magnitudes asociadas al fenómeno, algunas de las cuales pueden depender de la posición y/o el tiempo, dando lugar a relaciones funcionales o campos matemáticos, de distinta dificultad y naturaleza. Un objetivo concreto de la Física es obtener las leyes que cumplen esos campos, usualmente expresadas con ecuaciones diferenciales, y hallar su solución matemática compatible con la geometría y las condiciones de contorno del problema particular dado. Estos campos suelen ser escalares, vectoriales o tensoriales, dependiendo ello de la variable considerada y las características del sistema en cuestión. Por ejemplo, la temperatura de la atmósfera puede ser representada por un campo escalar T(x,y,z,t), el campo eléctrico asociado a un cuerpo cargado se describe con un campo vectorial E(x,y,z,t), y las deformaciones de un sólido deformable sometido a presiones externas pueden ser calculadas por un campo tensorial Dij de segundo orden, con componentes que son funciones del espacio y del tiempo. En este capítulo trataremos sobre campos escalares y vectoriales, prestando especial atención a estos últimos. Suele indicarse que las propiedades de un campo vectorial quedan totalmente establecidas si conocemos su divergencia y su rotor. Tratemos de comprender el significado de esta aseveración. Divergencia Recordemos que la divergencia de un campo vectorial es una función escalar que permite relacionar a un campo vectorial con las “fuentes” y “sumideros” del mismo. Diremos que en todo punto (x,y,z) donde la divergencia da un resultado positivo hay fuente del campo, si da negativo hay sumidero, y si es nulo puede existir el campo pero no “nace“ ni “muere“ en dicho punto. En general no se conoce el campo A pero sí su divergencia (fuentes y sumideros). Procediendo de manera inversa podría suponerse que si conocemos las fuentes y sumideros de un campo podríamos determinar unívocamente la forma funcional del mismo mediante la solución de la ecuación diferencial de la divergencia. Ello no es correcto pues quedaría determinado a menos de otra función vectorial cualquiera de divergencia nula. Podemos señalar algunos aspectos interesantes relacionados con la divergencia. Todo campo de divergencia nula en todo el espacio tiene líneas de corriente (también llamadas líneas de fuerza) cerradas. Tal es el caso del campo magnético B(x,y,z,t). Campo magnético de una corriente filiforme. Todo campo uniforme (constante) en todo el espacio tiene divergencia nula. Es fácil mostrar que el único campo radial con simetría esférica que tiene divergencia nula en todo el espacio (excepto en el origen), varía como 1/r2. Este comportamiento corresponde tanto al campo eléctrico de una carga puntual en el origen como al campo gravitatorio de una masa puntual en el origen, que para cuerpos en reposo en interacciones campo-partícula conducen a la ley de Coulomb y a la ley de Newton de gravitación universal, respectivamente. En el origen el campo no está definido (singularidad). Para el caso eléctrico las cargas positivas son las fuentes donde “nace” el campo y las negativas los sumideros donde “muere”, mientras que en el gravitatorio las masas son siempre sumideros (la constante es negativa). Rotor El rotor de un campo vectorial da otra función vectorial (pseudovector). Por definición es: Las líneas de corriente del rotor de un campo vectorial son siempre cerradas, lo que significa que su divergencia es nula. Se deja al lector mostrar que la divergencia del rotor de un campo vectorial es siempre nula (sugerencia: use el Teorema de Schwartz de la igualdad de las derivadas cruzadas). Alguna bibliografía suele destacar como importante utilidad del rotor la relación que dicho cálculo tiene con la descripción de “torbellinos”, en particular cuando se trata de un campo de velocidades de un fluido. Sin negar que tal relación exista (de ella salió la denominación de rotor) es mi opinión que esta interpretación no es relevante y esconde la importancia conceptual que tiene esta operación. Cuando el rotor se aplica a un campo físico asociado a interacciones, el aspecto más fundamental del mismo es que su cálculo permite reconocer si dicho campo admite o no una función escalar potencial, tal que su gradiente determina al campo. En efecto, si en todo punto del espacio se cumple: Cuando el rotor es nulo diremos que el campo es conservativo, caso que trataremos en detalle más adelante en este capítulo. En general no conocemos ni A(x,y,z,t) ni R(x,y,z,t), pero en algunos casos es posible saber por consideraciones físicas si es conservativo (o no). Esto implica disponer de tres ecuaciones diferenciales a derivadas parciales de primer orden, una para cada componente del rotor, cuya solución no es suficiente para determinar unívocamente el campo vectorial A(x,y,z,t), pues queda determinado a menos de otro campo vectorial de rotor nulo. Vemos entonces que conocer sólo la divergencia o el rotor de un campo vectorial no es suficiente para hallar dicho campo vectorial. En cambio, puede mostrarse que si conocemos ambos el campo A queda determinado (unicidad de la solución). Para hallar la ecuación que relaciona al campo vectorial con su divergencia y su rotor usaremos una identidad vectorial. La última relación representa tres ecuaciones diferenciales a derivadas parciales, de segundo orden, cuya solución formal determina el campo A unívocamente. Nótese que en el caso en que el campo sea conservativo su rotor es nulo resultando la ecuación de Poisson vectorial (tres ecuaciones). Como veremos, el planteo se simplifica pues existe una función potencial escalar, quedando finalmente una única ecuación de Poisson. Nota En física tienen notable importancia aquellos campos que están relacionados con las interacciones entre sistemas y, en consecuencia, tienen relación funcional con los intercambios de energía. Por ello deben ser compatibles con la Teoría de Relatividad Especial y con el Principio de Causalidad, por lo cual ante procesos no estacionarios los campos deben cumplir también con la ecuación de ondas (velocidad finita de propagación). Campos conservativos I - Mecánica clásica Teorema de conservación de la energía mecánica Se dice que un campo vectorial F es conservativo si se cumple que la circulación de dicho campo a lo largo de cualquier curva cerrada es cero. Si el campo F es un campo de fuerzas, la expresión anterior equivale a calcular el trabajo W realizado por la fuerza a lo largo del camino cerrado C, resultando nulo cualquiera sea el camino elegido. Como veremos, si el trabajo W es nulo para toda curva cerrada entonces se puede definir la Energía Potencial de una partícula en presencia de dicho campo de fuerzas, y definir la magnitud “Energía Mecánica”, que resulta constante para dicho sistema, siendo esto último el origen de la denominación “conservativo”. Para que esa integral curvilínea (“circulación de F”) sea nula para cualquier camino C, su integrando debe ser un diferencial exacto (Pfaffiano). Desarrollando el producto escalar y el diferencial total, obtenemos: Resulta evidente que F puede ser puesto como el gradiente de la función escalar ( x, y , z ) , llamada función potencial. Hasta aquí hemos mostrado que si un campo vectorial es conservativo siempre tiene una función potencial tal que su gradiente nos da el campo. Discutiremos algunos aspectos que no suelen tratarse en la bibliografía técnica. 1. El primero es respecto de la información que poseen un campo vectorial y uno escalar. Un campo vectorial nos da tres (3) datos en cada punto (módulo, dirección y sentido), mientras que un campo escalar sólo da un (1) número. ¿Cómo es posible que el campo escalar tenga toda la información del campo vectorial? Si se observa la igualdad resulta claro que la información del campo vectorial está incorporada en la forma de la función escalar y no en su valor en un punto, y que esa información se obtiene a través de las derivadas con la operación gradiente. 2. El segundo aspecto se refiere a la existencia y al Teorema de unicidad de la función potencial. Si un campo vectorial es conservativo siempre existe una función potencial y es única a menos de una constante arbitraria (que al derivar se anula). En consecuencia, el valor numérico de la función potencial en un punto del espacio no tiene significado físico, pero sí la diferencia de valores de la función potencial entre dos puntos del espacio. Si el campo no es conservativo no existe función potencial. Si ahora calculamos el trabajo W sobre una partícula entre dos puntos cualesquiera (curva C abierta), obtenemos: Recordando que el trabajo W es igual a la variación de la Energía Cinética, quedará: Si ahora definimos Energía Potencial (EP) de una partícula (en presencia de un campo de fuerzas conservativo), a la función potencial del campo cambiada de signo, tenemos EP . Nótese que la Energía Potencial queda determinada a menos de una constante, pues la función potencial tiene la misma indeterminación. Asimismo, el valor numérico de la Energía Potencial carece de significado físico, pero sí lo tiene la diferencia de valores de la Energía Potencial entre dos puntos del espacio. Reordenando, queda: Dado que los puntos 1 y 2 son dos puntos cualesquiera del espacio, llegamos a la conclusión que para una partícula en presencia de un campo conservativo, la suma de su energía cinética y su energía potencial es un valor constante. Se define como Energía Mecánica de una partícula a la suma de su Energía Cinética y su Energía Potencial. El desarrollo que acabamos de ver es el Teorema de conservación de la Energía, cuyo enunciado es: En todo sistema inercial aislado, si las fuerzas son conservativas, la Energía Mecánica es una constante. Notas importantes 1. El valor numérico de la Energía Mecánica carece de significado físico. Se deja al lector que analice esta aseveración. Solamente le indico que la utilidad del Teorema de Conservación de la Energía Mecánica reside en que sea aplicado en dos puntos separados. 2. Asimismo, muestre que la Energía Potencial no puede depender del tiempo. No obstante, es común encontrar en la bibliografía expresiones sobre la función potencial dependiente del tiempo para sistemas no conservativos (reales). Ello es correcto y no se refiere al tema visto en este capítulo. Será tratado en el apartado que se agregará sobre Ecuaciones de Maxwell. 3. Los campos físicos de los procesos reales no son conservativos. Si bien esto es una especulación, el conocimiento actual lo confirma. El tema se tratará en la carpeta de Temas Especiales, analizando las condiciones que debe cumplir un campo físico vectorial para ser relativista. 4. Para saber si un campo vectorial es conservativo basta con calcular su rotor. Veamos cómo se vincula el rotor de un campo con que sea conservativo. Con el Teorema de Stokes, que relaciona la circulación de un campo vectorial con el flujo del rotor de dicho campo a través de cualquier superficie que tenga por borde a la curva C, se puede demostrar que la circulación de un campo vectorial (en una curva cerrada) es nula si el campo tiene rotor nulo en todo el espacio. Matemáticamente es: Si el rotor es nulo en todo el espacio, el campo es conservativo. II - Mecánica relativista Se puede demostrar que las propiedades de un campo vectorial quedan totalmente determinadas si se conocen su divergencia y su rotor. La divergencia es una operación que relaciona al campo con las “fuentes y sumideros” del mismo. Hemos visto que el rotor nos dice si el campo es conservativo o no. Ahora mostraremos que la condición de un campo de ser conservativo no es una ley relativista, es decir que es una característica solamente válida en un dado sistema de referencia (lo mismo sucede en el caso no relativista). Para ello analicemos el siguiente ejemplo: Sea un sistema formado por una carga puntual en reposo en el origen de coordenadas de un sistema inercial. El campo eléctrico correspondiente es conservativo, con rotor nulo en todo el espacio, excepto en el origen donde no está definido. Su función potencial es fácilmente calculable y no depende del tiempo. Otro observador inercial O’ en movimiento relativo verá una carga puntal moviéndose con velocidad constante. En cada punto del sistema primado tendremos un campo eléctrico y un campo magnético, ambos dependientes del tiempo, que cumplen con las ecuaciones de Maxwell. Matemáticamente describiremos esta situación en ambos sistemas de referencia: Es evidente que en el sistema primado el campo no es conservativo pues su rotor no se anula. Teorema de conservación de la energía (caso relativista) Hemos mostrado en forma general que si un campo de fuerzas tiene rotor nulo entonces es conservativo y existe la función energía potencial. En este caso se cumple: Siendo F la fuerza sobre una partícula y EP la energía potencial. También demostramos (en un apartado anterior) que dw = F.ds = c2dm, y lo interpretamos como la variación infinitesimal de la energía cinética de una partícula. Vinculando las relaciones obtenemos: Integrando esta expresión para dos puntos del espacio, quedará: La última igualdad es la expresión matemática del Teorema de conservación de la energía, cuyo enunciado es: En todo sistema inercial aislado, si las fuerzas son conservativas, la suma de la energía total (mc2) y la energía potencial es una constante. Nótese que para el caso de una partícula cuya masa en reposo es un invariante, si restamos la constante m0 c2 en ambos miembros, el Teorema sigue siendo válido. En este caso el enunciado es el mismo que en Mecánica clásica (no relativista): En todo sistema inercial aislado, si las fuerzas son conservativas, la suma de la energía cinética y la energía potencial es una constante. En mi conocimiento, este importante Teorema extrañamente no figura en la bibliografía específica, aunque es utilizado con mucha frecuencia. Veamos un ejemplo (Cullwick – “Electromagnetism and Relativity”, pág. 79): Un electrón inicialmente en reposo es acelerado por un campo electrostático, sin irradiar. Se pide la variación de la masa del electrón luego de ser acelerado por una diferencia de potencial. Las características del problema son: El campo electrostático es conservativo. El campo eléctrico E está dado por E V La fuerza es F qE V . Como q < 0 (electrón) el movimiento será hacia donde crece el potencial. La energía potencial está dada por la relación EP qV x; y; z C1 , siendo V(x,y,z) la función potencial del campo eléctrico y C1 una constante arbitraria. Aplicando el Teorema de conservación de la energía obtenemos: Asumiendo que en el punto 1 estaba en reposo y despejando, se obtiene: Su velocidad puede hallarse de la expresión de masa relativista Se deja planteado como ejercicio demostrar que el trabajo eléctrico es igual a la variación de energía cinética del electrón. Campos no conservativos Un campo de fuerzas no es conservativo si su rotor es distinto de cero, lo que es equivalente a decir que la energía del sistema no permanecerá constante si el móvil realiza cualquier trayectoria cerrada. En efecto, si el rotor no es nulo, aplicando el Teorema de Stokes tenemos: En este caso no vale el Teorema de conservación de la energía ni existe Energía Potencial del sistema. La experiencia nos muestra que muchas veces son reconocibles los mecanismos que causan que un campo de fuerzas no sea conservativo. Entre ellos se distinguen los siguientes tres procesos que provocan pérdidas irreversibles de energía del sistema: rozamiento, deformación plástica y/o radiación térmica. En estos casos es posible asumir que el campo de fuerzas puede ser expresado como la suma de uno conservativo y otro no conservativo, quedando Corresponde señalar que la energía disipada en general no es calculable mediante la integral curvilínea (circulación) de una función analítica, tal como fue indicada en la expresión anterior. Cuando las fuerzas presentes no son conservativas el Teorema de conservación de la energía no es aplicable. No obstante, por razones empíricas se acepta que la energía total de un sistema, incluyendo la energía disipada, permanece constante. Esta afirmación, no demostrable teóricamente, constituye el Principio de conservación de la energía. Masa Propia y Potencia Se define como masa propia (m0) de un sistema físico masivo al valor que ella toma cuando es medida en reposo. Para un cuerpo en movimiento su masa (relativista) resulta distinta a su masa propia y puede determinarse midiendo su cantidad de movimiento (p=mv). La relación entre la masa propia y la relativista está dada por la siguiente relación: Esta última expresión es consecuencia de la ley de conservación de la cantidad de movimiento, que a su vez resulta de aceptar la homogeneidad del espacio. Si esta relación entre masa propia y relativista tuviera alguna limitación deberíamos cuestionar las propiedades de simetría del espacio-tiempo aceptadas, y con ello la validez de la Teoría Especial de Relatividad. En consecuencia, en este marco teórico todo ente físico cuya velocidad sea c deberá tener masa propia nula pues, de lo contrario, la relación aludida no es válida (indefinición matemática). Las propiedades de simetría del espacio-tiempo tienen como consecuencia que toda magnitud “propia” debe ser invariante ante Transformaciones de Lorentz, pues de lo contrario los sistemas inerciales serían distinguibles. Se concluye entonces que la masa propia tendrá el mismo valor en todo sistema de referencia inercial. Debe notarse que la invariancia relativista de la masa propia no implica que no pueda variar su valor en el tiempo, tal como sucede en los sistemas físicos reales durante una interacción. Asimismo, la longitud propia de una varilla, que es invariante ante Transformaciones de Lorentz, resulta distinta si la caliento o enfrío. La invariancia describe que el valor instantáneo de una magnitud “propia” es el mismo para todo observador inercial, sin que ello signifique que sea constante en el tiempo. La formulación de Minkowski de la Relatividad Especial (1907) trata sobre las propiedades que asignamos al espacio (homogeneidad e isotropía) y al tiempo (uniformidad), de acuerdo con el comportamiento observado de los fenómenos naturales, y las relaciones funcionales que esas magnitudes fundamentales cumplen en los sistemas inerciales. Este modelo matemático, escrito en un espacio de Riemann de 4 dimensiones, denominado Espacio de Minkowski, provee un método analítico que fue fundamental para toda la Física Relativista. En su aplicación a la Mecánica y por razones matemáticas, Minkowski sostuvo que la masa propia debía ser un invariante (de Lorentz) no dependiente del tiempo. Aunque no es objetivo de este curso plantear la Relatividad en lenguaje tensorial, resulta conveniente describir algunos aspectos contradictorios de esta formulación inicial que, en mi opinión, condujeron a malas interpretaciones posteriores. Minkowski, usando cuadrivectores, propuso varias formas distintas (equivalentes) como ley fundamental del movimiento (ley tensorial, que representa cuatro ecuaciones escalares): Sin necesidad de un análisis o explicación extensa de esta ley, invariante por construcción, señalemos que ui es el cuadrivector velocidad, que fi es el cuadrivector fuerza, y que en todas las ecuaciones propuestas la masa o densidad propia están fuera de la derivada temporal. El hecho de que haya utilizado la densidad propia sugiere además la pretensión de que este modelo sea válido para sistemas no puntuales. Desde el siglo XVII sabemos que la fuerza está relacionada con la variación de la cantidad de movimiento y que en el caso en que m sea constante, como supuso Newton para un “punto material”, se puede expresar como: Aparentemente, el matemático Minkowski siguiendo estas ideas asumió que la masa propia era invariante y constante en el tiempo, sin contemplar que ello conduce a resultados incorrectos si las interacciones involucran cambios de energía diferentes a los del trabajo mecánico sobre el centro de masa del sistema, tales como absorción o emisión de radiación, efecto Joule, cambios de estado, procesos termodinámicos con intercambio de calor, compresiones, rozamiento, deformación plástica, etc. Poincaré, Einstein y Abraham (y seguramente otros físicos) hicieron notar que la propuesta inicial de Minkowski era incorrecta y que su uso en sistemas reales conducía a resultados inaceptables. De acuerdo al enfoque físico de la Relatividad de Einstein (1905) y al Principio de Equivalencia (1907), la masa propia no podía permanecer constante durante una interacción. Abraham en 1909 demostró que la correcta formulación tensorial de la ecuación invariante de movimiento, expresada a continuación, debe considerar variable a la masa propia del sistema, poniendo orden en el modelo tensorial de la Mecánica Relativista. Asimismo, Pauli y Möller más tarde mostraron que si la masa propia de un sistema macroscópico se considera constante durante una interacción, la Termodinámica Relativista deja de ser válida desde sus fundamentos. Este tema puede verse con más detalle en el tratado de Pauli (“Special Theory of Relativity”, Cap. 3 – pág. 108) y en el libro de Möller (“The Theory of Relativity”, Cap. 4 – pág. 106). Aparentemente ello no fue incorporado convenientemente por parte de otros especialistas pues, salvo raras excepciones, la bibliografía y trabajos científicos, usualmente referidos a la física de partículas, tratan a la masa propia como si fuera un invariante constante en el tiempo en todos los casos, incluso algunos de manera explícita a pesar de los innumerables ejemplos que contradicen dicha postura, y modifican por conveniencia las leyes de acuerdo al problema. Esta mala práctica tuvo consecuencias académicas lamentables, como rechazar la masa relativista como una propiedad fundamental de los sistemas físicos, desvirtuando el concepto relativista de inercia, o limitar el Principio de Equivalencia entre masa y energía sosteniendo insólitamente que sólo es válido para cuerpos en reposo (y ciertas formas de energía), o redefinir la cantidad de movimiento para acomodar la teoría a sus torpezas. En definitiva, un conjunto de arbitrariedades innecesarias y perjudiciales, sobre todo para la enseñanza de la Relatividad, que costará años revertir. Veamos cómo debe ser tratado el tema de la masa propia de manera simple. Se define como masa propia de un sistema físico al valor de su masa medida en reposo en un sistema de referencia inercial. Mostraremos que la masa propia de sistemas no puntuales necesariamente debe variar durante las interacciones si aceptamos válido el Principio de conservación de la energía. Prestaremos mucha atención a cualquier magnitud relacionada con cambios de energía de un sistema físico, tal como la potencia, debido a que ello sucede en presencia de procesos causales, que denominamos interacciones. La magnitud que mide la variación temporal del contenido de energía de un sistema físico es la potencia. Se define como potencia instantánea a la relación: De acuerdo con el Principio de Equivalencia entre masa y energía, el contenido de energía de un sistema físico es directamente proporcional a su masa relativista, resultando: Veamos ahora como relacionar la variación de la masa relativista de un sistema físico con los efectos de una interacción cualquiera. Por simplicidad supondremos que no hay rotación. Para ello usaremos el teorema que vincula el trabajo de la fuerza total aplicada al centro de masa del sistema y la variación de la energía cinética que le provoca. Hemos asumido que la masa propia m0 de un sistema físico real puede variar durante una interacción (ver Möller “The Theory of Relativity”, pág. 106). Al respecto, veamos un caso particular muy ilustrativo. Sea un átomo excitado en reposo que vuelve a su estado fundamental con emisión de un fotón. La energía del átomo excitado antes de la emisión es: La masa del átomo es la masa propia pues inicialmente está en reposo. El superíndice indica su estado excitado. Con la emisión del fotón el átomo vuelve a su estado fundamental y adquiere movimiento uniforme en sentido contrario al del fotón emitido, que asumimos propagándose en sentido negativo de las x, cumpliéndose la conservación de la cantidad de movimiento del sistema. Dado que el problema es unidimensional no indicaremos componentes según los ejes del sistema de referencia. Además, por conservación de la energía, se cumple que la energía del átomo excitado antes de la emisión es igual a la suma de la energía del átomo en estado fundamental y en movimiento uniforme, más la energía del fotón emitido. La masa relativista del átomo en estado fundamental tiene movimiento uniforme y cumple con: Siendo m0 la masa propia del átomo en estado fundamental. Operando obtenemos: Queda demostrado que la masa propia de un átomo excitado es mayor que cuando está en su estado fundamental, y con ello que la masa propia no es una constante, aunque sea un invariante de Lorentz. Por supuesto, es inmediato obtener (ver balance energético anterior) que el exceso de masa del átomo excitado es exactamente la masa relativista del fotón posteriormente emitido. Calculemos ahora cuanto aumenta la masa propia de un átomo excitado en las condiciones establecidas, respecto de su masa propia en estado fundamental. Nótese que el aumento de masa propia del átomo excitado es exactamente la masa que corresponde a la energía cinética adquirida por el átomo, luego de la emisión, más la del fotón emitido. Nota Este tipo de análisis es aplicado de manera sistemática en el reconocimiento de productos de reacciones nucleares. En consecuencia, la potencia instantánea de un sistema (no puntual) será: El trabajo mecánico elemental sobre un cuerpo masivo es dW = F.ds , siendo F la fuerza total aplicada (en su centro de masa), que debe incluir la reacción de radiación en el caso en que el sistema irradie de manera anisótropa. La variación de energía por unidad de tiempo debida al trabajo mecánico es: La variación de energía por unidad de tiempo debida a procesos que no realizan trabajo mecánico sobre el centro de masa del sistema es: Veamos otros dos ejemplos que tratan con cambios de la masa propia del sistema. 1 – Enfriamiento o calentamiento de un cuerpo en reposo. Sea dQ/dt la potencia calórica (o frigorífica) instantánea del sistema, es decir la cantidad de calor (en Joules) intercambiada por unidad de tiempo. Por el Principio de Equivalencia entre masa y energía, la variación de la masa del sistema estará dada por: Dado que el sistema permanece en reposo en todo momento, no hay trabajo mecánico, y su masa es (por definición) la masa propia del sistema, que resulta función de la temperatura. La potencia instantánea del sistema será: Como demostraremos, luego de estos ejemplos, esta Potencia instantánea es absoluta, es decir que todo observador inercial medirá el mismo valor de potencia calórica o frigorífica instantánea. 2 – Energía radiante y pérdida de masa del Sol Para un observador terrestre y para intervalos temporales breves (un segundo en nuestro caso) el sol puede ser considerado en reposo en un sistema inercial. Se ha estimado en 3.65 x 1023 kW la energía radiante total del Sol emitida por unidad de tiempo. De acuerdo con el Principio de Equivalencia entre masa y energía, cada segundo el sol pierde 4.05 millones de toneladas, disminuyendo su masa propia. El cálculo simple es: La interpretación elaborada en este ejemplo (pérdida de masa propia) es utilizada en la teoría de evolución estelar dando resultados consistentes con la observación. Nota Estos dos ejemplos muestran que en los sistemas físicos reales, si las interacciones no modifican su cantidad de movimiento, la variación de su masa propia es indispensable para el cumplimiento del Principio de conservación de la energía. La potencia instantánea, en su expresión más general, está dada por: (1) Relatividad de la Potencia Usaremos las transformaciones relativistas generales de Lorentz para la energía y el tiempo, obtenidas para dos observadores inerciales (O,O’) con velocidad relativa V (constante). Siendo p=mv la cantidad de movimiento del sistema físico, medida por O. La potencia instantánea cumplirá con: Siendo a la aceleración del sistema físico, medida por O. La última expresión (2) debe ser analizada en detalle pues permite obtener conclusiones importantes sobre las características de las interacciones. 1 – Potencia Radiante Si consideramos el sistema físico en un sistema aislado (sin campo gravitatorio), formado sólo por radiación, es inmediato ver que la potencia radiante (instantánea) en cada punto del espacio es la misma para todo observador inercial (P‘=P), pues la aceleración (a) de la radiación es siempre nula. En presencia de un campo gravitatorio externo (con interacción campo-fotón), ello no se cumple pues hay aceleración transversal a la velocidad (c), salvo que la acción del campo tenga la misma dirección que la velocidad de la radiación. 2 – Interacciones con fuerza total aplicada nula No se modifica la cantidad de movimiento del centro de masa del sistema, tal como ocurre en compresiones o expansiones isótropas, procesos térmicos de intercambio de calor con simetría esférica, emisión electromagnética de dipolo radiante en reposo, etc. En todos estos casos la aceleración a es nula, resultando P’ = P. Es decir que durante la interacción la potencia instantánea del sistema es la misma para todo observador inercial. Nota Este resultado es consistente con el caso anterior pues, si un cuerpo en reposo irradia, la energía que pierde por unidad de tiempo debe ser igual a la potencia radiada, por el Principio de conservación de la energía. Ambas potencias instantáneas son absolutas, por lo cual este proceso existe para todo observador y no puede ser eliminado con la elección de un sistema de referencia particular, siendo esto último una característica de todos los fenómenos causales. Por supuesto, la energía ganada o perdida por el sistema en un dado lapso es relativa al sistema de referencia debido a que la evolución temporal es distinta en diferentes sistemas inerciales. Supongamos que el sistema físico está en reposo (v = 0) para el observador O y sufre un incremento dE sin modificar su estado de reposo. En ese caso para un observador O’ que se mueve con velocidad V, el incremento será: 3 – Observador inercial comóvil (instantáneo) con el sistema físico Primero destaquemos que si un sistema físico está acelerado, un observador inercial sólo estará comóvil con su centro de masa en un instante único, cuando V = v, es decir que para mantenerse comóvil con el objeto acelerado se requieren infinitos sistemas inerciales. La expresión (2), que relaciona la potencia instantánea de un mismo proceso medida por dos observadores inerciales distintos, puede ponerse en función de la Fuerza total aplicada. Para el observador inercial comóvil instantáneo se cumple V = v, quedando: Reemplazando P por su expresión general (1) obtenemos: Durante una interacción aparecen fuerzas aplicadas no nulas, por lo cual un sistema físico no puntual debe sufrir modificaciones geométricas y dinámicas que alteran su contenido de energía total y también su masa propia. La explicación de ello es que los procesos causales tienen un inicio y, dado que las fuerzas aplicadas no se transmiten a velocidad infinita a todos los puntos del sistema, aparecerán tensiones que alteran el sistema modificando su geometría y masa propia. Lo importante, desde un punto de vista teórico, no es el valor de la modificación de la masa propia, que puede ser muy pequeña o incluso despreciable, sino la existencia de ella. Dado que la masa propia de un sistema físico no puntual necesariamente debe modificarse durante una interacción, se concluye que todo observador comóvil podría medir potencia no nula de un sistema físico real, al menos en algún instante del proceso, y su valor dependerá de la variación temporal instantánea de la masa propia del sistema. Podría plantearse que este último resultado no es aceptable físicamente porque la masa propia podría agotarse completamente si se le saca energía durante un tiempo suficiente. Si el sistema está acelerado el planteo no es correcto ya que para un único observador la ley es válida sólo en un instante, por lo cual no es lícito sacar conclusiones que requieren “integrar” la ley en el tiempo. Nótese que en este caso un observador comóvil durante un tiempo finito corresponde a infinitos sistemas inerciales distintos, lo que equivale a decir que para un único sistema inercial hay trabajo mecánico pues el móvil posee aceleración y, en consecuencia, cambio de la masa propia. Si el sistema físico está en reposo o con movimiento uniforme, como podría suceder con un cuerpo calentándose o enfriándose, el planteo tiene respuesta inmediata. Su masa propia aumentará mientras sea posible entregarle energía y disminuirá si la pierde, aunque en este último caso la experiencia y el Teorema de Nernst nos muestran que esas interacciones en sistemas macroscópicos no pueden mantenerse indefinidamente, por lo cual la masa propia alcanzará un valor mínimo no nulo. Finalmente digamos que estas conclusiones (1, 2 y 3) invalidan la falsa creencia de que un electrón con aceleración propia constante (en movimiento hiperbólico) no irradia y que por ello el observador comóvil no detecta radiación (ver “La Paradoja de Born”). En consecuencia, si un sistema irradia ello sucederá para todo observador, sea o no inercial.