>> Sommaire de cette page |
>> Autres pages : gravitation (intro Galilée Newton) - la mécanique newtonienne - mécanique quantique
ondes de choc - théories - gravitation (conclusion)
Introduisons tout d'abord la théorie de la relativité restreinte. Elle a été proposée par Albert Einstein, brillant physicien allemand, en 1905. Jusque là, et conformément à ce qui semble «normal» pour nous, les lois de relativité de Galilée s'appliquent. Voyons tout d'abord brièvement ce que sont ces lois:
-
Loi d'inertie: tout corps qu'on accélère a tendance à retourner à un état dit «stable», soit en mouvement à une vitesse constante, sans accélération, ou bien arrêté (vitesse nulle si on veut).
-
Loi de la conservation de la quantité de mouvement: quand deux corps se frappent, l'énergie est transmise de l'un à l'autre, selon leur vitesse et leur masse. C'est ce qui régit les interactions comme les collisions entre deux boules de billard, par exemple.
-
Loi de conservation de l'énergie: il n'y a aucune perte d'énergie, mais bien transformation sous diverses formes. Par exemple, lorsqu'on lance un objet en l'air, on lui confère de l'énergie cinétique, mais celle-ci est peu à peu convertie en énergie potentielle. Au sommet de sa montée, l'objet redescent, et l'énergie potentielle est reconvertie en énergie cinétique.
Bien que ces lois semblent un peu abstraites, elles définissent ce que nous entendons comme la physique normale du monde qui nous entoure, et elles correspondent à notre perception intuitive de l'Univers. Cependant, deux expériences vont créer un dilemme important dans le monde scientifique, mettant en doutes ces principes fondamentaux: les expériences de Fiseau et Michelson-Morley sur l'éther.
>> haut de page
Depuis Galilée (1564-1642), notre perception du monde qui nous entoure était gouvernée par les lois de relativité dites «classiques». Mais une découverte a établi les fondements de ce qui a mené, plus tard, à la relativité restreinte d'Einstein.
On pense principalement à l'apparition de la théorie de l'électromagnétisme de Maxwell-Lorentz. Celle-ci a mené à une nouvelle compréhension des ondes électromagnétiques comme la lumière, ce qui est fondamental, puisque, comme on pourra voir plus loin, la lumière est à la base même de la relativité. Ainsi, cette nouvelle théorie a mené à plusieurs expériences, dont on retient celles de Fiseau et de Michelson-Morley (les deux équipes ayant découvert à peu près en même temps le phénomène). Leur expérience, assez spéciale, visait à démontrer la présence de l'éther, cette substance que les physiciens ont imaginé pour expliquer la propagation de la lumière. Ainsi, selon eux, comme le son est une onde qui se propage dans l'eau et l'air, la lumière est aussi une onde, mais dans quoi se propage-t-elle? Elle passe du Soleil à la Terre, donc par l'espace... donc ils ont supposé l'existence d'un éther, une sorte de substance invisible qui engloberait tout l'univers. Pourquoi pas. Bref, leurs expériences ont plutôt montré, à leur grand étonnement, que cet éther n'existait pas.
Enfin, ces deux expériences ont démontré un phénomène plutôt bizarre: la vitesse de la lumière semble toujours la même, peu importe comment on tente de la forcer à aller plus vite ou plus lentement. Plusieurs scientifiques, perplexes, ont alors tenté de trouver l'erreur dans l'expérience, mais en vain. Le problème est qu'une vitesse constante, absolue, gêne beaucoup; en fait, cette conclusion mène directement à une contradiction de la théorie de la relativité utilisée à l'époque.
Les physiciens se trouvèrent alors devant les deux éventualités suivantes :
Soit les lois de la physique ne sont pas les mêmes d’un référentiel galiléen à un autre, et il devient très gênant de constater que ce qui a été vérifié de nombreuses fois pour le domaine si vaste de la mécanique n’est plus vrai pour les phénomènes électromagnétiques, et donc la physique en général. En d'autres termes, cela revient à dire que les ondes mécaniques (e.g. le son) se comportent de façon radicalement différentes des ondes électromagnétiques (e.g. la lumière).
-
Soit la mesure du temps dépend du référentiel dans le quel elle est faite. Mais c’est une hypothèse extrêmement audacieuse, car elle attaque « nos convictions profondes ». En effet, cela revient à dire que parce qu’une personne est en mouvement et seulement pour cela, elle rajeunirait (ou vieillirait) par rapport à une personne à l’arrêt.
La deuxième hypothèse paraît bizarre en effet. Pourtant, c'est bien la bonne. On peut voir maintenant l'immense gouffre qui séparait les scientifiques du début du siècle d'Einstein, dont les idées ne seront vraiment acceptées qu'après la première guerre mondiale, lorsque des physiciens britanniques profiteront d'une éclipse de Soleil pour vérifier un phénomène prédit avec précision par Einstein.
>> haut de page
Dans « Annalen der Physik t XVII, 1905 », Einstein écrit : « pour tous les systèmes de coordonnées pour lesquels les équations mécaniques restent valables, les lois électromagnétiques et optiques gardent également leur valeur (…). Nous voulons élever cette conjoncture [dont le contenu sera appelé dans ce qui suit « principe de relativité »] au rang d’une hypothèse et introduire en outre la supposition, qui n’est qu’en apparence incompatible avec ce principe, que la lumière se propage toujours dans le vide à une certaine vitesse C indépendante de l’état de mouvement de la source lumineuse ».
Ainsi, deux postulats sont énoncés :
-
1er postulat (dit principe de relativité) : toutes les lois de la physique sont les mêmes dans les référentiels galiléens. En effet, nous savions que les lois de la mécanique gardaient leur valeur dans les systèmes de coordonnées dits galiléens et Einstein généralise cette hypothèse en l’appliquant à toutes les lois de la physique (mécaniques, électrodymaniques et optiques);
2ème postulat : la vitesse de la lumière dans le vide est la même quel que soit le référentiel dans lequel on l’observe. Ceci est très nouveau, très surprenant et s’oppose formellement à l’hypothèse de temps absolu comme nous le verrons plus tard.
Les deux postulats de la relativité restreinte sont la base de la théorie de la relativité restreinte et à partir de ceux-ci nous allons dériver toutes les équations nécessaires à la compréhension des phénomènes physiques observables. Avant de faire cette dérivation, il est bon de rappeler que cette théorie et ces postulats ne sont valables que pour des référentiels galiléens, c’est-à-dire des référentiels en mouvement de translation rectiligne uniforme les uns par rapport aux autres. C’est d’ailleurs pourquoi on l’appelle théorie de la relativité restreinte. La théorie de la relativité générale, développée aussi par Einstein, se rapporte à des référentiels en accélération les uns par rapport aux autres et nous ne l’étudierons pas ici.
>> haut de page
Une des conséquences les plus surprenantes de la transformation de Lorentz, et donc de la relativité restreinte, est ce qu’on a appelé la dilatation du temps.
Une horloge d’un référentiel R2 est, par définition, un système périodique fixe dans R2 donnant des signaux réguliers séparés par des laps de temps égaux D t2 = t2b – t2a.
Le laps de temps D t2, période de l’horloge dans le référentiel dans lequel elle est au repos, est appelé période propre de l’horloge.
Déterminons le laps de temps D t mesuré dans R1 séparant deux signaux consécutifs émis par l’horloge se trouvant en mouvement de translation uniforme par rapport à R1. La transformation de Lorentz permet d’écrire (on utilise la transformation inverse [9], car c’est D t1 que nous calculons et D t2 que nous connaissons):
Or, on remarque que dans R2 l’intervalle de temps D t2 = t2b – t2a est mesuré sur une seule horloge, donc en un seul lieu et D x2 = x2b – x2a = 0. On obtient la relation bien connue:
[10]
Cela revient à dire que la période R1 paraît plus longue que la période propre : on dit qu’il y a dilatation du temps. Nous remarquons tout de suite que D t1 n’est pas un temps propre puisqu’il mesure un intervalle de temps d’une horloge en mouvement et la mesure ne se fait donc pas en un seul lieu comme la mesure d’un temps propre. En effet, si nous la calculons, par la transformation de Lorentz, les coordonnées des événements x1a, t1a et x1b, t1b dont l’intervalle temps est D t1 de la relation [10], on obtient :
[11]
et, même si x2b = x2a, x1a ¹ x1b puisque t2a ¹ttb.
Il faut bien voir aussi que, conformément au principe de la relativité (invariance des lois de la physique), cette dilatation du temps est réciproque. Si un observateur de R2 examine une horloge de R1, il arrivera à la conclusion que la période de R 1 est dilatée.
En effet, si une horloge de R1 a une période propre D t0, deux signaux consécutifs émis par cette horloge sont perçus par R2 comme ayant un intervalle de temps D t2 donné par (transformation de Lorentz) :
Puisque x1a = x1b dans R1 :
On obtient le même résultat que celui donné par l’équation [10]. Il n’y a pas de contradiction, car dans les deux cas D t2 et D t0 sont des temps propres.
>> haut de page
Une autre conséquence de la transformation de Lorentz est la contraction des longueurs. La longueur propre d’une règle est, par définition, la longueur de cette règle mesurée dans le référentiel galiléen où cette règle est au repos.
Comment mesurer dans un référentiel R1 la longueur d’une règle en mouvement ? En réfléchissant à l’exemple d’un train en mouvement, on voit qu’il faut déterminer dans R1 les positions des extrémités du train au même instant t1 de R1. Il ne nous viendrait pas à l’idée de repérer à un instant la position de la locomotive et, plus tard, la position du wagon de queue.
Ainsi, considérons deux référentiels R1 et R2 dans les conditions de la transformation de Lorentz. Une règle de longueur propre L2 est fixe dans R2 et disposée suivant O2x2 : D x2 = L2. Pour connaître la longueur L 1 = D x1 de cette règle dans R1, il faut déterminer la différence des abscisses de ses extrémités au même instant t1 de R1 à l’aide de la transformation de Lorentz.
donc :
On obtient:
[12]
Cela exprime la contraction des longueurs par le fait qu’une longueur mesurée en mouvement sera plus courte qu’une longueur propre.
L1 n’est pas une longueur propre et elle est effectuée en repérant simultanément au même instant t1 de R1 les extrémités de la règle à mesurer. On peut remarquer par la transformation de Lorentz que le mesure de L2 (la longueur propre) n’est pas une mesure simultanée. En effet :
Même si t1 est le même dans R1, dans R2 les temps sont différents (t2a ¹ t2b) parce que les positions dans R1 sont différentes et x1a ¹ x1b.
On remarque aussi que, comme pour la dilatation du temps, il y a réciprocité du phénomène, conformément au principe de relativité. Autrement dit, une règle de R1 de longueur propre L1 dirigée suivant O1x 1 apparaîtra contractée dans R2 où on lui attribuera la longueur L2 :
Enfin, d’après les relations y2 = y1 et z 2 = z1 de la transformation de Lorentz, il résulte immédiatement que la longueur d’une règle placée perpendiculairement à la direction du mouvement est la même dans les deux référentiels.
>> haut de page
Dans un référentiel galiléen R1, un point est caractérisé par les coordonnées d’espace (x1, y1, z1) et la transformation de Galilée fait correspondre un point (x1, y1, z1) d’un référentiel R1 au point (x2, y2, z2) du référentiel R2 en translation uniforme par rapport à R1.
En relativité restreinte, nous cherchons à faire correspondre par une transformation mathématique un quadruplet (x1, y1, z1, t1) caractérisant un événement observé dans le référentiel R1 au quadruplet (x2, y2, z2, t2) caractérisant ce même événement observé dans le référentiel R2 en mouvement de translation uniforme par rapport à R1.
Écrivons cette transformation, supposée à première vue linéaire, de la façon suivante [1] :
x2 = a10 + a11x1 + a12y1 + a13z1 + a14t1
y2 = a20 + a21x1 + a22y1 + a23z1 + a24t1
z2 = a30 + a31x1 + a32y1 + a33z1 + a34t1
t2 = a40 + a41x1 + a42y1 + a43z1 + a44t1
Remarquons que les coefficients ai0 correspondent à des translations des coordonnées. En utilisant l’homogénéité de l’espace, on peut toujours faire en sorte, par un choix judicieux des origines, que ces coefficients soient nuls; ceci revient à faire coïncider les événements origines (0,0,0,0) dans les deux référentiels. On obtient donc :
x2 = a11x1 + a12y1 + a13z1 + a14t1
y2 = a21x1 + a22y1 + a23z1 + a24t1
z2 = a31x1 + a32y1 + a33z1 + a34t1
t2 = a41x1 + a42y1 + a43z1 + a44t1
Par ailleurs, on peut, dans chaque référentiel, faire en sorte que les axes O1x1 et O2x2 coïncident avec la direction de translation; nous traduirons cette propriété en écrivant que si y1 = 0 et z1 = 0, alors y2 = 0 et z2 = 0. Alors,
y2 = 0 = a21x1 + a24t1
z2 = 0 = a31x1 + a34t1.
d’où
a21 = 0
a24 = 0
a31 = 0
a34 = 0 .
On peut encore faire pivoter les axes autour de O1x1 et O2x2 de façon que les directions O1y1 et O2y2 d’une part, et O1z1 et O2z2 d’autre part, soient parallèles deux à deux; à z1 = 0 doit correspondre z2 = 0 , et à y1 = 0 doit correspondre y2 = 0. Alors,
y2 = 0 = a22·0 + a23z1
z2 = 0 = a31y1 + a33·0.
d’où
a32 = 0
a23 = 0 .
Le système d’équations initial peut donc se réduire à :
x2 = a11x1 + a12y1 + a13z1 + a14t1
y2 = a22y1
z2 = a33z1
t2 = a41x1 + a42y1 + a43z1 + a44t1 .
Changeons enfin y1 en –y1, z1 en –z1, y2 en –y2 et z2 en –z2, les quatre autres coordonnées restant inchangées. Une telle transformation revient à faire tourner les axes de 180° autour de la direction de translation des référentiels qui coïncide avec la direction commune de O1x1 et O2x2. L’isotropie de l’espace veut alors que les formules de transformation restent inchangées; on en déduit alors que
a12 = 0
a13 = 0
a42 = 0
a43 = 0 .
En résumé, les propriétés générales d’homogénéité et d’isotropie de l’espace permettent de ramener les formules de transformation entre deux référentiels galiléens R1 et R2 en translation relative dans la direction commune de O1x1 et O2x2 au système [2]
x2 = a11x1 + a14t1
y2 = a22y1
z2 = a33z1
t2 = a41x1 + a44t1 .
On admet enfin que les deux observateurs O1 et O2 règlent leur horloge de telle sorte qu’à l’instant t1 = t2 = 0 les deux observateurs sont confondus. Un signal lumineux est émis à cet instant par O1.
D’après le système (2), on voit que x2 est proportionnel à x1 et à t1. Or, la coordonnée de l’observateur O2 (x2 = 0 dans R2) est égale à tout moment à une certaine constante fois (x1-vet1) où ve est la vitesse relative entre R1 et R2. En effet, pour trouver la position d’un événement dans R2 , il faut prendre la différence entre la coordonnée de cet événement dans R1 et la distance vet1 qui sépare les deux référentiels. Le système [2] devient donc [3]:
x2 = a11(x1 – vet1)
y2 = a22y1
z2 = a33z1
t2 = a41x1 + a44t1 .
Au moment où les deux observateurs sont confondus, un signal lumineux est émis de leur position commune. Pour O1, l’équation de la sphère produite par la lumière qui se propage dans toutes les directions est
x12 + y12 + z12 = c2t12
car ct1 est la distance parcourue par la lumière (et, par conséquent, le rayon de la sphère).
On réarrange l’équation [4]:
x12 + y12 + z12 - c2t12 = 0
L’observateur O2, même s’il s’éloigne de O1, voit lui aussi la lumière se propager en une sphère dont il est le centre. En effet, d’après le second postulat de la relativité, la lumière se propage à une vitesse constante. O1 et O2 mesurent donc une même vitesse pour la lumière. Pour O2, l’équation de la sphère est [5]
x22 + y22 + z22 - c2t22 = 0
Il s’agit du même signal lumineux, émis à t1 = t2 = 0. On compare [4] et [5] pour obtenir [6]:
x12 + y12 + z12 - c2t12 = x22 + y22 + z22 - c2t22
On obtient ainsi une relation entre les coordonnées de R1 et celles de R2. On substitue [3] dans [6] soit [7] :
x12 + y12 + z12 - c2t12 = a112(x1 – vet1)2 + a222y12 + a332z12 - c2(a41x1 + a44t1)2
On développe [7] et on obtient des termes en :
x12 : 1 = a112 – a412c2 [7.1]
y12 : 1 = ±a22 [7.2]
z12 : 1 = ±a33 [7.3]
t12 : -c2 = a112ve2 – a442c2 [7.4]
x1t1 : 0 = -2a112ve – 2a41a44c2 [7.5]
On doit prendre 1 comme valeur des constantes a22 et a33 pour respecter l’orientation des axes que nous avons choisie (à un y1 ou un z1 positifs correspondent un y2 ou un z2 positifs). Ainsi,
1 = a22 [7.2]
1 = a33 [7.3]
D’après [7.1] :
[7a]
Élevons [7.5] au carré :
a114ve2 = a412a442c4 [7b]
Substituons [7a] dans [7b] :
a114ve2 = (a112 – 1)a442c2 [7c]
Réécrivons l’équation [7.4] :
a442c2 = a112ve2 + c2 [7d]
Substituons [7d] dans [7c] :
a114ve2 = (a112 – 1)(a112ve2 + c2) [7e]
Développons [7e] :
a114ve2 = a114ve2 – c2 + a112c2 – a112ve2
a112(c2 – ve2) = c2
[7f]
En portant [7f] dans [3], on se rend compte que seule la solution positive est correcte, car on doit retrouver la transformation de Galilée pour ve/c ® 0. Ainsi,
[7g]
De même, en substituant [7g] dans [7d] et en développant, on trouve :
[7h]
où on a pris la valeur positive pour la même raison que précédemment.
De la même manière, on obtient, en substituant [7g] et [7h] dans [7.5] :
[7i]
On vient ainsi de résoudre le système d’équation [3]. Ce système s’appelle transformation de Lorentz :
[8]
y2 = y1
z2 = z1
Ainsi, en relativité restreinte, la transformation de Lorentz transforme non seulement les coordonnées d’espace mais aussi la coordonnée de temps. C’est ce point qui est le plus remarquable par rapport à la transformation de Galilée qui était jusqu’alors universellement admise.
La première conséquence immédiate de la transformation de Lorentz est le fait que ve ne saurait être supérieure à c, l’expression sous le radical devenant négative. Il existe donc une vitesse limite pour les mouvements des corps matériels : c’est la vitesse c de propagation des phénomènes électromagnétiques dans le vide.
D’autre part, la transformation (8) exprime les coordonnées d’un événement vu par le référentiel R2 en fonction des coordonnées du même événement vu par le référentiel R1. La transformation inverse, qui consiste à donner les coordonnées d’un événement vu par R1 en fonction de celles du même événement vu par R2 s’obtient soit par manipulation algébrique, soit encore d’une manière plus simple en considérant que R2 est fixe et que R1 se déplace à la vitesse –ve par rapport à R2. La situation étant alors parfaitement identique à celle qui a permis d’obtenir la transformation de Lorentz (8), nous pouvons l’utiliser en substituant –ve à ve. On obtient ainsi la transformation de Lorentz inverse :
[9]
y1 = y2
z1 = z2
>> haut de page
À partir de la transformation de Lorentz (relation [8]), on peut obtenir les expressions donnant la transformation des vitesses.
En effet :
[13]
et, finalement, la transformation du temps donne :
[14]
On remarque que dy2/dt2 et dz2/dt2 sont des vitesses perpendiculaires à la vitesse v de translation des référentiels et qu’elles ont des expressions semblables. On les appellera v^ . dx2/dt2 est une vitesse parallèle à v et sera appelée v||.
Réarrangeons [14] :
[15]
En portant [15] dans [13], on obtient :
[16]
et
[17]
Ces relations s’inversent immédiatement en
[18]
et
[19]
>> haut de page |