Lorsque la mécanique quantique prend sa forme moderne dans les années 1920, elle permet d’expliquer avec un succès remarquable la structure de l’atome, les spectres d’émission et d’absorption, ainsi que de nombreux phénomènes microscopiques jusque-là incompris. Cette théorie marque une rupture profonde avec la physique classique et fournit un cadre d’une efficacité exceptionnelle pour décrire le monde à l’échelle atomique.
Cependant, cette première formulation repose implicitement sur un cadre non relativiste. Le temps y joue un rôle privilégié, distinct des dimensions d’espace, et l’équation fondamentale de Schrödinger n’est pas invariante sous les transformations de Lorentz. Cette limitation reste sans conséquence dans de nombreux cas, mais elle devient problématique dès que l’on s’intéresse à des particules se déplaçant à des vitesses proches de celle de la lumière.
Dans ce régime, les principes de la relativité restreinte, formulée en 1905 par Albert Einstein à partir des travaux de Lorentz et Poincaré, ne peuvent plus être ignorés. Ils imposent une contrainte forte : les lois fondamentales de la physique doivent être compatibles avec la structure de l’espace-temps et invariantes sous les transformations du groupe de Lorentz. Toute théorie prétendant décrire les particules élémentaires doit donc intégrer cette exigence dès sa formulation.
La question devient alors inévitable : comment concilier la mécanique quantique, qui décrit la nature probabiliste du monde microscopique, avec la relativité restreinte, qui en fixe la structure spatio-temporelle ? Cette tension conceptuelle constitue l’un des grands défis de la physique du début du 20ème siècle.
C’est dans ce contexte que Paul Dirac entreprend, en 1928, de formuler une équation de mouvement pour une particule quantique relativiste. Son objectif est ambitieux : construire une théorie compatible à la fois avec les principes de la mécanique quantique et avec ceux de la relativité restreinte, tout en conservant une interprétation probabiliste cohérente. Cette démarche le conduit à proposer une équation linéaire du premier ordre en dérivées temporelles et spatiales, aujourd’hui connue sous le nom d’équation de Dirac.
Les conséquences de cette construction dépassent largement le cadre initial du problème. L’équation de Dirac ne se contente pas de fournir une version relativiste de l’équation de Schrödinger : elle révèle l’existence de propriétés physiques nouvelles, jusque-là inconnues ou introduites de manière ad hoc. Deux résultats majeurs en émergent naturellement : l’apparition du spin comme degré de liberté intrinsèque des particules, et la prédiction de l’antimatière, issue de l’existence de solutions d’énergie négative.
Ces résultats constituent l’un des exemples les plus frappants de la puissance prédictive de la physique théorique : en cherchant à assurer la cohérence mathématique et conceptuelle d’une théorie, Dirac met en évidence des entités physiques qui seront confirmées expérimentalement quelques années plus tard.
Cet article propose une synthèse de cette étape fondamentale de la physique moderne, que l’on désigne sous le nom de mécanique quantique relativiste. Nous examinerons d’abord le cadre relativiste dans lequel s’inscrit cette démarche, puis les raisons pour lesquelles il devient indispensable en physique des particules. Nous analyserons ensuite les premières tentatives de construction d’une théorie quantique relativiste, avant de présenter la genèse et la structure de l’équation de Dirac. Enfin, nous en étudierons deux conséquences majeures : l’existence de l’antimatière et la nature du spin.
Sans entrer dans les développements mathématiques les plus techniques, l’objectif est de montrer comment l’unification de la mécanique quantique et de la relativité restreinte conduit, de manière presque inévitable, à une vision profondément renouvelée de la matière et de ses constituants élémentaires.
La relativité restreinte expliquée aux physiciens classiques
À la fin du 19ème siècle, la physique semblait reposer sur deux édifices théoriques d’une remarquable solidité. D’un côté, la mécanique de Newton décrivait avec une grande précision le mouvement des corps, depuis la chute des objets terrestres jusqu’aux trajectoires des planètes. De l’autre, l’électromagnétisme de Maxwell unifiait l’électricité, le magnétisme et la lumière dans un même cadre théorique. Ces deux constructions avaient chacune démontré leur puissance explicative, et rien ne semblait devoir remettre en cause leurs fondements.
Pourtant, une difficulté profonde demeurait. La mécanique classique repose sur l’idée qu’il existe un temps universel, identique pour tous les observateurs, ainsi qu’un espace absolu dans lequel les positions et les vitesses peuvent être définies sans ambiguïté. Dans ce cadre, si un observateur se déplace à vitesse constante par rapport à un autre, les lois de la mécanique conservent la même forme : c’est le principe de relativité galiléenne. Les vitesses s’ajoutent simplement. Si un mobile se déplace à la vitesse \(u\ \)dans un train lui-même en mouvement à la vitesse \(v\), alors sa vitesse par rapport au sol vaut \(u + v\).
Cette règle, parfaitement adaptée à l’expérience ordinaire, entre cependant en tension avec les équations de Maxwell. Celles-ci prédisent que les ondes électromagnétiques se propagent dans le vide à une vitesse déterminée, notée \(c\), qui dépend uniquement des constantes fondamentales de l’électromagnétisme. La lumière apparaît ainsi comme une onde se déplaçant à vitesse fixe. Mais fixe par rapport à quoi ? Dans le cadre classique, toute onde connue se propage dans un milieu : le son dans l’air, les vagues à la surface de l’eau, les vibrations dans une corde. Il semblait donc naturel de supposer que la lumière se propageait elle aussi dans un milieu invisible, appelé éther luminifère, qui servirait de référentiel absolu.
Cette hypothèse soulevait immédiatement une conséquence expérimentale. Puisque la Terre se déplace dans l’espace, sa vitesse par rapport à l’éther devait varier au cours de son mouvement orbital. On devait donc pouvoir mesurer un « vent d’éther », c’est-à-dire une variation apparente de la vitesse de la lumière selon la direction de propagation. Or les expériences les plus célèbres menées dans cette perspective, notamment celle de Michelson et Morley en 1887, ne mirent en évidence aucun effet de ce type. La vitesse de la lumière semblait rester la même, indépendamment du mouvement de l’observateur terrestre.
Ce résultat était profondément déstabilisant pour la physique classique. Il signifiait que l’addition ordinaire des vitesses ne semblait plus s’appliquer à la lumière. Si l’on raisonnait dans le cadre galiléen, un observateur se déplaçant vers une source lumineuse devrait mesurer une vitesse différente de celle mesurée par un observateur au repos. Or l’expérience suggérait exactement le contraire : la vitesse de la lumière dans le vide paraissait universelle.
Face à cette difficulté, plusieurs physiciens, dont Lorentz et Poincaré, élaborèrent des transformations mathématiques permettant de préserver la forme des équations de Maxwell. Ces travaux préparèrent le terrain conceptuel, mais c’est Einstein qui, en 1905, formula la rupture décisive. Il proposa de renoncer non pas à l’électromagnétisme, mais aux notions classiques d’espace et de temps absolus. La relativité restreinte repose ainsi sur deux postulats simples dans leur énoncé, mais révolutionnaires dans leurs conséquences : d’une part, les lois de la physique ont la même forme dans tous les référentiels inertiels et d’autre part, la vitesse de la lumière dans le vide a la même valeur pour tous les observateurs inertiels, indépendamment du mouvement de la source ou de l’observateur.
Ces deux principes obligent à repenser en profondeur la manière dont on compare les mesures effectuées par différents observateurs. Si chacun mesure la même vitesse de la lumière, alors ce ne sont plus seulement les positions qui doivent se transformer d’un référentiel à l’autre, mais aussi les durées et les longueurs. Le temps cesse d’être universel. Deux événements jugés simultanés par un observateur ne le sont plus nécessairement pour un autre en mouvement relatif. La simultanéité devient relative.
Cette relativité de la simultanéité constitue sans doute l’un des points les plus déroutants pour l’intuition classique. Dans la physique newtonienne, il paraît naturel de penser qu’il existe un présent commun à tout l’Univers. La relativité restreinte montre au contraire que cette idée n’a pas de sens absolu. La mesure d’un intervalle de temps dépend de l’état de mouvement de l’observateur, tout comme la mesure d’une distance. Il en résulte deux effets célèbres : la dilatation des durées, selon laquelle une horloge en mouvement semble battre plus lentement vue depuis un référentiel au repos, et la contraction des longueurs, selon laquelle un objet en mouvement apparaît raccourci dans la direction de son déplacement.
Ces effets ne sont pas des illusions optiques ni des artefacts de mesure : ils expriment la structure même de l’espace-temps. La relativité restreinte unifie en effet l’espace et le temps au sein d’un même cadre géométrique à quatre dimensions, l’espace-temps de Minkowski. Dans ce cadre, ce qui demeure invariant n’est plus séparément une distance spatiale ou une durée temporelle, mais un intervalle d’espace-temps. Autrement dit, différents observateurs peuvent ne pas s’accorder sur la distance parcourue ni sur la durée écoulée, tout en s’accordant sur une grandeur plus profonde qui combine les deux.
Cette nouvelle géométrie transforme aussi la dynamique. En mécanique classique, la quantité de mouvement vaut \(p = mv\), et l’énergie cinétique est proportionnelle à \(v^{2}\). Ces expressions ne peuvent plus être exactes lorsque la vitesse approche celle de la lumière. La relativité restreinte impose une nouvelle relation entre l’énergie, l’impulsion et la masse :
\[E^{2} = p^{2}c^{2} + m^{2}c^{4}.\]
Cette formule remplace les expressions classiques et devient indispensable dès que les particules atteignent des énergies élevées. Elle contient comme cas particulier la célèbre relation
\[E = mc^{2}\]
pour une particule au repos. La masse apparaît alors non plus comme une simple mesure d’inertie, mais comme une forme d’énergie.
Cette révision de la dynamique entraîne une conséquence majeure : aucune particule massive ne peut être accélérée jusqu’à la vitesse de la lumière. Plus son énergie augmente, plus sa vitesse se rapproche de \(c\), sans jamais l’atteindre. La vitesse de la lumière joue donc le rôle d’une vitesse limite universelle, qui structure l’ensemble de la physique relativiste.
Pour un physicien classique, la relativité restreinte peut ainsi être comprise comme une généralisation profonde du principe de relativité. Newton avait montré que les lois de la mécanique sont les mêmes dans tous les référentiels en mouvement rectiligne uniforme. Einstein étend cette exigence à l’ensemble des lois de la physique, y compris l’électromagnétisme, mais au prix d’une redéfinition radicale de l’espace, du temps et des grandeurs dynamiques. Ce ne sont pas les lois qui s’adaptent à notre intuition ordinaire ; c’est notre intuition qui doit être révisée pour se conformer à la structure du monde physique.
La portée de cette révolution conceptuelle dépasse largement le seul cadre de l’électromagnétisme. Dès lors que l’on s’intéresse à des particules se déplaçant à des vitesses proches de celle de la lumière, la relativité restreinte cesse d’être une correction marginale. Elle devient le langage nécessaire de toute description physique cohérente. Les notions d’énergie, d’impulsion, de causalité et même de particule doivent alors être reformulées dans ce cadre nouveau.
C’est précisément ce point qui devient crucial en physique microscopique. Tant que l’on étudie des systèmes atomiques lents ou faiblement énergétiques, la mécanique quantique non relativiste fournit une approximation remarquable. Mais dès que l’on aborde le domaine des particules élémentaires, où les vitesses et les énergies sont très élevées, cette approximation ne suffit plus. Il faut alors chercher une théorie capable d’unir la mécanique quantique et la relativité restreinte dans un même formalisme.
Pourquoi la relativité est-elle indispensable en physique des particules ?
La relativité restreinte n’est pas seulement une correction apportée à la mécanique classique dans des situations extrêmes. En physique des particules, elle constitue un cadre incontournable. Dès que l’on s’intéresse aux constituants élémentaires de la matière, il devient impossible de séparer les phénomènes quantiques des exigences relativistes. Cette nécessité tient autant à la nature des particules étudiées qu’aux conditions expérimentales dans lesquelles elles sont observées.
La mécanique quantique non relativiste, telle qu’elle s’est développée dans les années 1920 à partir de l’équation de Schrödinger, s’est révélée extrêmement efficace pour décrire les atomes, les niveaux d’énergie électroniques, les liaisons chimiques ou encore les propriétés générales de nombreux systèmes microscopiques. Mais cette théorie a été construite dans un cadre hérité de la physique galiléenne : le temps y est traité comme un paramètre absolu, extérieur au système, tandis que l’espace constitue le support de la fonction d’onde. Cette dissymétrie entre espace et temps est acceptable tant que les vitesses en jeu restent faibles devant celle de la lumière. Elle devient problématique dès que l’on aborde le domaine des particules élémentaires.
En effet, les particules de la physique microscopique ne sont pas des objets lents. Les électrons, les muons, les neutrinos ou les particules produites dans les rayons cosmiques et les accélérateurs atteignent couramment des vitesses très proches de celle de la lumière. Dans ce régime, les relations classiques entre énergie, impulsion et vitesse ne sont plus valables. La dynamique des particules n’est correctement décrite que par la relation relativiste entre énergie, masse et quantité de mouvement. Toute théorie qui ignorerait cette structure serait incapable de rendre compte fidèlement des phénomènes observés.
Mais la raison est plus profonde encore. En physique des particules, il ne s’agit pas seulement de corriger la trajectoire ou l’énergie d’objets rapides. Il faut décrire des entités dont l’existence, les transformations et les interactions obéissent simultanément aux principes quantiques et aux contraintes relativistes. Or la mécanique quantique non relativiste repose implicitement sur l’idée que le nombre de particules est fixé. Elle décrit l’évolution d’un système donné, mais n’intègre pas naturellement les processus de création ou d’annihilation de particules.
Cette limitation devient décisive à haute énergie. Lorsqu’une particule possède une énergie suffisante, cette énergie peut se convertir en masse selon la relation d’Einstein. Il devient alors possible de créer de nouvelles particules au cours d’une collision. Inversement, une particule et son antiparticule peuvent s’annihiler pour produire du rayonnement. Ces processus sont omniprésents en physique des particules. Ils constituent l’un des aspects fondamentaux de la réalité microscopique relativiste.
Autrement dit, dès que l’énergie mise en jeu devient comparable ou supérieure à l’énergie de masse des particules, la notion même de particule individuelle stable cesse d’être suffisante. Le monde microscopique révèle alors une plasticité que la mécanique quantique non relativiste ne peut pas prendre en charge : les particules peuvent apparaître, disparaître, se transformer les unes en les autres, tout en respectant des lois de conservation précises. Une théorie acceptable doit donc non seulement être quantique et relativiste, mais aussi permettre de décrire ces changements de contenu matériel.
Une autre raison essentielle tient à la causalité. La relativité restreinte impose qu’aucune influence physique ne se propage plus vite que la lumière. Cette contrainte n’est pas un détail technique : elle détermine la structure même des interactions fondamentales. Or une théorie quantique compatible avec la relativité doit respecter cette causalité à tous les niveaux. Elle doit garantir que deux événements suffisamment éloignés dans l’espace ne puissent pas s’influencer instantanément de manière observable. La compatibilité entre indétermination quantique et causalité relativiste devient alors une exigence conceptuelle majeure.
Cette exigence est d’autant plus importante que les particules élémentaires ne sont pas simplement des corpuscules ponctuels au sens classique. Elles sont associées à des amplitudes de probabilité, à des champs et à des interactions locales. Leur description demande un cadre théorique dans lequel la relativité ne soit pas ajoutée après coup, mais intégrée dès le départ dans la définition même des objets physiques. C’est pourquoi la simple mécanique quantique relativiste d’une particule isolée, bien qu’elle constitue une étape fondamentale, n’est encore qu’un seuil vers un cadre plus général : la théorie quantique des champs.
Historiquement, cette nécessité apparaît dès que l’on cherche à appliquer la quantification aux relations relativistes. La première difficulté est que l’équation de Schrödinger, si féconde dans le cadre atomique, ne respecte pas l’invariance de Lorentz. Elle privilégie le temps par rapport à l’espace et ne peut donc constituer une équation fondamentale pour des particules relativistes. Une première tentative de remédier à cette limite conduit à l’équation de Klein-Gordon, obtenue en quantifiant directement la relation relativiste entre énergie et impulsion. Cette équation est bien covariante, mais elle soulève à son tour d’importantes difficultés d’interprétation, notamment concernant la densité de probabilité et la description des particules de spin demi-entier.
Le problème n’est donc pas seulement de rendre une équation “plus précise” ou “plus générale”. Il s’agit de trouver un formalisme dans lequel les exigences suivantes soient satisfaites simultanément : respecter la structure de l’espace-temps relativiste, conserver une interprétation quantique cohérente, rendre compte des propriétés intrinsèques des particules, et préparer la description des processus de création et d’annihilation. La mécanique quantique relativiste naît précisément de cette tension entre plusieurs exigences de cohérence.
Dans ce contexte, la relativité restreinte apparaît non comme une couche supplémentaire ajoutée à la physique des particules, mais comme l’un de ses fondements. Elle fixe les règles générales auxquelles toute description microscopique doit obéir lorsque les énergies deviennent élevées. Elle impose une nouvelle conception de l’énergie, de l’impulsion, de la causalité et même du vide physique. Sans elle, il serait impossible de comprendre pourquoi certaines particules peuvent être créées dans les collisions, pourquoi l’antimatière existe, ou encore pourquoi les interactions fondamentales doivent être formulées dans un langage de champs plutôt que dans celui de simples trajectoires.
La physique des particules occupe ainsi un domaine où la mécanique quantique et la relativité ne peuvent plus être pensées séparément. L’une décrit la nature probabiliste et discrète du monde microscopique, l’autre en fixe la structure spatio-temporelle et les contraintes causales. Leur rencontre n’est pas contingente : elle est imposée par la réalité expérimentale elle-même. C’est cette rencontre qui conduit, dans un premier temps, à la mécanique quantique relativiste, puis, dans un second temps, à la théorie quantique des champs, cadre dans lequel sera finalement formulé le modèle standard.
Le passage à une théorie relativiste de la physique quantique ne doit donc pas être compris comme une sophistication réservée à quelques cas particuliers. Il correspond à un changement de niveau dans la compréhension de la matière. Dès que l’on explore les particules élémentaires, la relativité cesse d’être optionnelle : elle devient la condition de possibilité d’une description fidèle du réel.
La nécessité de prendre en compte la relativité restreinte
Les développements précédents ont montré que la relativité restreinte constitue un cadre incontournable dès que l’on aborde la physique des particules. La question qui se pose désormais est plus précise : comment intégrer cette exigence relativiste au sein même de la mécanique quantique ?
Dans sa formulation initiale, la mécanique quantique s’inscrit dans un cadre conceptuel hérité de la physique non relativiste. L’équation de Schrödinger, qui en constitue le fondement, décrit l’évolution temporelle d’une fonction d’onde définie sur l’espace, le temps y intervenant comme un paramètre extérieur. Cette structure, profondément asymétrique entre espace et temps, est en tension directe avec la conception relativiste, où ces deux grandeurs sont unifiées au sein de l’espace-temps.
Tant que l’on se limite à des systèmes de basse énergie, cette incompatibilité reste sans conséquence pratique majeure. La mécanique quantique non relativiste fournit alors une description d’une remarquable précision. Mais dès lors que l’on cherche à formuler une théorie fondamentale des particules, cette limitation devient structurelle : une telle théorie doit nécessairement respecter l’invariance relativiste et traiter l’espace et le temps sur un pied d’égalité.
Autrement dit, il ne s’agit plus simplement d’introduire des corrections relativistes dans un cadre existant, mais de repenser la forme même des équations fondamentales. La mécanique quantique doit être reformulée de manière à être compatible avec la structure de l’espace-temps relativiste.
Une première piste naturelle consiste à repartir de la relation fondamentale imposée par la relativité restreinte entre l’énergie, l’impulsion et la masse. Cette relation, qui remplace les expressions classiques de la dynamique, constitue un point de départ privilégié pour élaborer une théorie quantique compatible avec les principes relativistes.
Une première tentative de construction d’une mécanique quantique relativiste consiste alors à appliquer directement les règles de quantification à cette relation d’énergie. En remplaçant l’énergie et l’impulsion par leurs opérateurs quantiques usuels (principe de correspondance) :
\[E\ \leftrightarrow \ iħ\frac{\partial}{\partial t}\ \ et\ \ \overrightarrow{p}\ \leftrightarrow \ – iħ\frac{\partial}{\partial x} = – iħ\nabla\]
On obtient une équation différentielle du second ordre proposée indépendamment par Oskar Klein[1] et Walter Gordon[2] en 1926. Elle est aujourd’hui connue sous le nom d’équation de Klein-Gordon :
\[\left( \frac{1}{c^{2}}\frac{\partial^{2}}{\partial t^{2}} – \nabla^{2} + \frac{m^{2}c^{2}}{\hbar^{2}} \right)\psi(\overrightarrow{x},t) = 0.\]
Cette équation présente une qualité essentielle : elle est covariante relativiste. Le temps et l’espace y apparaissent sur un pied d’égalité, conformément à la structure de l’espace-temps de la relativité restreinte. Elle décrit correctement la propagation relativiste d’ondes quantiques et respecte la relation énergie-impulsion imposée par la relativité.
Cependant, malgré cette réussite formelle, l’équation de Klein-Gordon se heurte rapidement à de graves difficultés d’interprétation physique. Une première difficulté vient de la structure temporelle de l’équation de Klein-Gordon. Contrairement à l’équation de Schrödinger, qui est du premier ordre en dérivée temporelle, l’équation de Klein-Gordon est du second ordre par rapport au temps. En mécanique quantique non relativiste, cette propriété permet d’interpréter le module au carré de la fonction d’onde \(\mid \psi(x,t) \mid^{2}\ \)comme une densité de probabilité, car la conservation de la probabilité découle directement de l’équation de continuité associée à l’Hamiltonien. Dans le cas de Klein-Gordon, le fait que la dérivée temporelle soit d’ordre deux empêche d’établir de façon simple une densité positive qui se conserve et puisse être interprétée comme probabilité de présence.
La seconde difficulté concerne la densité de charge conservée associée à l’équation. En relativité, il existe une quantité \(\rho\ \)qui se conserve et qui est définie à partir de la fonction d’onde \(\phi\ \)et de sa dérivée temporelle :
\[\rho = \frac{i}{2}(\phi^{*}\partial_{t}\phi – \phi\partial_{t}\phi^{*})\]
Cette densité est conservée au sens relativiste, mais elle n’est pas toujours positive. Selon l’état de la particule, \(\rho\ \)peut prendre des valeurs négatives. Cela rend impossible son interprétation directe comme probabilité de présence : une « probabilité » négative n’a pas de sens physique classique.
Enfin, ces deux limitations combinées montrent que l’équation de Klein-Gordon ne peut pas décrire correctement des particules de spin 1/2 comme l’électron dans le cadre d’une interprétation probabiliste simple. Si l’on souhaite une description relativiste cohérente de particules quantiques individuelles, il faut trouver un formalisme où la densité de probabilité est bien définie et positive, et où le spin peut être pris en compte. C’est exactement ce que réalise l’équation de Dirac, qui résout ces problèmes tout en restant compatible avec la relativité restreinte.
L’équation de Klein-Gordon ne rend compte ni du spin, ni du moment magnétique intrinsèque observé expérimentalement, et échoue à décrire correctement les propriétés fondamentales des fermions. Elle trouvera en revanche une application ultérieure dans la description de particules scalaires, mais elle ne peut constituer une équation fondamentale pour l’électron.
Cet échec partiel constitue une étape essentielle dans l’évolution de la physique théorique. Il montre que la simple quantification formelle d’une relation relativiste ne suffit pas à produire une théorie physiquement acceptable. Une équation relativiste doit non seulement respecter l’invariance de Lorentz, mais aussi préserver une interprétation probabiliste cohérente et rendre compte des propriétés intrinsèques des particules.
C’est précisément cette prise de conscience qui conduit Paul Dirac à adopter une stratégie différente. Plutôt que de partir d’une relation d’énergie quadratique, il cherche une équation linéaire en les dérivées temporelles et spatiales, capable de concilier la mécanique quantique et la relativité restreinte sans sacrifier l’interprétation physique. Cette exigence, motivée par la cohérence conceptuelle plus que par un formalisme mathématique préexistant, ouvrira la voie à une équation entièrement nouvelle.
Ainsi, la nécessité de prendre en compte la relativité restreinte ne conduit pas simplement à une correction technique de la mécanique quantique, mais à une transformation profonde de sa structure. Cette démarche culminera avec l’équation de Dirac, qui ne se contentera pas de résoudre les difficultés rencontrées jusque-là, mais révélera des propriétés fondamentales inattendues de la matière, telles que le spin et l’existence de l’antimatière.
L’équation de Dirac
Les difficultés rencontrées par l’équation de Klein-Gordon montrent que la simple quantification d’une relation relativiste ne suffit pas à produire une théorie physiquement satisfaisante pour décrire des particules comme l’électron. Si cette équation respecte les exigences de la relativité restreinte, elle échoue à fournir une interprétation probabiliste cohérente et ne rend compte ni du spin ni des propriétés magnétiques observées expérimentalement. C’est dans ce contexte que Paul Dirac entreprend, en 1928[3], de construire une nouvelle équation quantique relativiste, fondée sur des principes différents.

L’idée centrale de Dirac consiste à rechercher une équation linéaire dans les dérivées temporelles et spatiales, à l’image de l’équation de Schrödinger, tout en respectant l’invariance relativiste. Ce choix n’est pas dicté par une nécessité mathématique, mais par une exigence physique : préserver une évolution temporelle bien définie et une densité de probabilité positive, condition indispensable à l’interprétation quantique. Pour satisfaire simultanément ces contraintes, Dirac est conduit à introduire une structure mathématique nouvelle, impliquant des objets matriciels et une fonction d’onde à plusieurs composantes.
L’équation qu’il propose pour une particule libre de masse \(m\ \)s’écrit, dans sa forme covariante,
\[\left( i\gamma^{\mu}\partial_{\mu} – m \right)\ \Psi(x) = 0\]
Où les \(\gamma^{\mu}\ \)sont des matrices vérifiant des relations algébriques spécifiques, et \(\Psi(x)\ \)est une fonction d’onde à quatre composantes, appelée bispineur. Cette fonction d’onde ne décrit plus seulement la position de la particule dans l’espace-temps, mais contient également des degrés de liberté internes.
Dans une écriture plus proche de la mécanique quantique non relativiste, l’équation de Dirac peut être reformulée sous la forme d’une équation d’évolution temporelle :
\[i\frac{\partial\Psi}{\partial t} = \left( – i\text{ }\overrightarrow{\alpha} \cdot \overrightarrow{\nabla} + \beta\text{ }m \right)\Psi\]
Où les matrices \(\overrightarrow{\alpha\ }\ \)et \(\beta\ \)sont construites à partir des matrices de Dirac. Cette expression met en évidence que l’équation est bien du premier ordre en dérivée temporelle, et qu’elle peut être interprétée comme une équation de type hamiltonien, au sens de la mécanique quantique.
Un aspect fondamental de cette construction est que la linéarité de l’équation n’est obtenue qu’au prix de l’introduction de matrices agissant sur la fonction d’onde. Autrement dit, la relativité impose l’existence d’une structure interne à la particule, que la mécanique quantique non relativiste ne laissait pas apparaître. Ce point marque une rupture conceptuelle majeure : les propriétés internes de l’électron ne sont plus ajoutées artificiellement, mais découlent directement de la cohérence du formalisme.
Parenthèse mathématique – L’équation de l’électron relativiste |
|---|
Il est important de souligner que, bien que l’équation de Dirac soit linéaire, elle reste pleinement compatible avec la relation relativiste entre énergie, impulsion et masse. En effet, en appliquant deux fois l’opérateur de Dirac, on montre que chaque composante du bispineur satisfait l’équation de Klein-Gordon. La relation \(E^{2} = p^{2} + m^{2}\) est donc automatiquement respectée. L’équation de Dirac apparaît ainsi comme une « racine » de l’équation de Klein-Gordon, plus riche sur le plan physique et conceptuel.
Cette nouvelle formulation résout plusieurs difficultés majeures rencontrées auparavant. Elle permet de définir une densité de probabilité positive, compatible avec l’interprétation quantique, et elle décrit naturellement des particules de spin 1/2. Mais surtout, elle entraîne des conséquences profondes et inattendues. L’analyse du spectre d’énergie révèle l’existence de solutions correspondant à des énergies négatives, dont l’interprétation conduira à la prédiction de l’antimatière. De même, la structure du bispineur fait apparaître le spin comme un degré de liberté intrinsèque, sans qu’il soit nécessaire de l’introduire de manière ad hoc.
Ainsi, l’équation de Dirac ne se contente pas de concilier la mécanique quantique et la relativité restreinte : elle transforme profondément notre compréhension des particules élémentaires. Les notions de spin et d’antimatière, qui joueront un rôle central dans la physique du 20ème siècle, émergent ici comme des conséquences directes de cette unification. Ces deux aspects feront l’objet des parties suivantes.
L’antimatière comme solution d’énergie négative de l’équation de Dirac
L’une des conséquences les plus profondes, et historiquement les plus troublantes, de l’équation de Dirac apparaît lorsque l’on cherche à en déterminer les solutions les plus simples. Comme en mécanique quantique non relativiste, il est naturel de commencer par l’étude d’une particule libre, c’est-à-dire en l’absence de tout champ extérieur. Dans ce cas, l’équation est invariante par translation dans l’espace et dans le temps, ce qui suggère de rechercher des solutions sous la forme d’ondes planes.
Cette démarche est familière : dans le cadre de l’équation de Schrödinger, elle conduit à une relation de dispersion reliant l’énergie et l’impulsion de la particule, et permet d’interpréter les états propres de l’Hamiltonien comme des états d’énergie bien définie. On s’attend donc, a priori, à retrouver dans le cas relativiste une relation analogue, compatible avec la relation énergie–impulsion de la relativité restreinte.
Toutefois, le caractère matriciel de l’équation de Dirac modifie profondément la situation. La fonction d’onde n’est plus un simple scalaire complexe, mais un objet à plusieurs composantes internes. La recherche de solutions d’onde plane ne conduit plus à une unique valeur de l’énergie pour une impulsion donnée, mais révèle au contraire une structure plus riche du spectre. C’est précisément dans ce contexte que surgit un résultat inattendu : pour une particule libre de masse \(m\ \)et d’impulsion \(\overrightarrow{p}\), l’équation de Dirac admet deux valeurs propres de l’énergie, de signes opposés.
Pour mettre ce point en évidence, considérons explicitement une solution d’onde plane et examinons les valeurs propres associées à l’Hamiltonien de Dirac. Soit \(E\) une de ces valeurs propres, et \(\Psi(x,t)\) une solution de l’équation de Dirac de la forme onde plane :
\(\Psi(x,t) = \omega\ e^{- ipx} = \ \omega\ e^{- i\left( Et – \overrightarrow{p}\overrightarrow{x} \right)}\ avec\ \omega\ un\ vecteur\ qu’on\ note\ \omega = \ \begin{bmatrix} \varphi \\ \theta \end{bmatrix}\)
Où \(\varphi\) et \(\theta\) sont des spineurs, c’est-à-dire des fonctions d’onde vectorielles à deux composantes. En appliquant l’équation de Dirac à ce vecteur propre, on a (en utilisant les unités naturelles, i.e. c = ħ =1) :
\[E\ \begin{bmatrix} \varphi \\ \theta \end{bmatrix} = \ \begin{bmatrix} m\ \mathbf{I}_{\mathbf{d}} & \overrightarrow{\sigma.}\overrightarrow{p} \\ \overrightarrow{\sigma}\overrightarrow{.p} & – \ m\ \mathbf{I}_{\mathbf{d}} \end{bmatrix}\ \ \begin{bmatrix} \varphi \\ \theta \end{bmatrix}\]
Ce système matriciel peut être reformulé en deux équations couplées :
\[(E – m)\ \varphi = \left( \overrightarrow{\sigma.}\overrightarrow{p} \right)\ \theta\ et\ (E + m)\ \theta = \ \left( \overrightarrow{\sigma.}\overrightarrow{p} \right)\ \varphi\ \]
En éliminant l’une des deux composantes, on obtient la relation :
\[E^{2}\ = \ {\overrightarrow{p}}^{2} + m^{2}\]
Qui admet deux valeurs d’énergie possibles :
\[\mathbf{E = \pm}\sqrt{{\overrightarrow{\mathbf{p}}}^{\text{ }\mathbf{2}}\mathbf{+}\mathbf{m}^{\mathbf{2}}}\]
Contrairement à la mécanique classique et à l’équation de Schrödinger, l’énergie n’est donc pas bornée inférieurement. À côté des états d’énergie positive, correspondant naturellement aux particules observées, apparaissent des états d’énergie négative.
Cette situation pose un problème conceptuel majeur. En effet, si de tels états existaient physiquement, rien n’empêcherait un électron de passer continûment d’un état d’énergie positive à un état d’énergie négative en émettant de l’énergie. Un tel processus rendrait la matière instable, en contradiction flagrante avec l’expérience. Il est donc impératif de fournir une interprétation cohérente à ces solutions si l’on veut préserver la validité de la théorie.
Dans un premier temps, Dirac envisage la possibilité d’identifier ces états d’énergie négative à des particules déjà connues. Le candidat le plus naturel est alors le proton, seule particule chargée positivement connue à l’époque. Mais cette hypothèse est rapidement écartée : la masse du proton est environ 2000 fois plus grande que celle de l’électron, et ne correspond pas aux solutions de l’équation. Les états d’énergie négative décrivent nécessairement une particule de même masse que l’électron, mais de charge opposée.
Face à cette difficulté, Dirac propose en 1930–1931 une interprétation radicalement nouvelle, connue sous le nom de théorie de la mer de Dirac[4]. Il postule que, dans l’état fondamental du vide, tous les états d’énergie négative sont occupés. En vertu du principe d’exclusion de Pauli, aucun électron supplémentaire ne peut alors s’y placer. Ce remplissage complet rend ces états invisibles et empêche les transitions catastrophiques vers des énergies négatives.
Dans ce cadre, une excitation particulière devient possible : si un électron d’énergie négative est arraché à la mer, il laisse derrière lui une lacune. Cette lacune se comporte comme une particule de charge positive, de même masse que l’électron, et dotée d’une énergie positive. Dirac interprète cette lacune comme une nouvelle particule : l’antiélectron, aujourd’hui appelé positron.
Cette prédiction est remarquable à plus d’un titre. Pour la première fois dans l’histoire de la physique, l’existence d’une particule est déduite d’une équation théorique avant toute observation expérimentale. Cette audace sera rapidement récompensée : en 1932, Carl Anderson observe dans les rayons cosmiques une particule chargée positivement, de masse identique à celle de l’électron. Le positron est ainsi découvert, confirmant de manière spectaculaire la validité de l’équation de Dirac et l’existence de l’antimatière.
Avec le recul, la théorie de la mer de Dirac apparaît comme une étape intermédiaire, historiquement féconde mais conceptuellement lourde. Elle attribue au vide une structure infiniment peuplée de particules, ce qui soulève de nombreuses difficultés. Ces problèmes seront résolus plus tard dans le cadre de la théorie quantique des champs, où les solutions d’énergie négative sont réinterprétées comme des particules d’antimatière se propageant vers le futur, et où la création et l’annihilation de paires particule–antiparticule deviennent des processus naturels.
Néanmoins, l’idée essentielle demeure : à toute particule correspond une antiparticule, possédant la même masse mais des charges opposées. L’antimatière n’est pas une curiosité marginale, mais une conséquence profonde de la compatibilité entre la mécanique quantique et la relativité restreinte. Elle joue aujourd’hui un rôle central en physique des particules, en cosmologie et dans de nombreuses applications expérimentales, allant de l’imagerie médicale à l’étude de l’asymétrie matière–antimatière dans l’Univers.
L’équation de Dirac ne se contente donc pas de décrire l’électron relativiste : elle révèle une symétrie fondamentale de la nature, dans laquelle la matière et l’antimatière apparaissent comme deux faces indissociables d’une même structure théorique. Dans la partie suivante, nous examinerons une autre conséquence majeure de cette équation : l’émergence naturelle du spin comme propriété intrinsèque des particules quantiques relativistes.
Le spin : un degré de liberté intrinsèque
Une autre conséquence majeure et fascinante de l’équation de Dirac est l’apparition naturelle du spin, propriété intrinsèque des particules de type fermion. Contrairement à la mécanique quantique non relativiste, où le spin a été introduit de manière ad hoc par Pauli pour expliquer certaines observations expérimentales (comme le moment magnétique de l’électron ou le doublet de raies spectrales), l’équation de Dirac rend ce concept inévitable.
Le spin émerge directement de la structure mathématique de l’équation. La fonction d’onde relativiste, le bispineur à quatre composantes \(\Psi(x,t)\), contient déjà des degrés de liberté internes. Ceux-ci ne correspondent pas à la position dans l’espace, mais à des propriétés intrinsèques de la particule. Les matrices \(\overrightarrow{\alpha\ }\ \)et \(\beta\ \)qui interviennent dans l’équation de Dirac ne se contentent pas de garantir la compatibilité relativiste : elles codent également le moment cinétique intrinsèque, ou spin, associé à chaque particule.
Dans le régime non relativiste, l’équation de Dirac se réduit à l’équation de Pauli, qui décrit un électron doté d’un moment magnétique lié à son spin. Cette correspondance montre que l’introduction du spin n’est pas une addition artificielle, mais résulte naturellement de l’exigence d’unification de la mécanique quantique et de la relativité restreinte.
Le spin possède plusieurs implications physiques immédiates. Il explique les propriétés magnétiques des électrons, intervient dans le principe d’exclusion de Pauli, fondamental pour la structure de la matière, et distingue les fermions (spin demi-entier) des bosons (spin entier). Dans le cadre relativiste, cette propriété est inextricablement liée aux solutions du bispineur, et toute particule décrite par l’équation de Dirac porte intrinsèquement ce moment cinétique quantique.
Ainsi, l’équation de Dirac ne se contente pas de corriger la mécanique quantique non relativiste à grande vitesse : elle prévoit automatiquement le spin. Ce dernier n’est plus un paramètre ajouté après coup, mais un reflet direct des contraintes imposées par la relativité et la structure interne des particules. C’est cette élégance théorique qui fait de l’équation de Dirac une pierre angulaire de la physique moderne, reliant de manière cohérente mouvement relativiste, propriétés quantiques et caractéristiques fondamentales de la matière.
Conclusion
L’étude des particules à haute énergie a révélé que la mécanique quantique non relativiste ne suffisait pas à décrire correctement le monde microscopique. La première partie a montré pourquoi il était nécessaire de tenir compte de la relativité restreinte : les équations classiques ne sont plus valides lorsque la vitesse des particules approche celle de la lumière, et une description cohérente de l’énergie et de l’impulsion exige un formalisme relativiste.
La seconde partie a présenté l’équation de Dirac, résultat d’une démarche guidée par la cohérence entre mécanique quantique et relativité. L’équation de Dirac fournit un cadre mathématique qui respecte les transformations de Lorentz tout en préservant l’interprétation probabiliste fondamentale de la mécanique quantique. Elle marque également un tournant conceptuel, en introduisant naturellement des degrés de liberté internes et en modifiant profondément notre compréhension du spectre d’énergie des particules.
La troisième partie a montré que, parmi les conséquences de cette équation, l’existence de solutions d’énergie négative a conduit à la prédiction de l’antimatière, avec le positron découvert expérimentalement peu de temps après. Cette symétrie fondamentale entre particules et antiparticules illustre comment la théorie peut révéler des propriétés de la nature a priori inattendues.
Enfin, la quatrième partie a souligné que l’équation de Dirac prédit également le spin, propriété intrinsèque des fermions, qui n’avait été introduite auparavant que de manière empirique. Le spin émerge ici comme une conséquence directe de la structure du bispineur et de l’exigence de compatibilité relativiste, confirmant une fois de plus l’élégance et la puissance prédictive de ce formalisme.
Dans l’ensemble, l’unification de la mécanique quantique et de la relativité restreinte, réalisée par Dirac, a ouvert la voie à une compréhension plus profonde des particules élémentaires. Elle a posé les bases de la physique des particules modernes, en révélant que les propriétés fondamentales des particules (énergie, spin, existence d’antiparticules) ne sont pas des choix arbitraires, mais découlent directement de principes théoriques cohérents.
Cet aperçu synthétique prépare naturellement aux développements suivants : l’étude détaillée des particules élémentaires dans le cadre du modèle standard, où les notions de spin, de symétrie et d’antimatière jouent un rôle central dans la classification et la compréhension de la matière et de ses interactions.
- Oskar Klein, „Die Reflexion von Elektronen an einem Potentialsprung nach der relativistischen Dynamik von Dirac“, Zeitschrift für Physik, 37: 895–906, 1926 ↑
- Walter Gordon, „Der Compton-Effekt nach der Schrödingerschen Theorie“, Zeitschrift für Physik, 40: 117–133, 1926 ↑
- Paul Dirac, “The quantum theory of the electron”, Proceedings of the Royal society, 1928 ↑
- Paul Dirac, “A Theory of Electrons and Protons”, Proceedings of the Royal Society A 126, 360–365, 1930 ↑