L’équation de l’électron relativiste de Dirac

Difficulté : ⚛⚛⚛ Niveau 3 — Avancé

L’élaboration d’une théorie quantique compatible avec les principes de la relativité restreinte constitue l’un des défis majeurs de la physique du début du 20ème siècle. Si l’équation de Schrödinger permet de décrire avec succès les systèmes quantiques non relativistes, elle repose sur une formulation dans laquelle le temps et l’espace jouent des rôles asymétriques, en contradiction avec les exigences relativistes. À l’inverse, les tentatives directes d’introduire la relativité à partir de la relation quadratique entre énergie et quantité de mouvement conduisent à des équations du second ordre, dont l’interprétation physique s’avère problématique.

C’est dans ce contexte que Paul Dirac propose en 1928 une approche radicalement nouvelle. Plutôt que de partir d’une équation quadratique, il cherche à construire une équation linéaire à la fois en les dérivées temporelles et spatiales, respectant ainsi la symétrie fondamentale de l’espace-temps. Cette exigence, apparemment simple, conduit à une structure mathématique entièrement nouvelle, dans laquelle la fonction d’onde devient un objet vectoriel, et où interviennent des matrices satisfaisant des relations d’anti-commutation.

L’équation ainsi obtenue, aujourd’hui connue sous le nom d’équation de Dirac, constitue une synthèse remarquable entre mécanique quantique et relativité restreinte. Elle ne se contente pas de décrire correctement l’électron relativiste : elle introduit de manière naturelle des concepts nouveaux, tels que le spin intrinsèque des particules et l’existence d’antiparticules, qui seront confirmés expérimentalement peu après.

L’objectif de cet article est de présenter de manière progressive la construction de cette équation et d’en analyser les principales conséquences. Nous commencerons par détailler la démarche de Dirac qui conduit à la linéarisation de la relation relativiste de l’énergie, puis nous présenterons la structure mathématique précise de l’équation et des matrices qui la définissent. Enfin, nous étudierons les implications physiques majeures de cette théorie, en particulier l’apparition des solutions d’énergie négative et du spin.

 

La démarche de Dirac pour aboutir à l’équation de l’électron relativiste

Pour comprendre l’origine de l’équation de Dirac, il faut repartir de la difficulté centrale à laquelle était confrontée la mécanique quantique à la fin des années 1920. L’équation de Schrödinger décrivait avec succès de nombreux phénomènes microscopiques, mais elle n’était pas compatible avec les exigences de la relativité restreinte. En effet, cette équation traite de manière dissymétrique le temps et l’espace : elle est du premier ordre par rapport au temps, mais du second ordre par rapport aux coordonnées d’espace. Or, dans le cadre relativiste, les coordonnées spatiales et temporelles doivent apparaître sur un pied d’égalité. C’est précisément cette tension entre mécanique quantique et relativité qui constitue le point de départ de la démarche de Dirac.

La première idée consiste donc à rechercher une équation d’évolution qui soit linéaire à la fois en les dérivées temporelles et spatiales. Dirac postule ainsi qu’il doit exister une équation du type :

\[i\hbar\frac{\partial\Psi}{\partial t} = \left( c\text{ }\overrightarrow{\alpha} \cdot \overrightarrow{p} + \beta mc^{2} \right)\Psi\]

Où \(\Psi\ \)désigne la fonction d’onde, \(\overrightarrow{p}\ \)l’opérateur impulsion, et où \(\overrightarrow{\alpha\ }\)et \(\beta\ \)sont des quantités encore inconnues, que Dirac cherche précisément à déterminer. L’idée profonde est de construire un Hamiltonien relativiste qui soit linéaire en \(\overrightarrow{p}\), afin d’obtenir une équation aux dérivées partielles du premier ordre en espace.

Cette recherche doit évidemment rester compatible avec la relation relativiste fondamentale entre l’énergie et la quantité de mouvement,

\[E^{2} = p^{2}c^{2} + m^{2}c^{4}\]

Cette relation exprime l’invariant relativiste associé à une particule libre de masse \(m\). Si l’on applique directement le principe de correspondance,

\[E \longleftrightarrow i\hbar\frac{\partial}{\partial t}\ ;\ \ \overrightarrow{p} \longleftrightarrow – i\hbar\nabla,\]

On obtient immédiatement une équation relativiste d’ordre deux, à savoir l’équation de Klein-Gordon :

\[- \hbar^{2}\frac{\partial^{2}\Psi}{\partial t^{2}} = – \hbar^{2}c^{2}\Delta\Psi + m^{2}c^{4}\Psi\]

Equation que l’on réécrit sous la forme standard :

\[\left( \frac{1}{c^{2}}\frac{\partial^{2}}{\partial t^{2}} – \Delta + \frac{m^{2}c^{2}}{\hbar^{2}} \right)\Psi = 0\]

Celle-ci est en effet fondée sur la substitution directe des opérateurs quantiques dans la relation quadratique en \(E\ \)et \(\overrightarrow{p}\). Mais cette voie ne satisfait pas Dirac, car elle conduit à une équation du second ordre en temps, ce qui pose des difficultés d’interprétation probabiliste.

Cette difficulté provient du fait que l’équation de Klein-Gordon, étant du second ordre en temps, ne permet pas de définir naturellement une densité de probabilité positive. En mécanique quantique non relativiste, l’équation de Schrödinger conduit à une densité de probabilité \(\mid \Psi \mid^{2}\ \)strictement positive, dont l’évolution est régie par une équation de continuité assurant la conservation de la probabilité. En revanche, dans le cas de l’équation de Klein-Gordon, la quantité analogue construite à partir de la fonction d’onde et de sa dérivée temporelle n’est pas définie positive : elle peut prendre des valeurs négatives, ce qui empêche de l’interpréter comme une densité de probabilité. Cette absence d’interprétation probabiliste cohérente constitue une limitation majeure de l’équation de Klein-Gordon pour la description des particules relativistes, et motive la recherche d’une équation du premier ordre en temps, comme celle proposée par Dirac.

La stratégie de Dirac consiste alors à « linéariser » la relation relativiste de l’énergie. Autrement dit, au lieu de partir de

\[E^{2} = p^{2}c^{2} + m^{2}c^{4},\]

il cherche une expression linéaire de \(E\ \)dont le carré redonnerait exactement cette identité. Il postule donc une relation de la forme

\[E = c\text{ }\overrightarrow{\alpha} \cdot \overrightarrow{p} + \beta mc^{2}\]

Le point essentiel est alors d’imposer que le carré du membre de droite soit égal à \(p^{2}c^{2} + m^{2}c^{4}\). En développant, on obtient

\[E^{2} = c^{2}(\overrightarrow{\alpha} \cdot \overrightarrow{p})^{2} + mc^{3}(\overrightarrow{\alpha} \cdot \overrightarrow{p}\text{ }\beta + \beta\text{ }\overrightarrow{\alpha} \cdot \overrightarrow{p}) + \beta^{2}m^{2}c^{4}\]

Pour que cette expression coïncide avec la relation relativiste, il faut que les termes croisés disparaissent et que les termes quadratiques se simplifient correctement. Cela impose aux coefficients \(\alpha_{i}\ \)et \(\beta\ \)les relations algébriques :

\[\alpha_{i}\alpha_{j} + \alpha_{j}\alpha_{i} = 2\delta_{ij}I,\alpha_{i}\beta + \beta\alpha_{i} = 0,\beta^{2} = I\]

Où \(I\ \)désigne l’identité.

Ces relations sont extrêmement contraignantes. Elles montrent immédiatement que les quantités \(\alpha_{i}\ \)et \(\beta\ \)ne peuvent pas être de simples nombres réels ou complexes. En effet, si elles étaient scalaires, elles commuteraient nécessairement, ce qui rendrait impossible l’annulation des termes croisés par anticommutation. Dirac comprend alors que les objets recherchés doivent être des matrices, agissant sur une fonction d’onde qui n’est plus scalaire, mais vectorielle.

Dirac cherche à factoriser cet opérateur du second ordre comme produit de deux opérateurs du premier ordre. Il écrit ainsi, de manière formelle,

\[\Delta – \frac{1}{c^{2}}\frac{\partial^{2}}{\partial t^{2}} = \left( A\frac{\partial}{\partial x}+B\frac{\partial}{\partial y}+C\frac{\partial}{\partial z}+\frac{i}{c}D\frac{\partial}{\partial t} \right)^{2}\]

Où \(A\), \(B\), \(C\ \)et \(D\ \)sont des coefficients à déterminer. En développant ce carré, on voit apparaître des termes mixtes du type \(\partial_{x}\partial_{y}\), \(\partial_{x}\partial_{t}\), etc. Pour que ceux-ci disparaissent, il faut imposer les relations :

\[AB + BA = 0,AC + CA = 0,BC + CB = 0,\]

Ainsi que les relations analogues avec \(D\), et de plus

\[A^{2} = B^{2} = C^{2} = D^{2} = I\]

On retrouve ainsi la structure d’anti-commutation qui était déjà apparue dans la linéarisation de la relation relativiste de l’énergie.

La solution minimale non triviale de ce système de contraintes est fournie par des matrices de dimension \(4\). C’est ici que surgissent les matrices de Dirac, notées aujourd’hui \(\gamma^{\mu}\), qui réalisent concrètement les relations d’anticommutation nécessaires. Cette apparition de matrices \(4 \times 4\ \)impose en retour que la fonction d’onde \(\Psi\ \)possède quatre composantes. Autrement dit, la recherche d’une équation relativiste linéaire conduit nécessairement à remplacer la fonction d’onde scalaire de Schrödinger par un spineur de Dirac à quatre composantes.

Le point décisif est donc le suivant : le passage à une fonction d’onde vectorielle n’est pas un choix arbitraire ajouté après coup, mais la conséquence mathématique directe de la tentative de linéariser l’invariant relativiste de l’énergie. Dirac ne cherche pas d’abord un spineur, puis une équation, il cherche une équation relativiste du premier ordre, et cette exigence l’oblige à introduire des matrices puis, corrélativement, une fonction d’onde à plusieurs composantes.

Une fois ces matrices introduites, il devient possible d’écrire une équation compatible à la fois avec la mécanique quantique et avec la relativité restreinte. Cette équation décrit naturellement une particule de spin \(1/2\), et fera apparaître des conséquences inattendues, comme l’existence de solutions d’énergie négative. Avant d’en étudier les implications, il faut toutefois présenter plus précisément la forme explicite de l’équation et la structure algébrique des matrices qui la définissent, ce qui fera l’objet du chapitre suivant.

 

Présentation détaillée de l’équation de Dirac

Une fois les contraintes algébriques identifiées et les matrices adéquates introduites, Dirac parvient à écrire une équation relativiste du premier ordre, compatible avec les principes de la mécanique quantique. Cette équation décrit une particule de spin \(1/2\), comme l’électron, à l’aide d’une fonction d’onde à quatre composantes appelée spineur de Dirac, que l’on note \(\Psi(x,t)\).

Dans sa forme standard, l’équation de Dirac s’écrit

\[\mathbf{i}\mathbf{\hbar}\frac{\mathbf{\partial\Psi}}{\mathbf{\partial}\mathbf{t}}\mathbf{=}\left( \mathbf{- i}\mathbf{\hbar}\mathbf{c}\sum_{\mathbf{i = 1}}^{\mathbf{3}}\mathbf{\alpha}^{\mathbf{i}}\frac{\mathbf{\partial}}{\mathbf{\partial}\mathbf{x}^{\mathbf{i}}}\mathbf{+ \beta m}\mathbf{c}^{\mathbf{2}} \right)\mathbf{\Psi}\]

Où les matrices \(\alpha^{i}\ \)et \(\beta\ \)satisfont les relations d’anticommutation introduites précédemment. Il est toutefois plus naturel, dans un cadre relativiste, d’introduire une notation covariante en regroupant espace et temps. On définit alors les matrices de Dirac \(\mathbf{\gamma}^{\mathbf{\mu}}\), \(\mu = 0,1,2,3\), et l’équation prend la forme compacte :

\[\left( i\hbar\gamma^{\mu}\partial_{\mu}-mc \right)\Psi = 0\ où\ \partial_{\mu} = \left( \frac{1}{c}\frac{\partial}{\partial t},\nabla \right)\ \]

Les matrices \(\gamma^{\mu}\ \)vérifient les relations d’anti-commutation fondamentales :

\[\{\gamma^{\mu},\gamma^{\nu}\} = \gamma^{\mu}\gamma^{\nu} + \gamma^{\nu}\gamma^{\mu} = 2\eta^{\mu\nu}I\]

Où \(\eta^{\mu\nu}\ \)est le tenseur métrique de Minkowski et \(I\ \)la matrice identité \(4 \times 4\). Ces relations garantissent que le carré de l’opérateur de Dirac redonne l’opérateur de Klein-Gordon, assurant ainsi la compatibilité avec la relativité restreinte.

Une représentation explicite des matrices de Dirac, appelée représentation standard (ou représentation de Dirac), est donnée par

\[\gamma^{0} = \begin{pmatrix} I & 0 \\ 0 & – I \end{pmatrix},\gamma^{i} = \begin{pmatrix} 0 & \sigma^{i} \\ – \sigma^{i} & 0 \end{pmatrix}\]

Où \(I\ \)est la matrice identité \(2 \times 2\), et \(\mathbf{\sigma}^{\mathbf{i\ }}\)les matrices de Pauli :

\[\sigma^{1} = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix},\sigma^{2} = \begin{pmatrix} 0 & – i \\ i & 0 \end{pmatrix},\sigma^{3} = \begin{pmatrix} 1 & 0 \\ 0 & – 1 \end{pmatrix}\]

La structure du spineur \(\Psi\ \)reflète directement cette décomposition. Il peut être vu comme un vecteur à quatre composantes, souvent interprété comme la juxtaposition de deux spineurs à deux composantes. Cette structure interne permet de décrire simultanément plusieurs degrés de liberté, qui apparaîtront physiquement comme le spin et la distinction entre particules et antiparticules.

Une propriété essentielle de l’équation de Dirac est qu’elle est relativiste covariante : sa forme est invariante sous les transformations de Lorentz. Cette covariance est assurée précisément par les propriétés des matrices \(\gamma^{\mu}\), qui fournissent une représentation de l’algèbre de Clifford associée à l’espace-temps de Minkowski.

Plus précisément, dire qu’une équation est relativiste covariante signifie que sa forme est conservée lorsqu’on effectue un changement de référentiel inertiel, décrit par une transformation de Lorentz. On note \(x^{\mu\ }\)les coordonnées d’un événement dans un référentiel.

Les coordonnées dans un autre référentiel relié par une transformation de Lorentz \(\Lambda\), s’écrivent :

\[x^{‘\mu}\ = \ \ \ \ \Lambda_{\nu}^{\mu}\ x^{\nu}\text{ }\]

Les équations physiques doivent s’écrire de manière identique dans les deux systèmes. Cette exigence traduit le principe fondamental de relativité, selon lequel les lois de la physique sont les mêmes dans tous les référentiels inertiels.

Dans le cas de l’équation de Dirac, cette covariance ne concerne pas seulement les coordonnées d’espace-temps, mais également la fonction d’onde elle-même. Le spineur \(\Psi\ \)se transforme selon une représentation particulière du groupe de Lorentz, dite représentation spinorielle. Il existe alors une matrice \(S(\Lambda)\ \)telle que

\[\Psi'(x’) = S(\Lambda)\Psi(x)\]

Et les matrices \(\gamma^{\mu\ }\)vérifient la relation de covariance :

\[S(\Lambda)\text{ }\gamma^{\mu}\text{ }S(\Lambda)^{- 1} = \Lambda_{\nu}^{\mu}\ \gamma^{\mu}\text{ }\]

Cette propriété garantit que l’opérateur différentiel \(\gamma^{\mu}\partial_{\mu}\ \)se transforme de manière cohérente sous les transformations de Lorentz, assurant ainsi l’invariance de la forme de l’équation de Dirac. La covariance relativiste apparaît donc comme une contrainte très forte, qui fixe en grande partie la structure mathématique de l’équation.

Enfin, comme attendu, si l’on applique deux fois l’opérateur de Dirac, on retrouve l’équation de Klein-Gordon :

\[\left( i\hbar\gamma^{\mu}\partial_{\mu}-mc \right)^{2}\Psi = \left( – \hbar^{2}\partial^{\mu}\partial_{\mu} + m^{2}c^{2} \right)\Psi\]

Cette propriété confirme que l’équation de Dirac constitue bien une factorisation de l’équation relativiste d’ordre deux, tout en conservant une structure différentielle du premier ordre.

Ainsi, l’équation de Dirac apparaît comme une synthèse remarquable entre mécanique quantique et relativité restreinte. Elle introduit naturellement des objets nouveaux, les spineurs et les matrices de Dirac, dont la structure algébrique est profondément liée aux symétries de l’espace-temps. Les conséquences physiques de cette équation, notamment l’existence du spin et des solutions d’énergie négative, seront étudiées dans le chapitre suivant.

 

Les conséquences de cette équation de Dirac : énergies négatives et spin

L’équation de Dirac, en unifiant mécanique quantique et relativité restreinte, ne se contente pas de reproduire des résultats connus : elle conduit à des conséquences profondes et inattendues, qui ont marqué un tournant majeur dans l’histoire de la physique. Parmi celles-ci, deux aspects fondamentaux émergent directement de sa structure : l’existence de solutions d’énergie négative, et l’apparition naturelle du spin des particules.

Considérons tout d’abord les solutions de l’équation de Dirac pour une particule libre. En recherchant des solutions sous forme d’ondes planes :

\[\Psi(x,t) \sim e^{\frac{i}{\hbar}(\overrightarrow{p} \cdot \overrightarrow{x} – Et)}\]

On retrouve, comme attendu, la relation relativiste entre l’énergie et la quantité de mouvement :

\[E^{2} = p^{2}c^{2} + m^{2}c^{4}\]

Cependant, cette relation admet deux types de solutions :

\[E = + \sqrt{p^{2}c^{2} + m^{2}c^{4}}\text{ et }E = – \sqrt{p^{2}c^{2} + m^{2}c^{4}}\]

Contrairement à la mécanique classique, où l’on ne retient que les énergies positives, l’équation de Dirac impose l’existence de solutions d’énergie négative.

Cette situation pose une difficulté conceptuelle immédiate : si ces états d’énergie négative existent, pourquoi les particules ne s’y effondrent-elles pas spontanément ? Dirac propose alors une interprétation audacieuse, connue sous le nom de « mer de Dirac ». Il suppose que tous les états d’énergie négative sont déjà occupés dans le vide, conformément au principe d’exclusion de Pauli. Dans ce cadre, un état d’énergie négative inoccupé apparaît comme une excitation du vide, interprétée comme une particule de charge opposée. Cette idée conduit à la prédiction de l’existence des antiparticules.

Cette prédiction, purement théorique à l’origine, sera confirmée expérimentalement quelques années plus tard par la découverte du positron. L’équation de Dirac introduit ainsi de manière naturelle le concept d’antimatière, qui deviendra un élément central de la physique des particules.

La seconde conséquence majeure de l’équation de Dirac est l’apparition du spin. Dans la mécanique quantique non relativiste, le spin est introduit de manière ad hoc, comme un degré de liberté interne supplémentaire. En revanche, dans le cadre de l’équation de Dirac, le spin émerge naturellement de la structure même de l’équation.

En effet, la fonction d’onde \(\Psi\ \)possède quatre composantes, ce qui permet de décrire des états correspondant à différentes orientations internes. L’étude des opérateurs de rotation montre que ces composantes se transforment selon une représentation du groupe des rotations adaptée aux particules de spin \(1/2\). Les matrices de Dirac, construites à partir des matrices de Pauli, encodent directement cette structure.

Plus précisément, les opérateurs de spin apparaissent comme les générateurs des rotations dans l’espace des spineurs, et satisfont les relations de commutation caractéristiques du moment cinétique. Ainsi, le spin n’est plus un ajout extérieur à la théorie, mais une conséquence inévitable de la compatibilité entre relativité et mécanique quantique.

Enfin, la structure de l’équation de Dirac révèle un lien profond entre symétrie, représentation des groupes de Lie et propriétés physiques des particules. Les spineurs de Dirac réalisent une représentation du groupe de Lorentz, et les transformations de symétrie agissent naturellement sur les solutions de l’équation. Ce point de vue ouvre la voie à la formulation moderne de la théorie quantique des champs, où les particules sont décrites comme des excitations de champs transformant selon des représentations de groupes de symétrie.

Ainsi, l’équation de Dirac ne constitue pas seulement une amélioration technique de la mécanique quantique : elle introduit des concepts entièrement nouveaux, comme l’antimatière et le spin intrinsèque, et établit un lien profond entre structure mathématique et réalité physique. Elle marque le point de départ de la physique des particules moderne et des théories quantiques relativistes.

Laisser un commentaire