Les premiers succès de la mécanique quantique, formulée dans les années 1920, ont reposé sur des systèmes où les effets relativistes pouvaient être négligés. L’équation de Schrödinger, au cœur de cette mécanique quantique non relativiste, a permis de décrire avec une précision remarquable les niveaux d’énergie de l’atome d’hydrogène, les effets spectraux, ou encore des phénomènes contre-intuitifs comme l’effet tunnel. Ces avancées ont profondément transformé notre compréhension de la matière à l’échelle microscopique.
Mais malgré ces réussites, la mécanique quantique ainsi formulée s’avère rapidement insuffisante pour décrire le monde subatomique dans sa complexité. Elle présente en effet trois limitations fondamentales :
- Elle ne respecte pas les principes de la relativité restreinte.
- Elle ne permet pas de modéliser les processus de création et d’annihilation de particules pourtant constatés expérimentalement.
- Elle considère les particules comme fondamentalement distinctes, sans fournir de cadre pour expliquer leur indistinguabilité ou leurs interactions collectives.
Ces insuffisances motivent l’élaboration d’un cadre théorique plus général : la théorie quantique des champs (QFT), qui synthétise la mécanique quantique et la relativité restreinte, tout en introduisant une vision radicalement nouvelle de la notion de particule.
La prise en compte de la relativité restreinte
Dès les premières formulations de la mécanique quantique, il est apparu qu’elle devait tôt ou tard être rendue compatible avec la relativité restreinte, notamment pour décrire des particules de haute énergie ou de vitesse proche de celle de la lumière. Or, l’équation de Schrödinger, fondement de la mécanique quantique non relativiste, ne respecte pas les principes de la relativité : le temps y joue un rôle asymétrique, et la structure mathématique n’est pas covariante sous les transformations de Lorentz. Plusieurs tentatives, dès les années 1920, ont visé à combler ce fossé. Elles ont conduit à des progrès notables, mais aussi à des impasses qui ont souligné la nécessité d’un changement de paradigme.
Avant même l’avènement de la mécanique quantique proprement dite, Arnold Sommerfeld, en 1916, tente d’introduire la relativité restreinte dans le modèle de Bohr de l’atome d’hydrogène. En conservant l’hypothèse des orbites quantifiées, il applique la formule relativiste de l’énergie cinétique à l’électron tournant autour du noyau.
Cela l’amène à prédire une structure fine des niveaux d’énergie de l’hydrogène, c’est-à-dire un déplacement et un dédoublement des raies spectrales en fonction du moment cinétique orbital. Ce résultat est relativement en accord avec les observations, ce qui donne à son modèle un certain succès.
Mais ce modèle reste semi-classique et ne repose pas sur une description pleinement quantique du mouvement. Il échoue notamment à prédire des effets subtils comme l’anomalie du moment magnétique de l’électron, et il ne traite pas correctement le spin (inexistant dans sa théorie). De plus, l’introduction de la relativité n’est pas structurelle, mais uniquement appliquée a posteriori à l’énergie cinétique.
En 1924, Louis de Broglie propose un pas décisif en posant l’hypothèse de la dualité onde / corpuscule : à toute particule matérielle est associée une onde, caractérisée par une fréquence et une longueur d’onde, liées à son énergie et sa quantité de mouvement. Dans le cas d’une particule relativiste, De Broglie postule une relation de phase unifiée entre énergie, impulsion, et fréquence, compatible avec les relations de la relativité restreinte :
\[E^{2} = \ m^{2}c^{4} + p^{2}c^{2}\]
Partant de là, il cherche une équation d’onde relativiste qui généralise celle de Schrödinger. Il propose en 1927 une équation du type :
\[\ \left( \frac{1}{c^{2}}\frac{\partial^{2}}{\partial t^{2}}\ – \ \nabla^{2} \right)\ \psi\ + \ \left( \frac{mc}{ħ} \right)^{2}\psi = 0\ \]
C’est ce qu’on appellera plus tard l’équation de Klein-Gordon, formulée mathématiquement par d’autres (Klein, Gordon, Schrödinger) à la même époque. Cette équation est relativiste et covariante. Une équation est dite covariante si elle conserve la même forme dans tous les référentiels inertiels, c’est-à-dire dans tous les systèmes de coordonnées liés par une transformation de Lorentz. En clair : il faut que l’espace et le temps y soient traités sur un pied d’égalité, comme les composantes d’un espace-temps à 4 dimensions. Mais cette équation de Klein Gordon pose différents problèmes et ne sera donc pas retenue : elle introduit des solutions à énergie négative, elle ne permet pas d’interpréter correctement la densité de probabilité et elle ne prend pas en compte le spin des particules.
En 1926, Erwin Schrödinger, inspiré par les idées de De Broglie, cherche également à établir une équation d’onde pour les particules. Il commence par formuler une version relativiste, justement celle de Klein-Gordon. Mais cette équation relativiste ne le satisfait pas. Pourquoi ? Parce qu’elle admet des solutions à énergie négative (ce qui pose un problème d’interprétation physique), et que la densité de probabilité n’est plus positivement définie ni conservée. En d’autres termes, cette équation ne permet pas une interprétation probabiliste cohérente, contrairement à l’équation qu’il formulera ensuite :
\[iħ\ \frac{\partial\Psi\left( t,\overrightarrow{r} \right)}{\partial t} = – \frac{ħ^{2}}{2m}\mathrm{\Delta}\ \Psi\left( t,\overrightarrow{r} \right) + V\left( \overrightarrow{r} \right)\ \Psi\left( t,\overrightarrow{r} \right)\]
L’équation de Schrödinger, bien que non relativiste, présente une interprétation claire et opérationnelle, et permet de calculer avec succès de nombreux phénomènes physiques (raies spectrales, effet tunnel, états liés…). Mais elle présente une faiblesse majeure : elle ne traite pas le temps sur un pied d’égalité avec l’espace. Et cela devient intenable dès lors qu’on cherche à décrire des particules se déplaçant à des vitesses relativistes, ou interagissant à de très hautes énergies.
Les tentatives de Sommerfeld, De Broglie et Schrödinger ont permis d’ouvrir la voie à une mécanique quantique relativiste. Mais elles ont échoué à construire un formalisme pleinement cohérent :
- Sommerfeld a introduit la relativité dans un cadre semi-classique inadapté ;
- De Broglie et Schrödinger ont proposé une équation relativiste (Klein-Gordon), mais inapte à décrire des particules stables avec une interprétation probabiliste claire ;
- L’équation de Schrödinger, bien que très efficace, reste inapplicable aux particules relativistes.
C’est Paul Dirac, en 1928, qui franchira un cap décisif avec son équation relativiste de l’électron, respectant la covariance relativiste et intégrant naturellement le spin. Mais même l’équation de Dirac, comme nous le verrons ensuite, ne suffit pas pour décrire la création ou l’annihilation de particules. Elle conduit inévitablement à l’idée que le nombre de particules ne peut plus être une grandeur conservée, et qu’il faut revoir toute la fondation du formalisme. C’est cette rupture qui conduira à la théorie quantique des champs, dans laquelle on ne quantifie plus des particules individuelles, mais des champs répartis dans l’espace-temps.
Création et annihilation de particules
La mécanique quantique telle qu’elle a été formulée entre 1925 et 1928 (par Schrödinger, Heisenberg, Dirac, etc.) repose sur une idée centrale : celle d’un système quantique composé d’un nombre fixe de particules, chacune étant décrite par une fonction d’onde, ou un vecteur d’état dans un espace de Hilbert.
Mais dès les années 1930, plusieurs phénomènes expérimentaux, notamment issus de la physique nucléaire et de l’observation des rayons cosmiques ont révélé que ce cadre était trop restreint pour décrire certains événements fondamentaux de la nature. Parmi ces phénomènes, citons trois exemples :
▪ La désintégration bêta (β−) : Un neutron isolé se transforme en un proton, un électron et un antineutrino :
\[\ \ n\ \overset{\ }{\rightarrow}p + e^{-} + \overline{{\ \vartheta}_{e\ }}\]
Ce processus change la nature des particules en présence, il crée deux particules (e⁻ et ν̄) à partir d’une initiale (le neutron). Or la mécanique quantique standard ne permet pas de décrire un état initial avec une particule unique se transformant en un état final avec trois particules différentes.
▪ L’annihilation électron-positron en deux photons :
\[e^{-} + \ e^{+}\ \overset{\ }{\rightarrow}\ \ \gamma\ + \ \gamma\]
Deux particules matérielles disparaissent pour donner naissance à deux photons. Il s’agit d’un phénomène commun dans les expériences de haute énergie, mais il sort complètement du cadre de la mécanique quantique où les particules sont supposées indestructibles et éternelles.
▪ La production de paires électron / positron :
\[\gamma\ + noyau\overset{\ }{\rightarrow}\ e^{-} + \ e^{+}\ \]
Ici, un photon de haute énergie donne naissance à une paire de particules massives, dès lors qu’il interagit avec un noyau atomique. Ce processus nécessite une théorie dans laquelle le nombre de particules n’est pas conservé, contrairement à la mécanique quantique traditionnelle.
Plusieurs raisons expliquent pourquoi la mécanique quantique ne peut pas rendre compte ces phénomènes. La première raison tient au fait que le nombre de particules est figé. Ainsi, dans la mécanique quantique usuelle (non relativiste), on considère soit une particule unique dans un espace de Hilbert \(\mathcal{H}\) (ex : atome d’hydrogène), soit un système de N particules dans l’espace \(\mathcal{H}^{\otimes N}\) (produit tensoriel de N espaces de Hilbert), avec N fixé.
Or, tous les processus que nous venons de décrire impliquent des changements dans le nombre de particules. Il faut donc un formalisme dans lequel les états du système peuvent contenir 0, 1, 2, …, N, voire une infinité de particules, selon les interactions.
C’est ce que permet la seconde quantification, cœur de la théorie quantique des champs, où les états sont décrits dans un espace de Fock, noté \(\mathcal{F\ }\):
\[\mathcal{\ \ F =}\mathbb{C}\mathcal{\ \ \oplus \ H\ \oplus}\left( \mathcal{\ H\ \otimes \ H\ } \right)\ + \left( \mathcal{\ H\ \otimes \ H \otimes \ H\ } \right)\ \ \ldots\]
La deuxième raison, est qu’il n’existe pas d’opérateurs de création et d’annihilation dans la mécanique quantique standard. Les seuls opérateurs fondamentaux en mécanique quantique non relativiste sont les opérateurs d’observables (position, impulsion, spin, énergie…). Mais pour décrire une situation où une particule apparaît ou disparaît, il faut des opérateurs qui changent le nombre de particules du système, l’opérateur de création qui ajoute une particule dans un état donné et l’opérateur d’annihilation qui en retire une . Ces opérateurs n’ont aucun sens dans une mécanique quantique à nombre de particules fixe. Leur introduction suppose une réinterprétation radicale du rôle de la fonction d’onde : ce n’est plus une simple description de particules individuelles, mais un champ quantique, qui peut créer ou détruire des quanta d’énergie.
Enfin la dernière raison tient à la description mathématique des interactions entre particules. Les phénomènes de création/annihilation ne peuvent pas être décrits uniquement par des équations d’évolution unitaire comme celle de Schrödinger car l’Hamiltonien doit maintenant permettre des transitions entre états de nombre de particules différent.
Cela nécessite d’introduire un Hamiltonien d’interaction entre champs quantiques, ce qui sort du cadre de la mécanique quantique pour entrer dans celui des théories des champs interactifs, comme la QED (électrodynamique quantique) ou la QCD (chromodynamique quantique). La théorie quantique des champs remplace donc les particules comme entités fondamentales par des champs quantiques (par exemple, le champ électron, le champ photon, le champ Higgs…). Les quanta de ces champs sont les particules, et l’apparition ou la disparition de ces quanta correspond physiquement à la création ou annihilation de particules. Ainsi, dans ce cadre :
- La désintégration bêta devient l’interaction entre le champ du neutron, du proton, du neutrino et de l’électron ;
- L’annihilation électron-positron devient une interaction entre le champ électron et le champ électromagnétique ;
- Les collisions à haute énergie deviennent des processus d’échange de quanta entre champs.
Indistinguabilité fondamentale des particules
Dans le formalisme standard de la mécanique quantique, un système composé de plusieurs particules est modélisé par un produit tensoriel des espaces de Hilbert associés à chaque particule. Par exemple, pour deux particules (1) et (2) de même type, on considère :
\[\ \mathcal{H}_{Total}\ \ = \ \ \mathcal{H}_{1}\ \otimes \ \mathcal{H}_{2}\]
Ce cadre semble, en apparence, suffisant pour décrire un système multi-particulaire. Mais il présente une limite conceptuelle fondamentale : il suppose que chaque particule a une identité propre, que l’on peut suivre, individuellement, au cours du temps. Or cette vision est incompatible avec l’indiscernabilité quantique.
L’expérience montre que tous les électrons de l’Univers ont rigoureusement la même masse, la même charge, le même spin et qu’on ne peut pas « suivre » un électron particulier au sein d’un nuage électronique, comme on le ferait pour une boule de billard sur une table. Autrement dit, les particules indiscernables ne doivent pas être distinguables par l’étiquetage utilisé dans la mécanique classique ou dans la mécanique quantique. Or dans le formalisme standard de la mécanique quantique, on peut écrire un état du type :
\[\text{/}\ \psi > \ \ = \ \text{/}\ \psi_{1} > \ \otimes \ \text{/}{\ \psi}_{2} > \ \ \ \ \]
Ce qui suppose implicitement que la particule 1 est dans l’état ψ₁, et la particule 2 dans l’état ψ₂, ce qui viole l’idée même d’indiscernabilité. Pour remédier à cela, on impose un principe de symétrisation des états, qui devient un postulat fondamental en mécanique quantique. On introduit le fait qu’il existe deux classes fondamentales de particules :
- Les bosons (spin entier) : leur fonction d’onde est symétrique lors de l’échange de deux particules :
\[\psi\left( x_{1},x_{2} \right) = \psi\left( x_{2},x_{1} \right)\]
Ce qui se traduit par le fait que plusieurs bosons peuvent occuper le même état quantique (principe à l’origine du laser ou de la condensation de Bose-Einstein).
- Les fermions (spin demi-entier) : leur fonction d’onde est antisymétrique :
\[\psi\left( x_{1},x_{2} \right) = – \psi\left( x_{2},x_{1} \right)\]
Ce qui traduit le fait que deux fermions ne peuvent pas être dans le même état quantique : c’est le principe de Pauli, qui structure toute la chimie et la physique des solides.
Mais ce traitement de l’indiscernabilité est ajouté a posteriori, par une contrainte sur la forme de la fonction d’onde. Ce n’est pas quelque chose de naturellement intégré dans le formalisme lui-même. La théorie quantique des champs corrige cette faiblesse en adoptant un point de vue radicalement différent : ce ne sont plus les particules qui sont fondamentales, mais les champs.
- Chaque type de particule correspond à un champ quantique fondamental (champ électron, champ photon, champ neutrino, etc.).
- Les particules sont des excitations quantifiées de ces champs.
- La statistique des particules (boson/fermion) résulte naturellement de la nature des opérateurs de création/annihilation : les opérateurs commutatifs représentent des bosons et les opérateurs anticommutatifs des fermions.
Dans ce formalisme, l’état du système n’est plus un vecteur dans un espace \(\mathcal{H}^{\otimes N}\), mais dans un espace de Fock, qui regroupe tous les états à N particules indistinguables :
\[\mathcal{\ \ F = \ \ }_{n = 0}^{\infty}{\oplus \ }\ \mathcal{H}_{Symétrisé\ ou\ anti – symétrisé}^{(n)}\ \]
L’indiscernabilité des particules n’est plus une contrainte ajoutée, elle est intrinsèquement intégrée à la structure de la théorie. Ce changement de paradigme entraîne une conséquence conceptuelle majeure. Les particules ne sont plus des entités individualisées, mais les manifestations locales et quantifiées d’un champ sous-jacent. Ainsi tous les électrons sont identiques parce qu’ils sont des quanta du même champ électronique et toutes les propriétés des particules (masse, charge, spin) sont des propriétés du champ, et non de l’ »individu ». La théorie quantique des champs offre donc une explication naturelle à l’uniformité de la matière dans l’univers — chose qui, dans la mécanique quantique standard, reste inexpliquée.
La mécanique quantique non relativiste, malgré ses succès initiaux, s’avère donc insuffisante pour décrire les phénomènes du monde subatomique : elle viole les principes de relativité, ne permet pas les changements de nombre de particules, et reste muette sur la nature collective et indistinguable des particules fondamentales.
La théorie quantique des champs (QFT) constitue la réponse à ces limites. Elle repose sur l’idée que les entités fondamentales ne sont plus les particules, mais des champs quantiques, dont les particules sont les manifestations ponctuelles. Ces champs obéissent à des équations compatibles avec la relativité, et intègrent naturellement la possibilité de création / annihilation.
L’élaboration de la QFT, amorcée par l’équation relativiste de Dirac, puis développée à travers la seconde quantification, conduit à une reformulation complète de la physique des particules. Ce cadre théorique a permis la construction du Modèle Standard, qui reste aujourd’hui la meilleure description expérimentale des interactions fondamentales.
Conclusion
La mécanique quantique a constitué une révolution intellectuelle majeure en permettant de décrire avec une précision inédite la structure des atomes, les niveaux d’énergie quantifiés, les phénomènes d’interférence ou encore l’effet tunnel. Dans sa formulation initiale, elle a profondément renouvelé notre compréhension du monde microscopique. Mais ses succès mêmes ont rapidement mis en évidence ses limites : conçue pour un nombre fixé de particules évoluant dans un cadre non relativiste, elle ne pouvait suffire à décrire la réalité du monde subatomique révélée par les expériences du 20ème siècle.
Trois difficultés fondamentales se sont imposées. La première est l’incompatibilité avec la relativité restreinte, qui exige une description covariante de l’espace et du temps. La deuxième est l’impossibilité de traiter correctement les processus de création et d’annihilation de particules, pourtant omniprésents dans les phénomènes nucléaires et dans les collisions de haute énergie. La troisième est l’absence d’une explication intrinsèque de l’indistinguabilité des particules, que le formalisme quantique standard ne fait qu’imposer de l’extérieur, sans l’intégrer à sa structure profonde.
La théorie quantique des champs répond à ces trois exigences par un changement de perspective radical. Elle abandonne l’idée que les particules seraient les objets fondamentaux de la théorie. À leur place, elle introduit des champs quantiques définis en tout point de l’espace-temps, dont les particules ne sont plus que les excitations quantifiées. Dans ce cadre, la relativité restreinte peut être respectée, les créations et annihilations deviennent des processus naturels, et l’indistinguabilité des particules résulte directement du fait qu’elles sont les quanta d’un même champ.
Ce déplacement conceptuel est considérable. Il ne s’agit pas seulement d’une extension technique de la mécanique quantique, mais d’une reformulation profonde de ce que l’on entend par matière et par interaction. La physique ne décrit plus des particules individuelles se déplaçant dans un espace vide, mais des champs en interaction, capables d’échanger de l’énergie, de produire des quanta et de se transformer les uns dans les autres. Ce nouveau langage permettra l’élaboration de l’électrodynamique quantique, puis plus généralement du modèle standard des particules.
Ainsi, le passage de la mécanique quantique à la théorie quantique des champs n’est pas un raffinement secondaire, mais une nécessité imposée par la structure même du réel microscopique. Là où la mécanique quantique décrivait encore un monde de particules, la théorie quantique des champs révèle un univers plus profond, où les champs sont premiers et les particules seulement leurs manifestations observables. C’est cette idée, aussi simple dans son principe que révolutionnaire dans ses conséquences, qui ouvre la voie à la physique contemporaine des particules et des interactions fondamentales.