Formalisme lagrangien en théorie des champs

Difficulté : ⚛⚛⚛⚛ Niveau 4 — Expert

Dans les développements précédents, nous avons introduit le calcul variationnel dans le cadre de la mécanique classique, où la dynamique d’un système est décrite par un nombre fini de degrés de liberté, représentés par des fonctions du temps. Dans ce contexte, les équations d’Euler-Lagrange permettent de déterminer les trajectoires qui rendent stationnaire une action définie comme une intégrale temporelle du Lagrangien.

Cependant, de nombreux systèmes physiques ne peuvent pas être décrits par un nombre fini de variables, mais nécessitent l’introduction de fonctions dépendant à la fois de l’espace et du temps. C’est notamment le cas en physique des milieux continus, en électromagnétisme, ou encore en physique des particules. Dans ces situations, la grandeur fondamentale n’est plus une trajectoire \(q(t)\), mais un champ \(\varphi(x,t)\), c’est-à-dire une fonction définie en tout point de l’espace et du temps.

La généralisation du calcul variationnel à ces systèmes conduit naturellement à la notion de théorie des champs. Dans ce cadre, les variables dynamiques deviennent des champs \(\phi^{a}(x^{\mu})\), dépendant des coordonnées d’espace-temps, et l’action n’est plus une intégrale sur le temps, mais une intégrale sur tout l’espace-temps. Le principe fondamental reste inchangé : les configurations physiques sont celles qui rendent l’action stationnaire sous des variations infinitésimales des champs.

L’objectif de cet article est de montrer comment le formalisme lagrangien s’étend naturellement à la théorie des champs, et de démontrer l’équation d’Euler-Lagrange associée. Nous verrons que, malgré le passage d’un nombre fini de variables à un nombre infini de degrés de liberté, la structure mathématique reste profondément analogue à celle rencontrée en mécanique analytique.

Pour généraliser le principe variationnel à une théorie quantique des champs définie sur l’espace-temps, il faut remplacer \(\varphi(x,t)\) par un ensemble fini de champs \(\phi^{a}\left( x^{\mu} \right)\mathbf{\ }\)prenant des valeurs sur l’espace-temps quadridimensionnel paramétré à l’aide des coordonnées continues quelconques \(x^{\mu}\). A titre d’exemple, lorsqu’on étudie une théorie des champs dans laquelle intervient un champ vectoriel, comme par exemple en électromagnétisme, l’indice discret \(a\) peut alors prendre quatre valeurs distinctes correspondants aux quatre composantes du champ électromagnétique. On écrit ainsi :

\[\left\{ \phi^{a}\left( x^{\mu} \right) \right\}\ = \ \left\{ A^{0},\ A^{1},\ A^{2},\ A^{3} \right\}\]

Pour un ensemble de champs, on écrit l’action sous la forme d’une intégrale sur une région de l’espace-temps d’une fonction \(\mathcal{L}\), nommée densité lagrangienne qui dépend des champs \(\phi^{a}\ \) et de leurs dérivées. Dans notre calcul, on suppose que la théorie est locale, c’est-à-dire que l’action ne comporte pas de dérivées d’ordre supérieur à 1 (mais on pourrait aller à l’ordre supérieur). L’action s’écrit alors sous la forme :

\[S\ = \ \int_{}^{}{\mathcal{L\ }\left( \phi^{a},\ \partial_{\mu}\phi^{a} \right)}\ d^{4}x\]

Nous allons maintenant déterminer les équations d’Euler-Lagrange pour un ensemble de champs \(\phi^{a}\) en imposant que l’action soit stationnaire sous de petites perturbations du type :

\[\phi^{a}(x) \rightarrow {\phi’}^{a}(x) = \phi^{a}(x) + \delta\phi^{a}(x)\]

La dérivée première des champs se transforme de la même façon :

\[{\partial_{\mu}\phi}^{a} \rightarrow \partial_{\mu}{\phi’}^{a} = {\partial_{\mu}\phi}^{a} + \partial_{\mu}\left( \delta\phi^{a} \right)\]

Or l’opérateur de perturbation commute avec la dérivation. On a en effet :

\[\partial_{\mu}\left( \delta\phi^{a} \right) = \partial_{\mu}\left( {\phi’}^{a} – \phi^{a} \right) = \partial_{\mu}{\phi’}^{a} – {\partial_{\mu}\phi}^{a} = \delta\left( {\partial_{\mu}\phi}^{a} \right)\]

On peut alors définir une perturbation infinitésimale de l’action en fonction des perturbations des champs et de leurs dérivées :

\[\delta S\ = \ \int_{}^{}{\delta\mathcal{L\ }\left( \phi^{a},\ \partial_{\mu}\phi^{a} \right)}\ d^{4}x = \int_{}^{}\left\lbrack \frac{\partial\mathcal{L}}{\partial\phi^{a}}\ \delta\phi^{a}\ + \ \frac{\partial\mathcal{L}}{\partial\left( {\partial_{\mu}\phi}^{a} \right)}\ \delta\left( {\partial_{\mu}\phi}^{a} \right)\ \right\rbrack d^{4}x\]

En utilisant la relation de commutation, on a alors :

\[\delta S\ = \ \int_{}^{}\left\lbrack \frac{\partial\mathcal{L}}{\partial\phi^{a}}\ \delta\phi^{a}\ + \ \frac{\partial\mathcal{L}}{\partial\left( {\partial_{\mu}\phi}^{a} \right)}\ \partial_{\mu}\left( {\delta\phi}^{a} \right)\ \right\rbrack d^{4}x\]

A l’image de ce que l’on fait en mécanique analytique classique, on va procéder à une intégration par parties du deuxième terme :

\[\int_{}^{}{\frac{\partial\mathcal{L}}{\partial\left( {\partial_{\mu}\phi}^{a} \right)}\ \partial_{\mu}\left( {\delta\phi}^{a} \right)}d^{4}x\ = \ \int_{}^{}{\partial_{\mu}\left\lbrack \frac{\partial\mathcal{L}}{\partial\left( {\partial_{\mu}\phi}^{a} \right)}\ {\delta\phi}^{a} \right\rbrack}d^{4}x\ – \ \int_{}^{}{\partial_{\mu}\left\lbrack \frac{\partial\mathcal{L}}{\partial\left( {\partial_{\mu}\phi}^{a} \right)}\ \right\rbrack\ {\delta\phi}^{a}}d^{4}x\ \]

La première intégrale du membre de droite est ce qu’on appelle une divergence, c’est-à-dire une dérivée totale dans l’espace-temps. En effet, le terme

\[\partial_{\mu}\left\lbrack \frac{\partial\mathcal{L}}{\partial\left( \partial_{\mu}\phi^{a} \right)}\text{ }\delta\phi^{a} \right\rbrack\]

correspond à la divergence d’un vecteur de composantes :

\[J^{\mu} = \frac{\partial\mathcal{L}}{\partial\left( \partial_{\mu}\phi^{a} \right)}\text{ }\delta\phi^{a}\]

On peut donc réécrire cette intégrale sous la forme :

\[\int\partial_{\mu}J^{\mu}\text{ }d^{4}x\]

Selon le théorème de la divergence de Gauss généralisé à l’espace-temps (également appelé théorème de Stokes en dimension supérieure), cette intégrale volumique peut être transformée en une intégrale de surface sur le bord \(\partial\Omega\ \)de la région d’espace-temps \(\Omega\ \)sur laquelle on intègre :

\[\int_{\Omega}^{}\partial_{\mu}J^{\mu}\text{ }d^{4}x = \int_{\partial\Omega}^{}J^{\mu}\text{ }d\Sigma_{\mu}\]

Où \(d\Sigma_{\mu}\ \)désigne l’élément de surface orienté de l’hypersurface frontière.

En remplaçant \(J^{\mu}\ \)par son expression, on obtient :

\[\int_{\Omega}^{}\partial_{\mu}\left\lbrack \frac{\partial\mathcal{L}}{\partial\left( \partial_{\mu}\phi^{a} \right)}\text{ }\delta\phi^{a} \right\rbrack d^{4}x = \int_{\partial\Omega}^{}\frac{\partial\mathcal{L}}{\partial\left( \partial_{\mu}\phi^{a} \right)}\text{ }\delta\phi^{a}\text{ }d\Sigma_{\mu}\]

Or, comme en mécanique analytique classique, on impose que les variations du champ \(\delta\phi^{a\ }\)s’annulent sur le bord de la région d’espace-temps considérée, c’est-à-dire :

\[\delta\phi^{a} \mid_{\partial\Omega} = 0\]

Cette condition entraîne immédiatement que l’intégrale de surface est nulle, et donc que le terme de divergence ne contribue pas à la variation de l’action.

On peut alors écrire la perturbation infinitésimale de l’action par :

\[\delta S\ = \ \int_{}^{}{\left\{ \frac{\partial\mathcal{L}}{\partial\phi^{a}}\ – \ \partial_{\mu}\left\lbrack \frac{\partial\mathcal{L}}{\partial\left( {\partial_{\mu}\phi}^{a} \right)}\ \right\rbrack\ \right\}{\ \delta\phi}^{a}\ d^{4}x\ \ \ \ \ \ }\]

Pour que l’action soit stationnaire sous des perturbations quelconques \({\ \delta\phi}^{a}\) de \(\phi^{a}\), on doit alors avoir :

\[\frac{\mathbf{\partial}\mathcal{L}}{\mathbf{\partial}\mathbf{\phi}^{\mathbf{a}}}\mathbf{\ – \ }\mathbf{\partial}_{\mathbf{\mu}}\left\lbrack \frac{\mathbf{\partial}\mathcal{L}}{\mathbf{\partial}\left( {\mathbf{\partial}_{\mathbf{\mu}}\mathbf{\phi}}^{\mathbf{a}} \right)}\mathbf{\ } \right\rbrack\mathbf{\ = 0}\]

Et on retrouve l’équation d’Euler-Lagrange pour les champs.

La généralisation du formalisme lagrangien à la théorie des champs met en évidence la remarquable robustesse du principe variationnel. En passant d’un système à un nombre fini de degrés de liberté à un système décrit par des champs dépendant de l’espace-temps, la structure des équations d’Euler-Lagrange se conserve, au prix d’une extension naturelle des dérivées ordinaires aux dérivées partielles.

L’équation obtenue constitue le point de départ de nombreuses théories fondamentales de la physique. Elle permet notamment de dériver les équations de Maxwell en électromagnétisme, les équations de Klein-Gordon pour les champs scalaires, ou encore les équations de Dirac pour les champs de fermions. Ainsi, une large partie de la physique moderne peut être formulée à partir d’un principe unique : la stationnarité de l’action.

Au-delà de son efficacité formelle, cette approche révèle une unité profonde des lois physiques. Qu’il s’agisse du mouvement d’une particule ou de l’évolution d’un champ sur l’espace-temps, les équations fondamentales apparaissent comme les conséquences d’un même principe d’optimalité. Cette idée, déjà présente en mécanique analytique, trouve dans la théorie des champs une expression particulièrement riche, et constitue l’un des fondements conceptuels de la physique contemporaine.

Laisser un commentaire