CommeUnJeu · L2 MP
Réduction : éléments propres, diagonalisation
Étant donné un endomorphisme \(u\) d'un espace vectoriel \(E\), la réduction cherche une base de \(E\) dans laquelle la matrice de \(u\) est la plus simple possible --- idéalement diagonale, de sorte que \(u\) ne fasse que dilater chaque vecteur de base. Ce chapitre construit les deux outils qui décident si une telle base existe. Le premier est géométrique : les éléments propres de \(u\) --- les directions que \(u\) se contente de dilater. Le second est algébrique : le polynôme caractéristique, qui transforme la question « \(\lambda\) est-elle une valeur propre ? » en « \(\lambda\) est-elle une racine ? ».
Les résultats phares sont au nombre de trois. Un endomorphisme est diagonalisable exactement lorsque \(E\) est la somme directe de ses sous-espaces propres --- de façon équivalente, lorsque son polynôme caractéristique est scindé et que chaque sous-espace propre a la dimension attendue. Il est trigonalisable (une matrice triangulaire) exactement lorsque son polynôme caractéristique est scindé. Et un endomorphisme nilpotent est précisément un endomorphisme trigonalisable dont \(0\) est l'unique valeur propre.
Les résultats phares sont au nombre de trois. Un endomorphisme est diagonalisable exactement lorsque \(E\) est la somme directe de ses sous-espaces propres --- de façon équivalente, lorsque son polynôme caractéristique est scindé et que chaque sous-espace propre a la dimension attendue. Il est trigonalisable (une matrice triangulaire) exactement lorsque son polynôme caractéristique est scindé. Et un endomorphisme nilpotent est précisément un endomorphisme trigonalisable dont \(0\) est l'unique valeur propre.
Conventions
Tout au long de ce chapitre, \(\mathbb{K}\) est un sous-corps de \(\mathbb{C}\) et \(E\) est un \(\mathbb{K}\)-espace vectoriel de dimension finie, non nul, avec \(n = \dim E \ge 1\). On note \(u \in \mathcal{L}(E)\) un endomorphisme, \(M \in \mathcal{M}_n(\mathbb{K})\) une matrice carrée, \(\operatorname{Id}_E\) l'identité et \(I_n\) la matrice identité. Déterminant, trace, rang, matrices semblables et matrice d'un endomorphisme dans une base sont ceux de Déterminants et Changements de bases ; polynômes, racines, multiplicité et polynômes scindés ceux de Polynômes ; sommes directes, sous-espaces stables et endomorphisme induit ceux de Compléments d'algèbre linéaire. Le polynôme caractéristique est défini comme \(\det(XI_n - M)\) ; son degré, son caractère unitaire et ses coefficients sont établis au § 2.
I
Éléments propres
I.1
Valeurs\(\virgule\) vecteurs\(\virgule\) sous-espaces propres
Le problème de la réduction part d'une seule observation : certains vecteurs sont simplement dilatés par \(u\). Un vecteur non nul \(x\) tel que \(u(x) = \lambda x\) conserve sa direction --- \(u\) agit sur la droite qu'il engendre comme l'homothétie de rapport \(\lambda\). Ces directions sont la matière première de la réduction : une base entièrement constituée de telles directions rend la matrice de \(u\) diagonale. Cette sous-section les nomme et rassemble leurs premières propriétés.
Définition — Valeur propre et vecteur propre
Un scalaire \(\lambda \in \mathbb{K}\) est une valeur propre de \(u\) lorsqu'il existe un vecteur \(x \neq 0_E\) tel que \(u(x) = \lambda x\). Un tel vecteur \(x\) est alors un vecteur propre de \(u\) associé à \(\lambda\). Un vecteur propre n'est, par définition, jamais le vecteur nul. Exemple — Éléments propres de trois endomorphismes familiers
Une homothétie \(\lambda_0 \operatorname{Id}_E\) admet tout vecteur non nul comme vecteur propre, tous pour l'unique valeur propre \(\lambda_0\). Un projecteur \(p\) a ses valeurs propres parmi \(0\) et \(1\) : tout vecteur de \(\operatorname{Im} p\) vérifie \(p(x) = x\) et tout vecteur de \(\operatorname{Ker} p\) vérifie \(p(x) = 0\) --- \(0\) et \(1\) apparaissent toutes deux dès que \(\operatorname{Ker} p\) et \(\operatorname{Im} p\) sont toutes deux non nulles. Une symétrie vectorielle \(s\) a ses valeurs propres parmi \(-1\) et \(1\), toutes deux présentes lorsque ses sous-espaces de vecteurs fixes et opposés sont tous deux non nuls. Définition — Sous-espace propre
Soit \(\lambda \in \mathbb{K}\). Le sous-espace propre de \(u\) associé à \(\lambda\) est $$ E_\lambda(u) = \operatorname{Ker}(u - \lambda \operatorname{Id}_E). $$ C'est un sous-espace vectoriel de \(E\), en tant que noyau d'un endomorphisme. Le scalaire \(\lambda\) est une valeur propre de \(u\) si et seulement si \(E_\lambda(u) \neq \{0_E\}\), et \(E_\lambda(u)\) est alors exactement l'ensemble des vecteurs propres associés à \(\lambda\), auquel on adjoint \(0_E\). Exemple — Un sous-espace propre comme noyau
Pour \(M = \begin{psmallmatrix} 1 & 2 \\ 2 & 1 \end{psmallmatrix}\), prenons \(\lambda = 3\) : le sous-espace propre est \(E_3 = \operatorname{Ker}(M - 3I_2) = \operatorname{Ker}\begin{psmallmatrix} -2 & 2 \\ 2 & -2 \end{psmallmatrix}\). Le système \(-2x + 2y = 0\) a pour droite de solutions \(\operatorname{Vect}(1, 1)\), donc \(E_3 = \operatorname{Vect}(1, 1)\), une droite ; \(3\) est valeur propre puisque \(E_3 \neq \{0\}\). Pour \(\lambda = 0\), \(\operatorname{Ker} M = \{0\}\) (\(M\) étant inversible), donc \(0\) n'est pas valeur propre. Définition — Spectre
Le spectre de \(u\), noté \(\operatorname{Sp}(u)\), est l'ensemble des valeurs propres de \(u\) dans \(\mathbb{K}\). Pour une matrice \(M \in \mathcal{M}_n(\mathbb{K})\) on définit de même \(\operatorname{Sp}(M)\), l'ensemble des \(\lambda \in \mathbb{K}\) pour lesquels \(MX = \lambda X\) admet une solution colonne non nulle \(X\) --- un tel \(X\) étant un vecteur propre matriciel, relié aux vecteurs propres de \(u\) par la proposition de traduction matricielle ci-dessous. Exemple — Sous-espaces propres et spectre d'une matrice diagonale
Soit \(u\) l'endomorphisme de \(\mathbb{R}^3\) de matrice \(D = \operatorname{diag}(5, 5, -2)\) dans la base canonique \((e_1, e_2, e_3)\). Alors \(u(e_1) = 5e_1\), \(u(e_2) = 5e_2\) et \(u(e_3) = -2e_3\), donc le spectre est \(\operatorname{Sp}(u) = \{5, -2\}\). Les sous-espaces propres sont \(E_5(u) = \operatorname{Vect}(e_1, e_2)\), un plan, et \(E_{-2}(u) = \operatorname{Vect}(e_3)\), une droite ; ici \(E_5(u) \oplus E_{-2}(u) = \mathbb{R}^3\).
La notion de valeur spectrale est hors programme. En dimension infinie, on distingue les valeurs propres d'un ensemble plus large de « valeurs spectrales » ; ici, en dimension finie, le spectre est simplement l'ensemble des valeurs propres et rien de plus n'est requis.
Proposition — Traduction matricielle
Soit \(\mathcal{B}\) une base de \(E\) et \(M = \operatorname{Mat}_\mathcal{B}(u)\). Un vecteur \(x\), de colonne de coordonnées \(X\) dans \(\mathcal{B}\), est un vecteur propre de \(u\) associé à \(\lambda\) si et seulement si \(X \neq 0\) et \(MX = \lambda X\). Par conséquent \(\operatorname{Sp}(u) = \operatorname{Sp}(M)\).
L'application coordonnées dans \(\mathcal{B}\) est un isomorphisme linéaire \(E \to \mathcal{M}_{n,1}(\mathbb{K})\) envoyant \(x\) sur \(X\) et \(u(x)\) sur \(MX\). Ainsi \(u(x) = \lambda x\) a lieu si et seulement si \(MX = \lambda X\), et \(x \neq 0_E\) si et seulement si \(X \neq 0\). Les deux notions de vecteur propre --- pour \(u\) et pour \(M\) --- se correspondent donc, ainsi que les deux spectres.
Proposition — La valeur propre zéro
Le scalaire \(0\) est une valeur propre de \(u\) si et seulement si \(u\) n'est pas injective, de façon équivalente --- \(E\) étant de dimension finie --- si et seulement si \(u\) n'est pas inversible.
Par définition \(0\) est valeur propre de \(u\) ssi \(E_0(u) = \operatorname{Ker}(u - 0 \cdot \operatorname{Id}_E) = \operatorname{Ker} u \neq \{0_E\}\), c'est-à-dire ssi \(u\) n'est pas injective. En dimension finie un endomorphisme est injectif si et seulement s'il est bijectif, donc c'est aussi la négation de « \(u\) inversible ».
Sens géométrique
Géométriquement, un vecteur propre marque une direction que \(u\) laisse invariante : sur la droite propre qu'il engendre, \(u\) agit comme une pure dilatation. Hors d'une telle droite, \(u\) bascule en général un vecteur vers une direction nouvelle. La figure montre une droite propre, sur laquelle \(x\) et \(u(x) = \lambda x\) restent colinéaires, à côté d'une direction ordinaire, où \(y\) et \(u(y)\) pointent différemment.
Exemple — Déterminer les éléments propres d'une matrice
Pour l'endomorphisme \(u\) de \(\mathbb{R}^3\) dont la matrice dans la base canonique est $$ M = \begin{pmatrix} 0 & 2 & -1 \\
3 & -2 & 0 \\
-2 & 2 & 1 \end{pmatrix}, $$ on montrera au § 2 que le spectre est \(\operatorname{Sp}(M) = \{1, 2, -4\}\) --- la détermination systématique des valeurs propres relève du polynôme caractéristique. En admettant ces valeurs propres, déterminer les trois sous-espaces propres.
Chaque sous-espace propre est le noyau \(E_\lambda(u) = \operatorname{Ker}(M - \lambda I_3)\). En résolvant le système \((M - \lambda I_3)X = 0\) pour chaque valeur propre donnée :
- \(\lambda = 1\) : \(E_1(u) = \operatorname{Vect}(1, 1, 1)\) ;
- \(\lambda = 2\) : \(E_2(u) = \operatorname{Vect}(4, 3, -2)\) ;
- \(\lambda = -4\) : \(E_{-4}(u) = \operatorname{Vect}(2, -3, 2)\).
Méthode — Tester si un scalaire est valeur propre
Pour décider si \(\lambda \in \mathbb{K}\) est valeur propre de \(u\) (matrice \(M\)) : \(\lambda \in \operatorname{Sp}(u)\) si et seulement si \(u - \lambda \operatorname{Id}_E\) n'est pas injective, de façon équivalente si et seulement si \(M - \lambda I_n\) n'est pas inversible, de façon équivalente si et seulement si \(\operatorname{rg}(M - \lambda I_n) < n\). Le sous-espace propre \(E_\lambda(u)\) est alors l'ensemble des solutions du système homogène \((M - \lambda I_n)X = 0\), de dimension \(n - \operatorname{rg}(M - \lambda I_n)\) par le théorème du rang. Compétences à pratiquer
- Calculer valeurs propres et vecteurs propres
I.2
Le spectre en dimension finie
Des valeurs propres distinctes tirent dans des directions indépendantes. C'est le fait structurel qui sous-tend toute la réduction : les sous-espaces propres attachés à des valeurs propres différentes ne se recoupent jamais au-delà de \(0_E\), ils sont en somme directe. Deux conséquences en découlent aussitôt --- les vecteurs propres associés à des valeurs propres distinctes forment une famille libre, et un endomorphisme d'un espace de dimension \(n\) a au plus \(n\) valeurs propres.
Theorem — Sous-espaces propres de valeurs propres distinctes en somme directe
Soient \(\lambda_1, \dots, \lambda_p\) des valeurs propres de \(u\) deux à deux distinctes. Alors la somme \(E_{\lambda_1}(u) + \dots + E_{\lambda_p}(u)\) est directe.
On raisonne par récurrence sur \(p \ge 1\).
- Initialisation. Pour \(p = 1\) il y a un seul sous-espace et rien à démontrer.
- Hérédité. Supposons le résultat acquis pour \(p\) valeurs propres deux à deux distinctes. Soient \(\lambda_1, \dots, \lambda_{p+1}\) deux à deux distinctes, et \(x_i \in E_{\lambda_i}(u)\) tels que $$ x_1 + \dots + x_p + x_{p+1} = 0_E. \tag{\(*\)} $$ En appliquant \(u\) et en utilisant \(u(x_i) = \lambda_i x_i\), on obtient \(\lambda_1 x_1 + \dots + \lambda_{p+1} x_{p+1} = 0_E\). En retranchant \(\lambda_{p+1}\) fois \((*)\) : $$ (\lambda_1 - \lambda_{p+1})x_1 + \dots + (\lambda_p - \lambda_{p+1})x_p = 0_E. $$ Par hypothèse de récurrence la somme \(E_{\lambda_1} + \dots + E_{\lambda_p}\) est directe, donc chaque terme est nul : \((\lambda_i - \lambda_{p+1})x_i = 0_E\) pour \(i \le p\). Comme \(\lambda_i \neq \lambda_{p+1}\), cela force \(x_i = 0_E\) pour \(i \le p\). En reportant dans \((*)\), on obtient aussi \(x_{p+1} = 0_E\). La décomposition de \(0_E\) est triviale, donc la somme des \(p+1\) sous-espaces propres est directe.
Proposition — Vecteurs propres de valeurs propres distinctes libres
Une famille de vecteurs propres de \(u\) associés à des valeurs propres deux à deux distinctes est libre.
Soient \(x_1, \dots, x_p\) des vecteurs propres associés à des valeurs propres deux à deux distinctes \(\lambda_1, \dots, \lambda_p\), et supposons \(\alpha_1 x_1 + \dots + \alpha_p x_p = 0_E\). Chaque \(\alpha_i x_i\) appartient à \(E_{\lambda_i}(u)\), et la somme de ces sous-espaces propres est directe par le théorème précédent, donc \(\alpha_i x_i = 0_E\) pour tout \(i\). Comme \(x_i \neq 0_E\), on en tire \(\alpha_i = 0\) pour tout \(i\). La famille est libre.
Proposition — Le spectre est fini
Le spectre \(\operatorname{Sp}(u)\) est fini, avec \(\#\operatorname{Sp}(u) \le n = \dim E\).
Supposons que \(u\) ait \(n + 1\) valeurs propres deux à deux distinctes \(\lambda_1, \dots, \lambda_{n+1}\). En choisissant un vecteur propre \(x_i\) pour chacune, la famille \((x_1, \dots, x_{n+1})\) est libre par la proposition précédente. Or une famille libre de \(E\) compte au plus \(\dim E = n\) vecteurs --- contradiction. Donc \(u\) a au plus \(n\) valeurs propres distinctes : \(\operatorname{Sp}(u)\) est fini, avec \(\#\operatorname{Sp}(u) \le n\).
Exemple — Un endomorphisme avec le nombre maximal de valeurs propres
L'endomorphisme de la réponse précédente a pour spectre \(\{1, 2, -4\}\), trois valeurs propres pour \(n = 3\) --- la borne \(\#\operatorname{Sp}(u) \le n\) est atteinte. Ses trois vecteurs propres \((1,1,1)\), \((4,3,-2)\), \((2,-3,2)\) forment une famille libre, donc une base de \(\mathbb{R}^3\).
Pourquoi la dimension finie compte
Une brève parenthèse, hors de la convention de dimension finie du chapitre. Sur l'espace \(\mathcal{C}^\infty(\mathbb{R})\) des fonctions lisses, la dérivation \(f \mapsto f'\) admet toute valeur réelle \(\lambda\) comme valeur propre : la fonction \(x \mapsto e^{\lambda x}\) vérifie \(f' = \lambda f\). Son spectre est \(\mathbb{R}\) tout entier, infini. La finitude du spectre est donc bien un phénomène de dimension finie, reposant sur la borne « une famille libre compte au plus \(n\) vecteurs ».
Proposition — Endomorphismes qui commutent
Soient \(u, v \in \mathcal{L}(E)\) avec \(u \circ v = v \circ u\). Alors tout sous-espace propre \(E_\lambda(u)\) est stable par \(v\).
De \(u \circ v = v \circ u\) on tire \((u - \lambda \operatorname{Id}_E) \circ v = v \circ (u - \lambda \operatorname{Id}_E)\), donc \(u - \lambda \operatorname{Id}_E\) et \(v\) commutent. Par la stabilité des noyaux d'endomorphismes qui commutent --- rappelée de Compléments d'algèbre linéaire --- le noyau \(E_\lambda(u) = \operatorname{Ker}(u - \lambda \operatorname{Id}_E)\) est stable par \(v\).
Proposition — Matrices semblables et spectre
Deux matrices semblables ont le même spectre : si \(A \sim B\) dans \(\mathcal{M}_n(\mathbb{K})\), alors \(\operatorname{Sp}(A) = \operatorname{Sp}(B)\).
Écrivons \(B = P^{-1}AP\) avec \(P \in \operatorname{GL}_n(\mathbb{K})\). Si \(\lambda \in \operatorname{Sp}(B)\), prenons \(X \neq 0\) avec \(BX = \lambda X\). Alors \(A(PX) = P(BX) = \lambda(PX)\), et \(PX \neq 0\) puisque \(P\) est inversible, donc \(\lambda \in \operatorname{Sp}(A)\). Ainsi \(\operatorname{Sp}(B) \subseteq \operatorname{Sp}(A)\) ; en échangeant les rôles de \(A\) et \(B\) (via \(A = PBP^{-1}\)) on obtient l'inclusion réciproque.
Exemple — Un sous-espace propre stable par un endomorphisme qui commute
Soit \(u\) ayant \(n\) valeurs propres distinctes et \(v\) commutant avec \(u\). Comme \(u\) a \(n\) valeurs propres distinctes, ses \(n\) vecteurs propres forment une base et chaque sous-espace propre \(E_\lambda(u)\) est une droite propre. Chaque droite est stable par \(v\), donc \(v\) envoie tout vecteur propre de \(u\) sur un multiple de lui-même : \(v\) est lui-même diagonal dans la base propre de \(u\). Commuter avec un endomorphisme fixé à \(n\) valeurs propres distinctes force ainsi une base propre commune --- un premier aperçu de la réduction simultanée. Compétences à pratiquer
- Utiliser la somme directe des sous-espaces propres
II
Le polynôme caractéristique
II.1
Définition et premières propriétés
Chercher les valeurs propres à la main --- tester chaque scalaire \(\lambda\) pour la non-inversibilité de \(u - \lambda \operatorname{Id}_E\) --- est sans espoir : il y a une infinité de candidats. La sortie consiste à faire de \(\lambda\) une variable. Le déterminant \(\det(XI_n - M)\) est un polynôme en \(X\), et ses racines situées dans \(\mathbb{K}\) sont exactement les valeurs propres. Ce polynôme caractéristique convertit une recherche infinie en un calcul fini.
Proposition — Valeur propre et déterminant nul
Un scalaire \(\lambda \in \mathbb{K}\) est valeur propre de \(u\) si et seulement si \(\det(u - \lambda \operatorname{Id}_E) = 0\).
\(\lambda\) est valeur propre ssi \(E_\lambda(u) = \operatorname{Ker}(u - \lambda \operatorname{Id}_E) \neq \{0_E\}\), c'est-à-dire ssi \(u - \lambda \operatorname{Id}_E\) n'est pas injective. En dimension finie un endomorphisme est injectif ssi il est inversible, et un endomorphisme est inversible ssi son déterminant est non nul. Donc « \(u - \lambda \operatorname{Id}_E\) non injective » équivaut à « \(\det(u - \lambda \operatorname{Id}_E) = 0\) ».
Définition — Polynôme caractéristique d'une matrice
Le polynôme caractéristique de \(M \in \mathcal{M}_n(\mathbb{K})\) est $$ \chi_M = \det(XI_n - M). $$ C'est un élément de \(\mathbb{K}[X]\) obtenu en développant le déterminant de la matrice \(XI_n - M\), dont les coefficients sont des polynômes de degré au plus \(1\). Exemple — Polynôme caractéristique d'une petite matrice
Pour \(M = \begin{psmallmatrix} 1 & 2 \\ 3 & 2 \end{psmallmatrix}\), $$ \chi_M = \det\begin{pmatrix} X-1 & -2 \\
-3 & X-2 \end{pmatrix} = (X-1)(X-2) - 6 = X^2 - 3X - 4 = (X-4)(X+1), $$ donc \(\operatorname{Sp}(M) = \{4, -1\}\). Le coefficient de \(X\) vaut \(-3 = -\operatorname{tr}(M)\) et le terme constant \(-4 = \det(M)\) --- anticipant le théorème sur le degré et les coefficients ci-dessous. Proposition — Invariance par similitude
Si \(A \sim B\) dans \(\mathcal{M}_n(\mathbb{K})\), alors \(\chi_A = \chi_B\).
Écrivons \(B = P^{-1}AP\) avec \(P \in \operatorname{GL}_n(\mathbb{K})\). On raisonne par évaluation, pour rester dans la théorie du déterminant sur le corps \(\mathbb{K}\). Pour tout scalaire \(x \in \mathbb{K}\), $$ \begin{aligned} \chi_B(x) &= \det(xI_n - P^{-1}AP) && \text{(définition de \(\chi_B\))} \\
&= \det\big(P^{-1}(xI_n - A)P\big) && \text{(\(xI_n = P^{-1}(xI_n)P\))} \\
&= \det(P^{-1})\det(xI_n - A)\det(P) && \text{(multiplicativité de \(\det\))} \\
&= \det(xI_n - A) = \chi_A(x) && \text{(\(\det(P^{-1})\det(P) = 1\)).} \end{aligned} $$ Les polynômes \(\chi_A\) et \(\chi_B\) coïncident donc en tout point de l'ensemble infini \(\mathbb{K}\), donc sont égaux.
Définition — Polynôme caractéristique d'un endomorphisme
Le polynôme caractéristique de \(u \in \mathcal{L}(E)\) est \(\chi_u = \chi_M\), où \(M\) est la matrice de \(u\) dans une base quelconque de \(E\). Cela ne dépend pas de la base : deux telles matrices sont semblables, et des matrices semblables ont le même polynôme caractéristique. Exemple — Le polynôme caractéristique ne voit pas la base
Soit \(u\) l'endomorphisme de \(\mathbb{R}^2\) de matrice \(A = \begin{psmallmatrix} 1 & 2 \\ 3 & 2 \end{psmallmatrix}\) dans la base canonique. Les vecteurs \((2, 3)\) et \((1, -1)\) vérifient \(A\begin{psmallmatrix}2\\3\end{psmallmatrix} = \begin{psmallmatrix}8\\12\end{psmallmatrix} = 4\begin{psmallmatrix}2\\3\end{psmallmatrix}\) et \(A\begin{psmallmatrix}1\\-1\end{psmallmatrix} = \begin{psmallmatrix}-1\\1\end{psmallmatrix} = -\begin{psmallmatrix}1\\-1\end{psmallmatrix}\), donc dans la base \(\big((2,3),\,(1,-1)\big)\) la matrice de \(u\) est \(D = \operatorname{diag}(4, -1)\), semblable à \(A\). Les deux donnent \(\chi_u = X^2 - 3X - 4\) --- lu sur \(A\) comme \((X-1)(X-2)-6\), et sur \(D\) aussitôt comme \((X-4)(X+1)\). Le polynôme caractéristique de \(u\) est un seul objet, calculable via n'importe quelle matrice de \(u\). Theorem — Les valeurs propres sont les racines du polynôme caractéristique
Un scalaire \(\lambda \in \mathbb{K}\) est valeur propre de \(u\) si et seulement si \(\chi_u(\lambda) = 0\). Le spectre de \(u\) est l'ensemble des racines de \(\chi_u\) situées dans \(\mathbb{K}\).
Fixons une base et soit \(M\) la matrice de \(u\). En évaluant \(\chi_u = \det(XI_n - M)\) en \(\lambda\), on obtient \(\chi_u(\lambda) = \det(\lambda I_n - M)\). Or \(\lambda I_n - M = -(M - \lambda I_n)\), et le déterminant est \(n\)-linéaire en les colonnes, donc \(\det(\lambda I_n - M) = (-1)^n \det(M - \lambda I_n)\) --- les deux s'annulent ensemble. Par la proposition sur le déterminant nul, \(\det(M - \lambda I_n) = 0\) exactement lorsque \(\lambda\) est valeur propre de \(u\). Donc \(\chi_u(\lambda) = 0 \iff \lambda \in \operatorname{Sp}(u)\).
Theorem — Degré et coefficients du polynôme caractéristique
Pour \(M \in \mathcal{M}_n(\mathbb{K})\), le polynôme \(\chi_M\) est unitaire de degré \(n\), et $$ \chi_M = X^n - \operatorname{tr}(M)\, X^{n-1} + \dots + (-1)^n \det(M). $$
Développons \(\chi_M = \det(XI_n - M)\) par la formule de permutation : $$ \chi_M = \sum_{\sigma \in \mathfrak{S}_n} \varepsilon(\sigma) \prod_{i=1}^n \big(X\delta_{\sigma(i),i} - m_{\sigma(i),i}\big), $$ où \(\delta\) est le symbole de Kronecker.
- Degré \(n\) et unitaire. Un facteur fournit un \(X\) seulement lorsque \(\sigma(i) = i\). Un terme de degré \(n\) requiert donc \(\sigma(i) = i\) pour tout \(i\), soit \(\sigma = \operatorname{id}\). Ce terme est \(\prod_{i=1}^n (X - m_{i,i})\), de degré \(n\) et de coefficient dominant \(1\). Donc \(\chi_M\) est unitaire de degré \(n\).
- Coefficient de \(X^{n-1}\). Une permutation fixant exactement \(n-1\) indices les fixe tous, donc seul \(\sigma = \operatorname{id}\) contribue au degré \(n-1\). En développant \(\prod_{i=1}^n (X - m_{i,i})\) on obtient \(X^n - (m_{1,1} + \dots + m_{n,n})X^{n-1} + \dots = X^n - \operatorname{tr}(M)X^{n-1} + \dots\)
- Terme constant. Il vaut \(\chi_M(0) = \det(-M) = (-1)^n \det(M)\).
Exemple — Polynôme caractéristique d'une matrice triangulaire
Si \(T\) est triangulaire supérieure de coefficients diagonaux \(d_1, \dots, d_n\), alors \(XI_n - T\) est triangulaire supérieure de diagonale \(X - d_1, \dots, X - d_n\), donc $$ \chi_T = \prod_{i=1}^n (X - d_i). $$ Le spectre d'une matrice triangulaire se lit directement sur sa diagonale : \(\operatorname{Sp}(T) = \{d_1, \dots, d_n\}\). Méthode — Calculer le polynôme caractéristique et le spectre
Pour trouver les valeurs propres de \(u\) donné par une matrice \(M\) : former \(XI_n - M\), calculer \(\chi_M = \det(XI_n - M)\) --- par développement selon une rangée, ou en ajoutant à une ligne (ou colonne) un multiple dans \(\mathbb{K}[X]\) d'une autre, opérations valides sur l'anneau \(\mathbb{K}[X]\) ; éviter de diviser une rangée par un polynôme non constant --- puis factoriser \(\chi_M\). Les valeurs propres sont les racines de \(\chi_M\) dans \(\mathbb{K}\). Les coefficients de degré \(n-1\) et constant, \(-\operatorname{tr}(M)\) et \((-1)^n\det(M)\), fournissent une vérification rapide du calcul. Compétences à pratiquer
- Calculer le polynôme caractéristique
II.2
Multiplicité d'une valeur propre
Une valeur propre peut être racine simple de \(\chi_u\) ou racine multiple. Le nombre de répétitions --- sa multiplicité --- est le second nombre attaché à une valeur propre, à côté de la dimension de son sous-espace propre. Les deux sont liés par une inégalité fondamentale : le sous-espace propre ne peut jamais dépasser ce que la multiplicité autorise. Cette inégalité, \(\dim E_\lambda \le m(\lambda)\), est la porte d'entrée de la diagonalisabilité.
Définition — Multiplicité d'une valeur propre
Soit \(\lambda\) une valeur propre de \(u\). Sa multiplicité, notée \(m(\lambda)\), est la multiplicité de \(\lambda\) en tant que racine du polynôme caractéristique \(\chi_u\). Une valeur propre de multiplicité \(1\) est dite simple. Exemple — Lire les multiplicités sur un polynôme caractéristique factorisé
Si \(\chi_u = (X - 1)(X - 2)^2\), alors \(u\) a pour valeurs propres \(1\) et \(2\), avec \(m(1) = 1\) (simple) et \(m(2) = 2\) (double). Les multiplicités ont pour somme \(\deg \chi_u = 3 = n\), comme toujours lorsque \(\chi_u\) est scindé. Exemple — Une valeur propre triple
Pour la matrice triangulaire supérieure \(T = \begin{psmallmatrix} 3 & 1 & 0 \\ 0 & 3 & 1 \\ 0 & 0 & 3 \end{psmallmatrix}\), le polynôme caractéristique est \(\chi_T = (X - 3)^3\), lu sur la diagonale. Donc \(3\) est l'unique valeur propre, de multiplicité \(m(3) = 3\) --- une valeur propre triple. Pourtant \(T - 3I_3\) est de rang \(2\), donc \(\dim E_3(T) = 3 - 2 = 1\), bien en dessous de \(m(3)\) : la multiplicité compte des racines de \(\chi_T\), non des dimensions de sous-espaces propres. Proposition — Nombre de racines du polynôme caractéristique
\(\chi_u\) est unitaire de degré \(n\), donc il a au plus \(n\) racines dans \(\mathbb{K}\) ; vu comme élément de \(\mathbb{C}[X]\), il a exactement \(n\) racines comptées avec multiplicité. En particulier \(u\) a au plus \(n\) valeurs propres distinctes.
Un polynôme non nul de degré \(n\) a au plus \(n\) racines dans tout corps, comptées avec multiplicité --- rappelé de Polynômes. Sur \(\mathbb{C}\), d'Alembert-Gauss rend \(\chi_u\) scindé, donc il a exactement \(n\) racines comptées avec multiplicité. Les valeurs propres de \(u\) sont parmi les racines situées dans \(\mathbb{K}\), donc au plus \(n\). Ceci redémontre, via \(\chi_u\), la finitude du spectre déjà obtenue au § 1.2 par la borne de famille libre, et la précise : le compte est lié à \(\deg \chi_u = n\).
Proposition — Polynôme caractéristique d'un endomorphisme induit
Soit \(F\) un sous-espace de \(E\) stable par \(u\), avec \(F \neq \{0_E\}\), et soit \(u_F\) l'endomorphisme induit. Alors \(\chi_{u_F}\) divise \(\chi_u\).
Si \(F = E\) alors \(u_F = u\) et \(\chi_{u_F} = \chi_u\) divise \(\chi_u\) ; supposons désormais \(F \subsetneq E\). Posons \(p = \dim F\), de sorte que \(1 \le p < n\). Complétons une base de \(F\) en une base \(\mathcal{B}\) de \(E\). Comme \(F\) est stable par \(u\), la matrice de \(u\) dans \(\mathcal{B}\) est triangulaire supérieure par blocs, $$ M = \begin{pmatrix} A & B \\
0 & C \end{pmatrix}, \qquad A = \operatorname{Mat}(u_F), $$ rappelé de Compléments d'algèbre linéaire. Alors \(XI_n - M\) est triangulaire supérieure par blocs, de blocs diagonaux \(XI_p - A\) et \(XI_{n-p} - C\), et le déterminant d'une matrice triangulaire par blocs est le produit des déterminants des blocs diagonaux : $$ \chi_u = \det(XI_n - M) = \det(XI_p - A)\cdot\det(XI_{n-p} - C) = \chi_{u_F}\cdot\chi_C. $$ Donc \(\chi_{u_F}\) divise \(\chi_u\).
Theorem — Dimension d'un sous-espace propre
Soit \(\lambda\) une valeur propre de \(u\) de multiplicité \(m(\lambda)\). Alors $$ 1 \le \dim E_\lambda(u) \le m(\lambda). $$
Posons \(d = \dim E_\lambda(u)\). Comme \(\lambda\) est valeur propre, \(E_\lambda(u) \neq \{0_E\}\), donc \(d \ge 1\).
Le sous-espace \(E_\lambda(u)\) est stable par \(u\), et l'endomorphisme induit est \(u_{E_\lambda} = \lambda \operatorname{Id}_{E_\lambda}\) --- une homothétie, puisque \(u(x) = \lambda x\) pour tout \(x \in E_\lambda(u)\). Son polynôme caractéristique est donc \(\chi_{u_{E_\lambda}} = (X - \lambda)^d\). Par la proposition précédente, \((X - \lambda)^d\) divise \(\chi_u\). La multiplicité de \(\lambda\) comme racine de \(\chi_u\) est donc au moins \(d\), soit \(d \le m(\lambda)\).
Le sous-espace \(E_\lambda(u)\) est stable par \(u\), et l'endomorphisme induit est \(u_{E_\lambda} = \lambda \operatorname{Id}_{E_\lambda}\) --- une homothétie, puisque \(u(x) = \lambda x\) pour tout \(x \in E_\lambda(u)\). Son polynôme caractéristique est donc \(\chi_{u_{E_\lambda}} = (X - \lambda)^d\). Par la proposition précédente, \((X - \lambda)^d\) divise \(\chi_u\). La multiplicité de \(\lambda\) comme racine de \(\chi_u\) est donc au moins \(d\), soit \(d \le m(\lambda)\).
Proposition — Une valeur propre simple a un sous-espace propre de dimension un
Si \(\lambda\) est une valeur propre simple de \(u\), alors \(\dim E_\lambda(u) = 1\).
Une valeur propre simple a \(m(\lambda) = 1\). Le théorème donne \(1 \le \dim E_\lambda(u) \le 1\), d'où \(\dim E_\lambda(u) = 1\).
Exemple — Un sous-espace propre strictement plus petit que la multiplicité
Pour \(M = \begin{psmallmatrix} 2 & 1 \\ 0 & 2 \end{psmallmatrix}\), \(\chi_M = (X - 2)^2\), donc \(2\) est valeur propre de multiplicité \(m(2) = 2\). Mais \(M - 2I_2 = \begin{psmallmatrix} 0 & 1 \\ 0 & 0 \end{psmallmatrix}\) est de rang \(1\), donc \(\dim E_2(M) = 2 - 1 = 1 < m(2)\). L'inégalité \(\dim E_\lambda \le m(\lambda)\) peut être stricte --- et lorsqu'elle l'est, la diagonalisabilité échoue, comme le montrera le § 3. Méthode — Calculer la dimension d'un sous-espace propre
Pour trouver \(\dim E_\lambda(u)\) pour une valeur propre \(\lambda\) (matrice \(M\)) : calculer le rang de \(M - \lambda I_n\) par pivot de Gauss, puis appliquer le théorème du rang, $$ \dim E_\lambda(u) = n - \operatorname{rg}(M - \lambda I_n). $$ Ce nombre est à comparer à \(m(\lambda)\) : le verdict \(\dim E_\lambda = m(\lambda)\) ou \(\dim E_\lambda < m(\lambda)\) décide de la diagonalisabilité valeur propre par valeur propre. Compétences à pratiquer
- Exploiter la multiplicité d'une valeur propre
III
Diagonalisabilité
III.1
Endomorphismes et matrices diagonalisables
Le cas favorable de la réduction est celui où une base de vecteurs propres existe. Dans une telle base \(u\) agit coordonnée par coordonnée comme une dilatation, et sa matrice est diagonale --- la forme la plus simple qu'une matrice puisse prendre. Cette sous-section fixe le vocabulaire, pour les endomorphismes et pour les matrices, et en dégage le contenu géométrique : \(E\) se scinde en droites propres sur chacune desquelles \(u\) est une homothétie.
Définition — Endomorphisme et matrice diagonalisables
L'endomorphisme \(u\) est diagonalisable lorsqu'il existe une base de \(E\) dans laquelle la matrice de \(u\) est diagonale. Une matrice \(M \in \mathcal{M}_n(\mathbb{K})\) est diagonalisable lorsqu'elle est semblable à une matrice diagonale, c'est-à-dire \(P^{-1}MP = D\) pour un \(P \in \operatorname{GL}_n(\mathbb{K})\) et une matrice diagonale \(D\). Exemple — Une diagonalisation explicitée
La matrice \(M = \begin{psmallmatrix} 3 & 1 \\ 2 & 2 \end{psmallmatrix}\) est diagonalisable. Son polynôme caractéristique est \(\chi_M = (X-3)(X-2) - 2 = X^2 - 5X + 4 = (X-1)(X-4)\), à deux valeurs propres distinctes \(1\) et \(4\). En résolvant \((M - I_2)X = 0\) et \((M - 4I_2)X = 0\) on obtient les vecteurs propres \((1, -2)\) et \((1, 1)\). Avec \(P = \begin{psmallmatrix} 1 & 1 \\ -2 & 1 \end{psmallmatrix}\), $$ P^{-1}MP = \begin{pmatrix} 1 & 0 \\
0 & 4 \end{pmatrix}, $$ les colonnes de \(P\) formant une base de vecteurs propres. Proposition — Les versions endomorphisme et matrice coïncident
Un endomorphisme \(u\) est diagonalisable si et seulement si sa matrice dans une base --- de façon équivalente dans toute base --- est une matrice diagonalisable. Plus généralement, il en va de même pour toute propriété matricielle invariante par similitude (en particulier la trigonalisabilité et la nilpotence, rencontrées aux §§ 4--5).
Les matrices de \(u\) dans deux bases sont semblables, et la similitude est une relation d'équivalence. Donc si la matrice de \(u\) dans une base est semblable à une matrice diagonale, la matrice dans toute autre base --- semblable à la première --- est aussi semblable à cette matrice diagonale, par transitivité. Ainsi « la matrice est diagonalisable » ne dépend pas de la base. Et \(u\) est diagonalisable, par définition, exactement lorsqu'une base donne une matrice diagonale, c'est-à-dire exactement lorsque la matrice de \(u\) est semblable à une matrice diagonale. L'argument n'a utilisé que la transitivité de la similitude, donc il s'applique mot pour mot à toute propriété matricielle invariante par similitude --- en particulier « semblable à une matrice triangulaire supérieure » et « une puissance est nulle », les cas trigonalisable et nilpotent des §§ 4--5.
Proposition — Une base de diagonalisation est une base de vecteurs propres
Une base \(\mathcal{B} = (e_1, \dots, e_n)\) diagonalise \(u\) si et seulement si chaque \(e_i\) est un vecteur propre de \(u\). Dans cette base les coefficients diagonaux de la matrice sont les valeurs propres associées, chaque valeur propre \(\lambda\) apparaissant exactement \(\dim E_\lambda(u)\) fois.
La matrice de \(u\) dans \(\mathcal{B}\) est diagonale, de coefficients diagonaux \(d_1, \dots, d_n\), si et seulement si \(u(e_i) = d_i e_i\) pour tout \(i\) --- c'est-à-dire si et seulement si chaque \(e_i\) est un vecteur propre pour la valeur propre \(d_i\). Pour une valeur propre \(\lambda\) fixée, les vecteurs de base \(e_i\) avec \(d_i = \lambda\) sont des vecteurs propres dans \(E_\lambda(u)\) ; faisant partie d'une base ils sont libres, et ils engendrent \(E_\lambda(u)\) (tout vecteur propre pour \(\lambda\) est combinaison des vecteurs de base, nécessairement de ceux avec \(d_i = \lambda\)). Ils forment donc une base de \(E_\lambda(u)\), et \(\lambda\) apparaît \(\dim E_\lambda(u)\) fois sur la diagonale --- comme le montrera la matrice \(3 \times 3\) traitée au § 3.2, où \(0\) occupe deux des trois places diagonales.
Exemple — Endomorphismes diagonalisables déjà connus
L'identité et toute homothétie sont diagonalisables --- elles sont déjà diagonales dans toute base. Un projecteur \(p\) est diagonalisable : \(E = \operatorname{Ker} p \oplus \operatorname{Im} p\), et une base adaptée à cette décomposition est une base de vecteurs propres (valeurs propres parmi \(0\) et \(1\)). Une symétrie vectorielle est diagonalisable de même, de valeurs propres parmi \(-1\) et \(1\). Exemple — Un endomorphisme non diagonalisable
La matrice \(M = \begin{psmallmatrix} 0 & 1 \\ 0 & 0 \end{psmallmatrix}\) n'est pas diagonalisable. Si elle valait \(PDP^{-1}\) avec \(D\) diagonale, \(D\) aurait le même spectre que \(M\), à savoir \(\{0\}\) (car \(\chi_M = X^2\)), donc \(D = 0\), d'où \(M = P\,0\,P^{-1} = 0\) --- faux. Cette matrice non nulle à valeur propre unique est une matrice nilpotente, l'obstruction étudiée au § 5.
La géométrie de la diagonalisation
Lorsque \(u\) est diagonalisable, \(E\) se décompose en somme directe de droites propres (ou de sous-espaces propres) : \(E = E_{\lambda_1}(u) \oplus E_{\lambda_2}(u) \oplus \cdots\). Un vecteur \(x\) se décompose de façon unique en \(x = x_1 + x_2 + \cdots\) avec \(x_i \in E_{\lambda_i}(u)\), et \(u\) dilate chaque morceau selon son propre rapport : \(u(x) = \lambda_1 x_1 + \lambda_2 x_2 + \cdots\). La figure montre le cas de deux sous-espaces propres.
Compétences à pratiquer
- Identifier une matrice diagonalisable
III.2
Caractérisations de la diagonalisabilité
La question de savoir si \(u\) est diagonalisable est désormais tranchée par trois tests équivalents, d'abstraction décroissante. Le premier est structurel : \(E\) est la somme directe des sous-espaces propres. Le deuxième compte les dimensions. Le troisième est le test pratique : \(\chi_u\) doit être scindé, et chaque sous-espace propre doit atteindre la dimension que sa multiplicité autorise. Un raccourci suffisant clôt la sous-section --- \(n\) valeurs propres distinctes suffisent.
Theorem — Diagonalisable par la somme directe des sous-espaces propres
L'endomorphisme \(u\) est diagonalisable si et seulement si \(E\) est la somme directe de ses sous-espaces propres : $$ E = \bigoplus_{\lambda \in \operatorname{Sp}(u)} E_\lambda(u). $$
La somme des sous-espaces propres est toujours directe (§ 1.2), donc la condition est en fait « les sous-espaces propres engendrent \(E\) ».
- \((\Rightarrow)\) Si \(u\) est diagonalisable, une base de diagonalisation est une base de vecteurs propres ; chaque vecteur de base appartient à un \(E_\lambda(u)\), donc les sous-espaces propres engendrent \(E\), et leur somme directe est \(E\).
- \((\Leftarrow)\) Si \(E = \bigoplus_\lambda E_\lambda(u)\), concaténer une base de chaque \(E_\lambda(u)\) donne une base de \(E\) adaptée à la décomposition. Tout vecteur de cette base est un vecteur propre, donc la base diagonalise \(u\).
Proposition — Critère par les dimensions
L'endomorphisme \(u\) est diagonalisable si et seulement si $$ \sum_{\lambda \in \operatorname{Sp}(u)} \dim E_\lambda(u) = n. $$
La somme \(\sum_\lambda E_\lambda(u)\) est directe, donc sa dimension vaut \(\sum_\lambda \dim E_\lambda(u)\). Cette somme vaut \(E\) tout entier exactement lorsque cette dimension vaut \(\dim E = n\). Par le théorème précédent, c'est exactement la diagonalisabilité.
Proposition — Un endomorphisme à n valeurs propres distinctes
Si \(u\) a \(n = \dim E\) valeurs propres distinctes, alors \(u\) est diagonalisable.
Choisissons un vecteur propre pour chacune des \(n\) valeurs propres distinctes. Par le § 1.2, une famille de vecteurs propres associés à des valeurs propres distinctes est libre, donc ces \(n\) vecteurs forment une famille libre de \(E\) ; comptant \(n = \dim E\) éléments, ils forment une base. C'est une base de vecteurs propres, donc \(u\) est diagonalisable.
Theorem — Diagonalisable par le polynôme caractéristique
L'endomorphisme \(u\) est diagonalisable sur \(\mathbb{K}\) si et seulement si son polynôme caractéristique \(\chi_u\) est scindé sur \(\mathbb{K}\) et si, pour toute valeur propre \(\lambda \in \operatorname{Sp}(u)\), \(\dim E_\lambda(u) = m(\lambda)\). - \((\Rightarrow)\) Supposons \(u\) diagonalisable. Dans une base de diagonalisation la matrice est diagonale, chaque valeur propre \(\lambda\) étant répétée \(\dim E_\lambda(u)\) fois ; son polynôme caractéristique est alors \(\chi_u = \prod_{\lambda} (X - \lambda)^{\dim E_\lambda(u)}\). Il est scindé sur \(\mathbb{K}\), et l'exposant de \((X - \lambda)\), à savoir \(m(\lambda)\), vaut \(\dim E_\lambda(u)\).
- \((\Leftarrow)\) Supposons \(\chi_u\) scindé avec \(\dim E_\lambda(u) = m(\lambda)\) pour toute \(\lambda\). Comme \(\chi_u\) est scindé de degré \(n\), les multiplicités ont pour somme \(n\) : \(\sum_\lambda m(\lambda) = n\). Donc \(\sum_\lambda \dim E_\lambda(u) = \sum_\lambda m(\lambda) = n\), et le critère par les dimensions donne la diagonalisabilité.
Méthode — Diagonaliser une matrice
Étant donné \(M \in \mathcal{M}_n(\mathbb{K})\), procéder en deux temps. - Décider. Calculer \(\chi_M\) et le factoriser. Si \(\chi_M\) n'est pas scindé sur \(\mathbb{K}\), \(M\) n'est pas diagonalisable sur \(\mathbb{K}\). S'il est scindé, pour chaque valeur propre \(\lambda\) de multiplicité \(m(\lambda) \ge 2\) calculer \(\dim E_\lambda = n - \operatorname{rg}(M - \lambda I_n)\) et comparer à \(m(\lambda)\) ; \(M\) est diagonalisable si et seulement si l'égalité a lieu pour toute \(\lambda\) (les valeurs propres simples ne demandent aucune vérification, \(\dim E_\lambda = 1 = m(\lambda)\) automatiquement).
- Diagonaliser. Lorsque \(M\) est diagonalisable, résoudre \((M - \lambda I_n)X = 0\) pour chaque \(\lambda\) afin d'obtenir une base de \(E_\lambda\), concaténer celles-ci en les colonnes de \(P\) ; alors \(P^{-1}MP = D\) est diagonale, les valeurs propres figurant sur la diagonale dans l'ordre correspondant.
Exemple — Un verdict de non-diagonalisabilité
La matrice \(M = \begin{psmallmatrix} 2 & 1 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 2 \end{psmallmatrix}\) a \(\chi_M = (X - 2)^3\), scindé sur \(\mathbb{R}\), avec l'unique valeur propre \(2\) de multiplicité \(m(2) = 3\). En appliquant la méthode : \(M - 2I_3\) est de rang \(1\), donc \(\dim E_2 = 3 - 1 = 2 < 3 = m(2)\). Le critère échoue pour la valeur propre \(2\), donc \(M\) n'est pas diagonalisable --- bien que \(\chi_M\) soit scindé. Le polynôme caractéristique scindé est nécessaire mais non suffisant ; c'est le test de dimension qui tranche. Exemple — Diagonaliser une matrice 3 par 3
Diagonaliser la matrice $$ M = \begin{pmatrix} 1 & 1 & 1 \\
1 & 1 & 1 \\
1 & 1 & 1 \end{pmatrix} \in \mathcal{M}_3(\mathbb{R}). $$
\(M\) est de rang \(1\), donc \(0\) est valeur propre avec \(\dim E_0 = 3 - \operatorname{rg}(M) = 2\) ; donc \(m(0) \ge \dim E_0 = 2\) et \(X^2\) divise le polynôme \(\chi_M\), unitaire de degré \(3\), ce qui donne \(\chi_M = X^2(X - a)\) pour un certain \(a\). Le coefficient de \(X^2\) dans \(\chi_M\) vaut \(-\operatorname{tr}(M) = -3\) par le théorème sur le degré et les coefficients du § 2.1, et dans \(X^2(X - a)\) il vaut \(-a\) ; donc \(a = 3\) et \(\chi_M = X^2(X - 3)\), scindé sur \(\mathbb{R}\), avec \(m(0) = 2\) et \(m(3) = 1\).
- \(\dim E_0 = 2 = m(0)\) et \(\dim E_3 = 1 = m(3)\) (simple), donc \(M\) est diagonalisable.
- \(E_0 = \operatorname{Ker} M\) : le système \(x + y + z = 0\) donne la base \((1, -1, 0)\), \((1, 0, -1)\).
- \(E_3 = \operatorname{Ker}(M - 3I_3)\) : la base \((1, 1, 1)\).
Compétences à pratiquer
- Diagonaliser une matrice
IV
Trigonalisabilité
IV.1
Endomorphismes et matrices trigonalisables
La diagonalisation peut échouer --- la matrice \(\begin{psmallmatrix} 2 & 1 \\ 0 & 2 \end{psmallmatrix}\) y résiste déjà. Lorsque c'est le cas, la forme la meilleure ensuite est triangulaire : une base dans laquelle la matrice de \(u\) est triangulaire supérieure expose encore le spectre sur la diagonale et maîtrise les puissances de \(u\). Cette sous-section nomme les endomorphismes et matrices trigonalisables ; la suivante les caractérise.
Définition — Endomorphisme et matrice trigonalisables
L'endomorphisme \(u\) est trigonalisable lorsqu'il existe une base de \(E\) dans laquelle la matrice de \(u\) est triangulaire supérieure. Une matrice \(M \in \mathcal{M}_n(\mathbb{K})\) est trigonalisable lorsqu'elle est semblable à une matrice triangulaire supérieure. Comme pour la diagonalisabilité (§ 3.1), un endomorphisme est trigonalisable si et seulement si sa matrice dans une base quelconque est une matrice trigonalisable. Exemple — Diagonalisable implique trigonalisable
Toute matrice triangulaire supérieure est trigonalisable, étant semblable à elle-même. Tout endomorphisme diagonalisable est trigonalisable, une matrice diagonale étant en particulier triangulaire supérieure. La trigonalisabilité est donc une exigence plus faible que la diagonalisabilité --- strictement plus faible, comme le montre l'exemple suivant. Exemple — Trigonalisable sans être diagonalisable
La matrice \(\begin{psmallmatrix} 1 & 1 \\ 0 & 1 \end{psmallmatrix}\) est triangulaire supérieure, donc trigonalisable, et pourtant non diagonalisable : \(\chi = (X-1)^2\) et \(\dim E_1 = 2 - \operatorname{rg}\begin{psmallmatrix} 0 & 1 \\ 0 & 0 \end{psmallmatrix} = 1 < 2 = m(1)\). La trigonalisabilité est bien la notion la plus large. Exemple — Une trigonalisation exhibée
Pour \(M = \begin{psmallmatrix} 2 & -1 \\ 1 & 0 \end{psmallmatrix}\), prenons \(P = \begin{psmallmatrix} 1 & 1 \\ 1 & 0 \end{psmallmatrix}\) ; un calcul direct donne \(P^{-1}MP = \begin{psmallmatrix} 1 & 1 \\ 0 & 1 \end{psmallmatrix}\), triangulaire supérieure. Donc \(M\) est trigonalisable, de valeur propre unique \(1\). Ici la matrice trigonalisante \(P\) est donnée et la similitude seulement vérifiée --- trouver un tel \(P\) n'est pas un objectif du programme (voir § 4.2). Compétences à pratiquer
- Identifier un endomorphisme trigonalisable
IV.2
Caractérisation par le polynôme caractéristique
La trigonalisabilité possède un critère unique et net : elle a lieu exactement lorsque le polynôme caractéristique est scindé. Un sens est immédiat --- une matrice triangulaire a un polynôme caractéristique scindé. L'autre est une récurrence qui détache un vecteur propre à la fois. Le critère a une conséquence immédiate sur \(\mathbb{C}\), et il fixe la trace et le déterminant en fonction des valeurs propres.
Theorem — Trigonalisable par un polynôme caractéristique scindé
L'endomorphisme \(u\) est trigonalisable sur \(\mathbb{K}\) si et seulement si son polynôme caractéristique \(\chi_u\) est scindé sur \(\mathbb{K}\). - \((\Rightarrow)\) Si \(u\) est trigonalisable, dans une base convenable sa matrice \(T\) est triangulaire supérieure de diagonale \(d_1, \dots, d_n\), donc \(\chi_u = \chi_T = \prod_{i=1}^n (X - d_i)\) est scindé sur \(\mathbb{K}\).
- \((\Leftarrow)\) Supposons \(\chi_u\) scindé ; on trigonalise par récurrence sur \(n = \dim E\).
- Initialisation. Pour \(n = 1\) toute matrice est déjà triangulaire supérieure.
- Hérédité. Supposons le résultat en dimension \(n - 1\). Comme \(\chi_u\) est scindé il a une racine \(\lambda \in \mathbb{K}\), valeur propre de \(u\) ; soit \(e_1\) un vecteur propre associé, complété en une base \((e_1, \dots, e_n)\). La matrice de \(u\) dans cette base est $$ M = \begin{pmatrix} \lambda & L \\ 0 & M' \end{pmatrix}, \qquad M' \in \mathcal{M}_{n-1}(\mathbb{K}). $$ Alors \(\chi_u = (X - \lambda)\chi_{M'}\), et puisque \(\chi_u\) est scindé, \(\chi_{M'}\) l'est aussi. Par hypothèse de récurrence \(M'\) est trigonalisable : \(M' = Q^{-1}T'Q\) avec \(T'\) triangulaire supérieure. En posant \(P = \begin{psmallmatrix} 1 & 0 \\ 0 & Q^{-1} \end{psmallmatrix}\), un calcul par blocs donne $$ P^{-1}MP = \begin{pmatrix} \lambda & LQ^{-1} \\ 0 & QM'Q^{-1} \end{pmatrix} = \begin{pmatrix} \lambda & LQ^{-1} \\ 0 & T' \end{pmatrix}, $$ qui est triangulaire supérieure. Donc \(u\) est trigonalisable.
Proposition — Trigonalisabilité sur les complexes
Toute matrice \(M \in \mathcal{M}_n(\mathbb{C})\) est trigonalisable dans \(\mathcal{M}_n(\mathbb{C})\), puisque \(\chi_M\) est toujours scindé sur \(\mathbb{C}\). Une matrice réelle \(M\) est trigonalisable sur \(\mathbb{R}\) exactement lorsque \(\chi_M\) est scindé sur \(\mathbb{R}\) ; lorsqu'il ne l'est pas --- par exemple la matrice d'une rotation plane d'angle \(\theta \notin \pi\mathbb{Z}\), dont le \(\chi\) n'a aucune racine réelle --- \(M\) reste trigonalisable une fois lue dans \(\mathcal{M}_n(\mathbb{C})\).
Pour \(M \in \mathcal{M}_n(\mathbb{C})\), le polynôme \(\chi_M\) est de degré \(n\) et, par d'Alembert-Gauss (rappelé de Polynômes), scindé sur \(\mathbb{C}\) ; le théorème rend alors \(M\) trigonalisable sur \(\mathbb{C}\). Pour une matrice réelle \(M\), le théorème appliqué avec \(\mathbb{K} = \mathbb{R}\) donne la trigonalisabilité sur \(\mathbb{R}\) exactement lorsque \(\chi_M\) est scindé sur \(\mathbb{R}\) ; à défaut, lire \(M\) dans \(\mathcal{M}_n(\mathbb{C})\) ramène au cas complexe.
La pratique de la trigonalisation n'est pas un objectif du programme. Le théorème est utilisé comme outil structurel --- il garantit qu'une forme triangulaire existe --- mais la recherche explicite d'une base de trigonalisation n'est pas exigée. Les exercices ne font jamais que vérifier une forme triangulaire qui leur est fournie.
Proposition — Trace et déterminant d'un endomorphisme trigonalisable
Si \(u\) est trigonalisable sur \(\mathbb{K}\), alors \(\operatorname{tr}(u)\) est la somme et \(\det(u)\) le produit des valeurs propres de \(u\), chacune comptée avec sa multiplicité.
Trigonalisons \(u\) : dans une base convenable sa matrice est triangulaire supérieure, \(T\), de coefficients diagonaux \(d_1, \dots, d_n\). La diagonale d'une matrice triangulaire porte ses valeurs propres, chaque \(\lambda\) apparaissant \(m(\lambda)\) fois puisque \(\chi_T = \prod_i (X - d_i)\). Trace et déterminant sont des invariants de similitude, donc \(\operatorname{tr}(u) = \operatorname{tr}(T) = \sum_i d_i\) et \(\det(u) = \det(T) = \prod_i d_i\) --- la somme et le produit des valeurs propres comptées avec multiplicité.
Extension à tout endomorphisme
Plus généralement, pour tout \(u \in \mathcal{L}(E)\), la trace et le déterminant sont la somme et le produit des racines de \(\chi_u\) dans \(\mathbb{C}\), comptées avec multiplicité. Cela ne demande aucun théorème nouveau : \(\chi_u = X^n - \operatorname{tr}(u)X^{n-1} + \dots + (-1)^n\det(u)\) d'après le § 2, et \(\chi_u\) se factorise sur \(\mathbb{C}\) en \(\prod_{i=1}^n (X - \lambda_i)\) par d'Alembert-Gauss ; en identifiant les coefficients de \(X^{n-1}\) et le terme constant, on lit \(\operatorname{tr}(u) = \sum_i \lambda_i\) et \(\det(u) = \prod_i \lambda_i\). Lorsque \(\mathbb{K} = \mathbb{C}\) ces racines sont exactement les valeurs propres ; sur un sous-corps strict, les racines non dans \(\mathbb{K}\) ne sont pas des valeurs propres de \(u\).
Exemple — Lire trace et déterminant sur les valeurs propres
Soit \(M\) trigonalisable sur \(\mathbb{K}\), semblable à une matrice triangulaire supérieure \(T\) de diagonale \((\lambda_i)\) --- les valeurs propres comptées avec multiplicité. Alors \(\operatorname{tr}(M) = \sum_i \lambda_i\) et \(\det(M) = \prod_i \lambda_i\). De plus \(M^k = P^{-1}T^kP\) avec \(T^k\) triangulaire supérieure de diagonale \((\lambda_i^k)\), donc pour tout entier \(k \ge 1\), $$ \operatorname{tr}(M^k) = \operatorname{tr}(T^k) = \sum_i \lambda_i^k, $$ par invariance de la trace par similitude. Une matrice de valeurs propres \(1, 2, 2\) a ainsi \(\operatorname{tr}(M) = 5\), \(\det(M) = 4\) et \(\operatorname{tr}(M^2) = 1 + 4 + 4 = 9\). Méthode — Exploiter un polynôme caractéristique scindé
Lorsque \(\chi_u\) est scindé --- toujours le cas sur \(\mathbb{C}\) --- \(u\) est trigonalisable, et l'on peut raisonner comme si sa matrice était triangulaire supérieure sans même calculer de base de trigonalisation. S'en servir pour lire \(\operatorname{tr}(u)\) et \(\det(u)\) comme somme et produit des valeurs propres comptées avec multiplicité, pour calculer \(\operatorname{tr}(u^k) = \sum \lambda_i^k\) pour \(k \ge 1\) (même convention de multiplicité), et pour borner ou localiser le spectre. La forme triangulaire est invoquée pour ce qu'elle garantit, jamais recherchée explicitement. Compétences à pratiquer
- Exploiter un polynôme caractéristique scindé
V
Endomorphismes nilpotents
V.1
Endomorphismes et matrices nilpotents
À l'opposé de la diagonalisabilité se trouve une famille d'endomorphismes qu'aucune base ne peut diagonaliser à moins qu'ils ne soient nuls : les endomorphismes nilpotents, ceux qu'une puissance assez grande annule. Ils sont l'obstruction pure à la réduction --- un endomorphisme nilpotent non nul a une seule valeur propre, \(0\), et n'est pourtant pas l'application nulle. Cette sous-section les définit et borne leur vitesse d'annulation.
Définition — Endomorphisme et matrice nilpotents
L'endomorphisme \(u\) est nilpotent lorsque \(u^k = 0_{\mathcal{L}(E)}\) pour un certain \(k \in \mathbb{N}^*\). Le plus petit tel \(k\) est l'indice de nilpotence de \(u\) : en le notant \(p\), on a \(u^p = 0\) et \(u^{p-1} \neq 0\). Une matrice \(M \in \mathcal{M}_n(\mathbb{K})\) est nilpotente lorsque \(M^k = 0\) pour un certain \(k \in \mathbb{N}^*\). Comme pour la diagonalisabilité (§ 3.1), un endomorphisme est nilpotent si et seulement si sa matrice dans une base quelconque est une matrice nilpotente. Exemple — Le décalage sur une base
Sur un espace de base \((e_1, \dots, e_p)\), l'endomorphisme \(u\) défini par \(u(e_i) = e_{i-1}\) pour \(i \ge 2\) et \(u(e_1) = 0_E\) est nilpotent d'indice exactement \(p\) : chaque application de \(u\) décale la base d'un cran le long de la chaîne, et \(u^p\) tue tous les \(e_i\) tandis que \(u^{p-1}(e_p) = e_1 \neq 0_E\). Sa matrice est triangulaire supérieure stricte, avec des \(1\) juste au-dessus de la diagonale.
Exemple — La dérivation sur les polynômes de degré borné
Sur \(\mathbb{K}_d[X]\), l'espace des polynômes de degré au plus \(d\) (de dimension \(d + 1\)), la dérivation \(D : P \mapsto P'\) est nilpotente : dériver \(d + 1\) fois annule tout polynôme de degré \(\le d\). Son indice vaut exactement \(d + 1\), puisque \(D^d(X^d) = d!\,\neq 0\) tandis que \(D^{d+1}(X^d) = 0\) --- l'indice égale la dimension. Exemple — Une matrice triangulaire stricte et son indice
Une matrice triangulaire supérieure stricte est nilpotente. Pour la matrice triangulaire stricte \(N = \begin{psmallmatrix} 0 & 1 & 2 \\ 0 & 0 & 3 \\ 0 & 0 & 0 \end{psmallmatrix}\), on calcule \(N^2 = \begin{psmallmatrix} 0 & 0 & 3 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{psmallmatrix} \neq 0\) et \(N^3 = 0\) : l'indice de nilpotence est \(3\), égal à la taille de la matrice. Proposition — L'indice est borné par la dimension
Soit \(u\) un endomorphisme nilpotent de \(E\). Son indice de nilpotence est au plus \(n = \dim E\).
Soit \(p\) l'indice, de sorte que \(u^{p-1} \neq 0\) : il existe un vecteur \(x\) avec \(u^{p-1}(x) \neq 0_E\). Montrons que la famille \((x, u(x), \dots, u^{p-1}(x))\) est libre, ce qui force \(p \le n\) puisqu'une famille libre de \(E\) compte au plus \(n\) vecteurs.
Supposons \(\alpha_0 x + \alpha_1 u(x) + \dots + \alpha_{p-1} u^{p-1}(x) = 0_E\). Appliquons \(u^{p-1}\) : tout terme \(u^{p-1+j}(x)\) avec \(j \ge 1\) s'annule (car \(u^p = 0\)), laissant \(\alpha_0 u^{p-1}(x) = 0_E\), d'où \(\alpha_0 = 0\). Appliquons \(u^{p-2}\) à ce qui reste : de même \(\alpha_1 = 0\). En continuant, tous les \(\alpha_j = 0\). La famille est libre.
Supposons \(\alpha_0 x + \alpha_1 u(x) + \dots + \alpha_{p-1} u^{p-1}(x) = 0_E\). Appliquons \(u^{p-1}\) : tout terme \(u^{p-1+j}(x)\) avec \(j \ge 1\) s'annule (car \(u^p = 0\)), laissant \(\alpha_0 u^{p-1}(x) = 0_E\), d'où \(\alpha_0 = 0\). Appliquons \(u^{p-2}\) à ce qui reste : de même \(\alpha_1 = 0\). En continuant, tous les \(\alpha_j = 0\). La famille est libre.
Compétences à pratiquer
- Identifier un endomorphisme nilpotent
V.2
Caractérisation de la nilpotence
La nilpotence a une signature spectrale nette. Un endomorphisme nilpotent est exactement un endomorphisme dont le polynôme caractéristique est \(X^n\) --- de façon équivalente, un endomorphisme trigonalisable dont \(0\) est l'unique valeur propre. La démonstration reste entièrement dans \(\mathbb{K}\) : elle lit la forme triangulaire stricte sur la chaîne de noyaux \(\operatorname{Ker} u \subseteq \operatorname{Ker} u^2 \subseteq \cdots\).
Theorem — Caractérisation de la nilpotence
Pour \(u \in \mathcal{L}(E)\), les énoncés suivants sont équivalents : - \(u\) est nilpotent ;
- \(\chi_u = X^n\) ;
- \(u\) est trigonalisable sur \(\mathbb{K}\) et \(0\) est son unique valeur propre.
L'argument se déroule entièrement sur \(\mathbb{K}\), sans complexification.
- \((1 \Rightarrow 2)\) Soit \(u\) nilpotent d'indice \(p\). La chaîne de noyaux \(\{0_E\} \subseteq \operatorname{Ker} u \subseteq \operatorname{Ker} u^2 \subseteq \dots \subseteq \operatorname{Ker} u^p = E\) a chaque terme stable par \(u\), et \(u(\operatorname{Ker} u^k) \subseteq \operatorname{Ker} u^{k-1}\) : en effet \(x \in \operatorname{Ker} u^k\) donne \(u^{k-1}(u(x)) = u^k(x) = 0_E\). Construisons une base de \(E\) adaptée à cette chaîne, en complétant à chaque étape une base de \(\operatorname{Ker} u^{k-1}\) en une base de \(\operatorname{Ker} u^k\). Dans cette base \(u\) envoie chaque bloc strictement plus bas dans la chaîne, donc sa matrice est triangulaire supérieure stricte, de diagonale nulle. D'où \(\chi_u = \prod (X - 0) = X^n\).
- \((2 \Rightarrow 3)\) Si \(\chi_u = X^n\), il est scindé sur \(\mathbb{K}\), donc \(u\) est trigonalisable sur \(\mathbb{K}\) ; les valeurs propres sont les racines de \(\chi_u\), à savoir \(0\) seul.
- \((3 \Rightarrow 1)\) Trigonalisons \(u\) : sa matrice est triangulaire supérieure, et sa diagonale porte les valeurs propres, toutes égales à \(0\). Donc la matrice \(T\) est triangulaire supérieure stricte. Une telle \(T\) vérifie \(T^n = 0\) : en notant \((e_1, \dots, e_n)\) la base, \(T\) envoie \(\operatorname{Vect}(e_1, \dots, e_i)\) dans \(\operatorname{Vect}(e_1, \dots, e_{i-1})\) --- abaissant l'indice d'au moins un --- donc \(T^n\) annule tout vecteur de base. D'où \(u^n = 0\) et \(u\) est nilpotent.
Exemple — Reconnaître la nilpotence sur le polynôme caractéristique
Une matrice nilpotente \(N\) a \(\chi_N = X^n\), donc tous ses coefficients de degré \(< n\) sont nuls : en particulier \(\operatorname{tr}(N) = 0\) et \(\det(N) = 0\). Réciproquement, la matrice \(N = \begin{psmallmatrix} 1 & 1 \\ -1 & -1 \end{psmallmatrix}\) a \(\operatorname{tr}(N) = 0\), \(\det(N) = 0\) et \(\chi_N = X^2\), donc est nilpotente --- et en effet \(N^2 = 0\). En dimension au moins \(2\), la trace nulle seule ne suffit jamais, et en dimension \(\ge 3\) même trace nulle et déterminant nul ensemble ne forcent pas la nilpotence ; l'identité complète \(\chi_N = X^n\) est le test. Méthode — Reconnaître un endomorphisme nilpotent
Pour décider si \(u\) (matrice \(M\)) est nilpotent, trois voies sont ouvertes. Calculer \(\chi_u\) et vérifier \(\chi_u = X^n\). Ou trigonaliser et vérifier que l'unique valeur propre est \(0\). Ou, le plus directement pour une matrice explicite, calculer les puissances successives \(M, M^2, \dots\) jusqu'à en annuler une (le théorème garantit que si \(M\) est nilpotente alors \(M^n = 0\), donc il suffit de tester jusqu'à l'exposant \(n\)).
Pour aller plus loin
Ce chapitre a suivi la voie géométrique de la réduction : sous-espaces stables, sous-espaces propres, sommes directes. Une seconde voie, algébrique --- polynômes annulateurs, polynôme minimal \(\pi_u\), théorème de Cayley-Hamilton, lemme de décomposition des noyaux --- est abordée dans Polynômes d'un endomorphisme, où la diagonalisabilité est reformulée en « le polynôme minimal est scindé à racines simples ». La réduction est aussi le moteur de plusieurs chapitres ultérieurs : elle calcule les puissances de matrices \(M^k\), résout les suites récurrentes linéaires et intègre les systèmes différentiels linéaires \(X' = AX\).
Compétences à pratiquer
- Appliquer la caractérisation de la nilpotence
Aller à la section