CommeUnJeu · L2 MP
Polynômes d'un endomorphisme et réduction
Le chapitre Réduction : éléments propres, diagonalisation a réduit un endomorphisme par sa géométrie --- valeurs propres, sous-espaces propres, polynôme caractéristique. Ce chapitre ajoute l'outil algébrique qui rend la réduction systématique : un polynôme peut être évalué non seulement en un nombre mais en un endomorphisme \(u\), produisant \(P(u)\), et une seule relation \(P(u) = 0\) gouverne toute la réduction.
Le chapitre a quatre sections. La section~1 construit \(P(u)\) et la sous-algèbre \(\mathbb{K}[u]\), puis isole les polynômes annulateurs --- ceux vérifiant \(P(u) = 0\) --- et le plus petit d'entre eux, le polynôme minimal \(\pi_u\). La section~2 démontre le lemme de décomposition des noyaux : un polynôme en \(u\) qui se factorise en facteurs premiers entre eux découpe l'espace selon ces facteurs. La section~3 en tire le test de diagonalisabilité le plus efficace --- \(u\) est diagonalisable exactement lorsque \(\pi_u\) est scindé à racines simples. La section~4 démontre le théorème de Cayley--Hamilton, qui fournit gratuitement un polynôme annulateur, et décompose l'espace en sous-espaces caractéristiques.
Notations permanentes. Dans tout le chapitre, \(\mathbb{K}\) est un sous-corps de \(\mathbb{C}\) ; \(E\) est un \(\mathbb{K}\)-espace vectoriel non nul de dimension finie \(\dim E = n \ge 1\) ; \(u \in \mathcal{L}(E)\) est un endomorphisme, \(M \in \mathcal{M}_n(\mathbb{K})\) une matrice carrée, \(\mathrm{Id}_E\) l'identité. La valeur propre, le vecteur propre, le sous-espace propre \(E_\lambda(u) = \mathrm{Ker}(u - \lambda\,\mathrm{Id}_E)\), le spectre \(\mathrm{Sp}(u)\), le polynôme caractéristique \(\chi_u\) (unitaire de degré \(n\)), la multiplicité \(m(\lambda)\), les notions diagonalisable, trigonalisable, endomorphisme nilpotent, endomorphisme induit sur un sous-espace stable --- avec \(\chi_{u_F} \mid \chi_u\) --- sont ceux de Réduction : éléments propres, diagonalisation ; la divisibilité, le pgcd et le théorème de Bézout dans \(\mathbb{K}[X]\), ainsi que les polynômes scindés et la factorisation en irréductibles, sont ceux d'Arithmétique des polynômes et de Polynômes. Le symbole \(A \sim B\) désigne des matrices semblables.
Le chapitre a quatre sections. La section~1 construit \(P(u)\) et la sous-algèbre \(\mathbb{K}[u]\), puis isole les polynômes annulateurs --- ceux vérifiant \(P(u) = 0\) --- et le plus petit d'entre eux, le polynôme minimal \(\pi_u\). La section~2 démontre le lemme de décomposition des noyaux : un polynôme en \(u\) qui se factorise en facteurs premiers entre eux découpe l'espace selon ces facteurs. La section~3 en tire le test de diagonalisabilité le plus efficace --- \(u\) est diagonalisable exactement lorsque \(\pi_u\) est scindé à racines simples. La section~4 démontre le théorème de Cayley--Hamilton, qui fournit gratuitement un polynôme annulateur, et décompose l'espace en sous-espaces caractéristiques.
Notations permanentes. Dans tout le chapitre, \(\mathbb{K}\) est un sous-corps de \(\mathbb{C}\) ; \(E\) est un \(\mathbb{K}\)-espace vectoriel non nul de dimension finie \(\dim E = n \ge 1\) ; \(u \in \mathcal{L}(E)\) est un endomorphisme, \(M \in \mathcal{M}_n(\mathbb{K})\) une matrice carrée, \(\mathrm{Id}_E\) l'identité. La valeur propre, le vecteur propre, le sous-espace propre \(E_\lambda(u) = \mathrm{Ker}(u - \lambda\,\mathrm{Id}_E)\), le spectre \(\mathrm{Sp}(u)\), le polynôme caractéristique \(\chi_u\) (unitaire de degré \(n\)), la multiplicité \(m(\lambda)\), les notions diagonalisable, trigonalisable, endomorphisme nilpotent, endomorphisme induit sur un sous-espace stable --- avec \(\chi_{u_F} \mid \chi_u\) --- sont ceux de Réduction : éléments propres, diagonalisation ; la divisibilité, le pgcd et le théorème de Bézout dans \(\mathbb{K}[X]\), ainsi que les polynômes scindés et la factorisation en irréductibles, sont ceux d'Arithmétique des polynômes et de Polynômes. Le symbole \(A \sim B\) désigne des matrices semblables.
I
Polynômes d'un endomorphisme
I.1
L'algèbre des polynômes en un endomorphisme
Un polynôme \(P = \sum_k a_k X^k\) peut être évalué en un nombre. Il peut tout aussi bien être évalué en un endomorphisme \(u\) : on remplace chaque puissance \(X^k\) par l'itérée \(u^k\) et chaque constante par l'homothétie correspondante. Le résultat \(P(u)\) est encore un endomorphisme, et --- comme nous le vérifions maintenant --- les règles du calcul polynomial survivent à la substitution.
Définition — Polynôme d'un endomorphisme
Soit \(u \in \mathcal{L}(E)\) et \(P = \sum_{k=0}^d a_k X^k \in \mathbb{K}[X]\). Le polynôme \(P\) de l'endomorphisme \(u\) est l'endomorphisme $$ \textcolor{colordef}{P(u) = \sum_{k=0}^d a_k\, u^k,} $$ où \(u^k = u \circ \dots \circ u\) (\(k\) facteurs) et \(u^0 = \mathrm{Id}_E\). Pour une matrice \(M \in \mathcal{M}_n(\mathbb{K})\), \(P(M) = \sum_k a_k M^k\) avec \(M^0 = I_n\). Exemple — Lire un polynôme d'un endomorphisme
Pour \(P = X^2 - 3X + 2\), on a \(P(u) = u^2 - 3u + 2\,\mathrm{Id}_E\). Pour une homothétie \(u = \lambda\,\mathrm{Id}_E\), chaque puissance vaut \(u^k = \lambda^k\,\mathrm{Id}_E\), donc \(P(\lambda\,\mathrm{Id}_E) = \bigl(\sum_k a_k \lambda^k\bigr)\mathrm{Id}_E = P(\lambda)\,\mathrm{Id}_E\) : évaluer en une homothétie, c'est évaluer au scalaire. Exemple — Un polynôme d'une matrice
Prenons \(M = \begin{pmatrix} 1 & 1 \\ 0 & 2 \end{pmatrix}\) et \(P = X^2 - X\). Alors \(M^2 = \begin{pmatrix} 1 & 3 \\ 0 & 4 \end{pmatrix}\), donc $$ P(M) = M^2 - M = \begin{pmatrix} 1 & 3 \\
0 & 4 \end{pmatrix} - \begin{pmatrix} 1 & 1 \\
0 & 2 \end{pmatrix} = \begin{pmatrix} 0 & 2 \\
0 & 2 \end{pmatrix}. $$ Theorem — Le morphisme des polynômes en un endomorphisme
Fixons \(u \in \mathcal{L}(E)\). L'application \(\Phi_u \colon P \mapsto P(u)\) est un morphisme d'algèbres de \(\mathbb{K}[X]\) vers \(\mathcal{L}(E)\) : $$ \textcolor{colorprop}{(P + \lambda Q)(u) = P(u) + \lambda\, Q(u), \qquad (PQ)(u) = P(u) \circ Q(u), \qquad 1(u) = \mathrm{Id}_E.} $$ Son image \(\mathbb{K}[u] = \{ P(u) : P \in \mathbb{K}[X]\}\) est une sous-algèbre commutative de \(\mathcal{L}(E)\).
La linéarité se lit sur la définition : si \(P = \sum a_k X^k\) et \(Q = \sum b_k X^k\), alors \((P + \lambda Q)(u) = \sum (a_k + \lambda b_k) u^k = P(u) + \lambda\, Q(u)\). L'image de \(1\) est \(1 \cdot u^0 = \mathrm{Id}_E\). Pour le produit, écrivons \(P = \sum_i a_i X^i\) et \(Q = \sum_j b_j X^j\), de sorte que \(PQ = \sum_k \bigl(\sum_{i+j=k} a_i b_j\bigr) X^k\). Comme \(u^i \circ u^j = u^{i+j}\), $$ \begin{aligned} P(u) \circ Q(u) &= \Bigl(\sum_i a_i u^i\Bigr) \circ \Bigl(\sum_j b_j u^j\Bigr) = \sum_{i,j} a_i b_j\, u^i \circ u^j\\
&= \sum_{i,j} a_i b_j\, u^{i+j} = \sum_k \Bigl(\sum_{i+j=k} a_i b_j\Bigr) u^k = (PQ)(u). \end{aligned} $$ Donc \(\Phi_u\) est un morphisme d'algèbres. Son image \(\mathbb{K}[u]\) est ainsi une sous-algèbre de \(\mathcal{L}(E)\), et elle est commutative : pour tous \(P, Q\), \(P(u) \circ Q(u) = (PQ)(u) = (QP)(u) = Q(u) \circ P(u)\), le produit de \(\mathbb{K}[X]\) étant commutatif.
Notation. Le produit \((PQ)(u) = P(u) \circ Q(u)\) montre que composer des polynômes en \(u\), c'est multiplier des polynômes lu à travers \(\Phi_u\). La composée de deux éléments de \(\mathbb{K}[u]\) se note donc couramment comme un produit, \(P(u)\,Q(u)\), et les puissances \(u^k\) de même. Attention au seul piège : \(P(u)\) est l'endomorphisme \(\sum a_k u^k\), appliqué à un vecteur \(x\) sous la forme \(P(u)(x)\) ; ce n'est pas \(P(u(x))\) --- on évalue l'endomorphisme \(P(u)\) au vecteur \(x\), jamais un polynôme en un vecteur.
Le morphisme \(\Phi_u\) transporte l'algèbre des polynômes \(\mathbb{K}[X]\) dans \(\mathcal{L}(E)\) ; son image \(\mathbb{K}[u]\) est la sous-algèbre de tous les polynômes évalués en \(u\).
Proposition — Noyau et image d'un polynôme en u
Pour tout \(P \in \mathbb{K}[X]\), les sous-espaces \(\mathrm{Ker}\bigl(P(u)\bigr)\) et \(\mathrm{Im}\bigl(P(u)\bigr)\) sont stables par \(u\).
Les endomorphismes \(u\) et \(P(u)\) commutent : \(u \circ P(u) = \sum_k a_k\, u^{k+1} = P(u) \circ u\). Soit \(x \in \mathrm{Ker}\bigl(P(u)\bigr)\) ; alors \(P(u)\bigl(u(x)\bigr) = u\bigl(P(u)(x)\bigr) = u(0_E) = 0_E\), donc \(u(x) \in \mathrm{Ker}\bigl(P(u)\bigr)\). Soit \(y \in \mathrm{Im}\bigl(P(u)\bigr)\), disons \(y = P(u)(z)\) ; alors \(u(y) = u\bigl(P(u)(z)\bigr) = P(u)\bigl(u(z)\bigr) \in \mathrm{Im}\bigl(P(u)\bigr)\). Les deux sous-espaces sont stables par \(u\).
Exemple — Le sous-espace propre comme noyau polynomial
Pour \(P = X - \lambda\), \(P(u) = u - \lambda\,\mathrm{Id}_E\) et \(\mathrm{Ker}\bigl(P(u)\bigr) = \mathrm{Ker}(u - \lambda\,\mathrm{Id}_E) = E_\lambda(u)\), le sous-espace propre associé à \(\lambda\) rappelé de Réduction : éléments propres, diagonalisation. Les sous-espaces propres sont les plus simples des noyaux de polynômes en \(u\) --- le lemme de décomposition des noyaux du § 2 produira les noyaux généraux. Méthode — Exploiter une relation polynomiale vérifiée par un endomorphisme
Lorsque \(u\) vérifie une relation \(P(u) = 0\), la réécrire pour en tirer des renseignements sur \(u\) : - de \(u^2 = a\,u + b\,\mathrm{Id}_E\), toutes les puissances \(u^k\) sont dans \(\mathrm{Vect}(\mathrm{Id}_E, u)\) --- on les calcule par la récurrence \(u^{k+1} = a\,u^k + b\,u^{k-1}\) ;
- si de plus \(b \ne 0\), alors \(u \circ \tfrac{1}{b}(u - a\,\mathrm{Id}_E) = \mathrm{Id}_E\), donc \(u\) est inversible avec \(u^{-1} = \tfrac{1}{b}(u - a\,\mathrm{Id}_E)\).
Compétences à pratiquer
- Calculer des polynômes d'un endomorphisme
I.2
Polynômes annulateurs et polynôme minimal
Certains polynômes envoient \(u\) sur l'endomorphisme nul. En dimension finie il en existe toujours au moins un non nul, et parmi eux un plus petit --- le polynôme minimal. Il divise tous les autres, donc il porte toute l'information algébrique qu'une relation polynomiale peut donner sur \(u\).
Définition — Polynôme annulateur
Un polynôme \(P \in \mathbb{K}[X]\) est un polynôme annulateur de \(u\) (on dit que \(P\) annule \(u\)) lorsque \(P(u) = 0_{\mathcal{L}(E)}\). De même \(P\) annule une matrice \(M\) lorsque \(P(M) = 0\). Exemple — Polynômes annulateurs d'endomorphismes familiers
\(X - \lambda\) annule l'homothétie \(\lambda\,\mathrm{Id}_E\). Un projecteur \(p\) vérifie \(p^2 = p\), donc \(X^2 - X\) l'annule. Une symétrie \(s\) vérifie \(s^2 = \mathrm{Id}_E\), donc \(X^2 - 1\) l'annule. Un endomorphisme nilpotent d'indice \(p\) vérifie \(u^p = 0\), donc \(X^p\) l'annule. Proposition — Existence d'un polynôme annulateur
En dimension finie, tout \(u \in \mathcal{L}(E)\) admet un polynôme annulateur non nul.
L'espace \(\mathcal{L}(E)\) est de dimension \(n^2\). La famille \(\bigl(\mathrm{Id}_E, u, u^2, \dots, u^{n^2}\bigr)\) compte \(n^2 + 1\) vecteurs de \(\mathcal{L}(E)\), donc est liée : il existe des scalaires \(a_0, \dots, a_{n^2}\), non tous nuls, tels que \(\sum_{k=0}^{n^2} a_k\, u^k = 0_{\mathcal{L}(E)}\). Le polynôme \(P = \sum_{k=0}^{n^2} a_k X^k\) est non nul et \(P(u) = 0\).
Theorem — Le polynôme minimal
Il existe un unique polynôme unitaire de degré minimal parmi les polynômes annulateurs non nuls de \(u\) : le polynôme minimal \(\pi_u\). Un polynôme \(P\) annule \(u\) si et seulement si $$ \textcolor{colorprop}{\pi_u \mid P.} $$
Une constante non nulle \(c\) vérifie \(c(u) = c\,\mathrm{Id}_E \ne 0\), donc un polynôme annulateur non nul est de degré au moins \(1\). L'ensemble des degrés des polynômes annulateurs non nuls est une partie non vide de \(\mathbb{N}\) (proposition ci-dessus), elle admet donc un plus petit élément \(d\) ; choisissons un annulateur non nul de degré \(d\) et divisons-le par son coefficient dominant pour obtenir un annulateur unitaire \(\pi_u\) de degré \(d\).
Soit \(P\) un polynôme annulateur quelconque. La division euclidienne par \(\pi_u\) donne \(P = Q\,\pi_u + R\) avec \(\deg R < d\). Alors \(R(u) = P(u) - Q(u) \circ \pi_u(u) = 0 - 0 = 0\), donc \(R\) annule \(u\) ; si \(R \ne 0\), ce serait un annulateur non nul de degré \(< d\), contre la minimalité de \(d\) --- donc \(R = 0\) et \(\pi_u \mid P\). Réciproquement, si \(\pi_u \mid P\), disons \(P = Q\,\pi_u\), alors \(P(u) = Q(u) \circ \pi_u(u) = 0\).
Unicité : si \(\pi\) et \(\pi'\) sont deux annulateurs unitaires de degré minimal \(d\), chacun divise l'autre (tous deux annulent \(u\)), donc ils sont égaux à un scalaire près ; tous deux unitaires force \(\pi = \pi'\).
Soit \(P\) un polynôme annulateur quelconque. La division euclidienne par \(\pi_u\) donne \(P = Q\,\pi_u + R\) avec \(\deg R < d\). Alors \(R(u) = P(u) - Q(u) \circ \pi_u(u) = 0 - 0 = 0\), donc \(R\) annule \(u\) ; si \(R \ne 0\), ce serait un annulateur non nul de degré \(< d\), contre la minimalité de \(d\) --- donc \(R = 0\) et \(\pi_u \mid P\). Réciproquement, si \(\pi_u \mid P\), disons \(P = Q\,\pi_u\), alors \(P(u) = Q(u) \circ \pi_u(u) = 0\).
Unicité : si \(\pi\) et \(\pi'\) sont deux annulateurs unitaires de degré minimal \(d\), chacun divise l'autre (tous deux annulent \(u\)), donc ils sont égaux à un scalaire près ; tous deux unitaires force \(\pi = \pi'\).
Exemple — Polynômes minimaux d'endomorphismes familiers
L'homothétie \(\lambda\,\mathrm{Id}_E\) a pour \(\pi_u = X - \lambda\). Un projecteur \(p\) a \(\pi_p = X^2 - X\), sauf si \(p = 0\) (\(\pi_p = X\)) ou \(p = \mathrm{Id}_E\) (\(\pi_p = X - 1\)). Une symétrie \(s\) a \(\pi_s = X^2 - 1\), sauf si \(s = \mathrm{Id}_E\) (\(\pi_s = X - 1\)) ou \(s = -\mathrm{Id}_E\) (\(\pi_s = X + 1\)). Dans les cas non dégénérés le degré est \(2\), car aucun polynôme de degré \(1\), \(X - \mu\), n'annule un \(p\) ou un \(s\) qui n'est pas une homothétie. Proposition — Invariance par similitude du polynôme minimal
Deux matrices semblables ont le même polynôme minimal. Par conséquent le polynôme minimal d'un endomorphisme ne dépend pas de la base choisie pour le représenter.
Soit \(M' = Q^{-1} M Q\) avec \(Q\) inversible. Pour tout \(k\), \((M')^k = Q^{-1} M^k Q\), donc par linéarité \(P(M') = Q^{-1} P(M)\, Q\) pour tout \(P \in \mathbb{K}[X]\). Donc \(P(M') = 0 \iff P(M) = 0\) : \(M\) et \(M'\) ont exactement les mêmes polynômes annulateurs, donc le même polynôme minimal. Comme les matrices d'un endomorphisme dans deux bases sont semblables, \(\pi_u\) est bien défini.
Proposition — Une base de l'algèbre des polynômes en u
Soit \(d = \deg \pi_u\). La famille \(\bigl(\mathrm{Id}_E, u, \dots, u^{d-1}\bigr)\) est une base de \(\mathbb{K}[u]\) ; en particulier \(\dim \mathbb{K}[u] = \deg \pi_u\).
Génératrice. Un élément de \(\mathbb{K}[u]\) est \(P(u)\) pour un certain \(P\). La division euclidienne par \(\pi_u\) donne \(P = Q\,\pi_u + R\) avec \(\deg R < d\), donc \(P(u) = Q(u) \circ \pi_u(u) + R(u) = R(u)\), combinaison linéaire de \(\mathrm{Id}_E, u, \dots, u^{d-1}\).
Libre. Une relation \(\sum_{k=0}^{d-1} c_k\, u^k = 0\) signifie que le polynôme \(R = \sum_{k=0}^{d-1} c_k X^k\) annule \(u\) ; comme \(\deg R < d = \deg \pi_u\), \(R\) ne peut être un annulateur non nul, donc \(R = 0\) et tous les \(c_k\) sont nuls.
La famille est donc une base de \(\mathbb{K}[u]\), de cardinal \(d\).
Libre. Une relation \(\sum_{k=0}^{d-1} c_k\, u^k = 0\) signifie que le polynôme \(R = \sum_{k=0}^{d-1} c_k X^k\) annule \(u\) ; comme \(\deg R < d = \deg \pi_u\), \(R\) ne peut être un annulateur non nul, donc \(R = 0\) et tous les \(c_k\) sont nuls.
La famille est donc une base de \(\mathbb{K}[u]\), de cardinal \(d\).
Exemple — Trouver un polynôme minimal
Déterminer le polynôme minimal de \(M = \begin{pmatrix} 3 & 1 \\ 0 & 3 \end{pmatrix}\).
Écrivons \(M = 3I_2 + N\) avec \(N = \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}\). Alors \(N^2 = 0\), donc \((M - 3I_2)^2 = N^2 = 0\) : le polynôme \((X - 3)^2\) annule \(M\). Aucun polynôme de degré \(1\) n'annule \(M\), car \(M - \mu I_2 = 0\) forcerait \(M\) à être une homothétie, ce qu'elle n'est pas. Donc le polynôme minimal, unitaire de plus petit degré, est $$ \pi_M = (X - 3)^2. $$
Méthode — Déterminer le polynôme minimal
Pour trouver \(\pi_u\) : - exhiber un polynôme annulateur non nul \(P\) --- souvent en repérant une relation sur \(u\) (un projecteur, une symétrie, un nilpotent, une identité donnée) ;
- alors \(\pi_u \mid P\), donc \(\pi_u\) est l'un des diviseurs unitaires de \(P\) ; on les teste par degré croissant --- celui de plus petit degré qui annule \(u\) est \(\pi_u\).
Compétences à pratiquer
- Déterminer un polynôme minimal
II
Le lemme de décomposition des noyaux
II.1
Le lemme des noyaux
Le noyau d'un polynôme en \(u\) peut être difficile à saisir directement. Mais lorsque le polynôme se factorise en facteurs premiers entre eux, le noyau se découpe en somme directe des noyaux des facteurs. Ce seul lemme --- démontré à partir du théorème de Bézout --- est le moteur de tout le reste du chapitre.
Theorem — Le lemme des noyaux
Soit \(P_1, P_2 \in \mathbb{K}[X]\) premiers entre eux. Pour tout \(u \in \mathcal{L}(E)\), $$ \textcolor{colorprop}{\mathrm{Ker}\bigl((P_1 P_2)(u)\bigr) = \mathrm{Ker}\bigl(P_1(u)\bigr) \oplus \mathrm{Ker}\bigl(P_2(u)\bigr).} $$
Comme \(P_1\) et \(P_2\) sont premiers entre eux, le théorème de Bézout (rappelé d'Arithmétique des polynômes) fournit \(A, B \in \mathbb{K}[X]\) avec \(A P_1 + B P_2 = 1\). En lisant ceci à travers le morphisme \(\Phi_u\) : $$ A(u) \circ P_1(u) + B(u) \circ P_2(u) = \mathrm{Id}_E. \tag{\(\star\)} $$ Les deux noyaux sont dans le membre de gauche. Comme \((P_1 P_2)(u) = P_2(u) \circ P_1(u) = P_1(u) \circ P_2(u)\), un vecteur annulé par \(P_1(u)\) ou par \(P_2(u)\) est annulé par \((P_1 P_2)(u)\).
La somme est directe. Soit \(x \in \mathrm{Ker}\bigl(P_1(u)\bigr) \cap \mathrm{Ker}\bigl(P_2(u)\bigr)\). En appliquant \((\star)\) à \(x\) : \(x = A(u)\bigl(P_1(u)(x)\bigr) + B(u)\bigl(P_2(u)(x)\bigr) = A(u)(0_E) + B(u)(0_E) = 0_E\).
La somme engendre le membre de gauche. Soit \(x \in \mathrm{Ker}\bigl((P_1 P_2)(u)\bigr)\). Posons \(x_1 = B(u)\bigl(P_2(u)(x)\bigr)\) et \(x_2 = A(u)\bigl(P_1(u)(x)\bigr)\) ; par \((\star)\), \(x = x_1 + x_2\). Or, tous ces polynômes en \(u\) commutant, $$ P_1(u)(x_1) = B(u)\bigl((P_1 P_2)(u)(x)\bigr) = B(u)(0_E) = 0_E, $$ donc \(x_1 \in \mathrm{Ker}\bigl(P_1(u)\bigr)\) ; de même \(P_2(u)(x_2) = A(u)\bigl((P_1 P_2)(u)(x)\bigr) = 0_E\), donc \(x_2 \in \mathrm{Ker}\bigl(P_2(u)\bigr)\).
Les trois points réunis donnent la somme directe annoncée.
La somme est directe. Soit \(x \in \mathrm{Ker}\bigl(P_1(u)\bigr) \cap \mathrm{Ker}\bigl(P_2(u)\bigr)\). En appliquant \((\star)\) à \(x\) : \(x = A(u)\bigl(P_1(u)(x)\bigr) + B(u)\bigl(P_2(u)(x)\bigr) = A(u)(0_E) + B(u)(0_E) = 0_E\).
La somme engendre le membre de gauche. Soit \(x \in \mathrm{Ker}\bigl((P_1 P_2)(u)\bigr)\). Posons \(x_1 = B(u)\bigl(P_2(u)(x)\bigr)\) et \(x_2 = A(u)\bigl(P_1(u)(x)\bigr)\) ; par \((\star)\), \(x = x_1 + x_2\). Or, tous ces polynômes en \(u\) commutant, $$ P_1(u)(x_1) = B(u)\bigl((P_1 P_2)(u)(x)\bigr) = B(u)(0_E) = 0_E, $$ donc \(x_1 \in \mathrm{Ker}\bigl(P_1(u)\bigr)\) ; de même \(P_2(u)(x_2) = A(u)\bigl((P_1 P_2)(u)(x)\bigr) = 0_E\), donc \(x_2 \in \mathrm{Ker}\bigl(P_2(u)\bigr)\).
Les trois points réunis donnent la somme directe annoncée.
Exemple — Le lemme des noyaux sur un projecteur
Un projecteur \(p\) vérifie \(p^2 - p = 0\), donc \(X^2 - X = X(X-1)\) l'annule et \(\mathrm{Ker}\bigl((X^2-X)(p)\bigr) = E\). Les facteurs \(X\) et \(X - 1\) sont premiers entre eux (\(1 \cdot X + (-1)(X-1) = 1\)), donc le lemme donne $$ E = \mathrm{Ker}(p) \oplus \mathrm{Ker}(p - \mathrm{Id}_E), $$ la décomposition de \(E\) en le noyau et l'image du projecteur --- retrouvée ici comme un cas du lemme des noyaux. Theorem — Le lemme des noyaux pour plusieurs facteurs
Soit \(P_1, \dots, P_r \in \mathbb{K}[X]\) deux à deux premiers entre eux et \(P = P_1 \cdots P_r\). Pour tout \(u \in \mathcal{L}(E)\), $$ \mathrm{Ker}\bigl(P(u)\bigr) = \bigoplus_{i=1}^r \mathrm{Ker}\bigl(P_i(u)\bigr). $$
Récurrence sur \(r\). Le cas \(r = 1\) est trivial et \(r = 2\) est le lemme des noyaux. Supposons le résultat acquis pour \(r - 1\) facteurs (\(r \ge 3\)). Les polynômes \(P_1, \dots, P_{r-1}\) sont chacun premiers avec \(P_r\), et un produit de polynômes chacun premier avec \(P_r\) est premier avec \(P_r\) (rappelé d'Arithmétique des polynômes), donc \(P_1 \cdots P_{r-1}\) est premier avec \(P_r\). Le lemme à deux facteurs appliqué à \((P_1 \cdots P_{r-1},\, P_r)\) donne $$ \mathrm{Ker}\bigl(P(u)\bigr) = \mathrm{Ker}\bigl((P_1 \cdots P_{r-1})(u)\bigr) \oplus \mathrm{Ker}\bigl(P_r(u)\bigr), $$ et l'hypothèse de récurrence décompose \(\mathrm{Ker}\bigl((P_1 \cdots P_{r-1})(u)\bigr) = \bigoplus_{i=1}^{r-1} \mathrm{Ker}\bigl(P_i(u)\bigr)\). La concaténation des deux donne la décomposition annoncée.
Exemple — Un noyau découpé par un facteur quadratique
Supposons que \(u \in \mathcal{L}(E)\), avec \(E\) un espace vectoriel réel, vérifie \((u^2 + \mathrm{Id}_E) \circ (u - \mathrm{Id}_E) = 0\). Les polynômes \(X^2 + 1\) et \(X - 1\) sont premiers entre eux dans \(\mathbb{R}[X]\) (le réel \(1\) n'est pas racine de \(X^2 + 1\)), donc le lemme donne $$ E = \mathrm{Ker}(u^2 + \mathrm{Id}_E) \oplus \mathrm{Ker}(u - \mathrm{Id}_E). $$ Le lemme des noyaux s'applique tout aussi bien à un facteur non linéaire. Compétences à pratiquer
- Appliquer le lemme des noyaux
II.2
Décomposition de l'espace par un polynôme annulateur
Lorsque le polynôme soumis au lemme des noyaux annule \(u\), son noyau est l'espace entier. Le lemme décompose alors \(E\) lui-même en somme directe de sous-espaces stables par \(u\) --- le pont entre une relation polynomiale et la réduction géométrique de \(u\).
Proposition — Décomposition par un polynôme annulateur
Soit \(P\) un polynôme annulateur non nul de \(u\) se factorisant en \(P = P_1 \cdots P_r\) avec les \(P_i\) deux à deux premiers entre eux. Alors $$ E = \bigoplus_{i=1}^r \mathrm{Ker}\bigl(P_i(u)\bigr), $$ et chaque \(\mathrm{Ker}\bigl(P_i(u)\bigr)\) est stable par \(u\).
Comme \(P\) annule \(u\), \(P(u) = 0\) et \(\mathrm{Ker}\bigl(P(u)\bigr) = E\). Le lemme des noyaux pour plusieurs facteurs donne \(E = \bigoplus_i \mathrm{Ker}\bigl(P_i(u)\bigr)\). Chaque \(\mathrm{Ker}\bigl(P_i(u)\bigr)\) est stable par \(u\) d'après la proposition du § 1.1.
Proposition — L'endomorphisme induit est annulé par le facteur
Dans la décomposition \(E = \bigoplus_i \mathrm{Ker}\bigl(P_i(u)\bigr)\) ci-dessus, l'endomorphisme induit par \(u\) sur \(\mathrm{Ker}\bigl(P_i(u)\bigr)\) est annulé par \(P_i\).
Notons \(F_i = \mathrm{Ker}\bigl(P_i(u)\bigr)\) et soit \(u_i\) l'endomorphisme induit par \(u\) sur \(F_i\) (bien défini, \(F_i\) étant stable par \(u\)). Comme \(F_i\) est stable par \(u\), \(u_i^k = (u^k)_{|F_i}\) pour tout \(k\), donc \(P_i(u_i) = \bigl(P_i(u)\bigr)_{|F_i}\). Pour \(x \in F_i\), \(P_i(u)(x) = 0_E\) par définition de \(F_i\), donc \(P_i(u_i)(x) = 0_E\) ; ceci vaut pour tout \(x \in F_i\), donc \(P_i(u_i) = 0\).
Exemple — Un espace découpé par une relation cubique
Supposons \(u^3 = u\), c'est-à-dire \((X^3 - X)(u) = 0\). La factorisation \(X^3 - X = X(X-1)(X+1)\) a des facteurs deux à deux premiers entre eux, donc $$ E = \mathrm{Ker}(u) \oplus \mathrm{Ker}(u - \mathrm{Id}_E) \oplus \mathrm{Ker}(u + \mathrm{Id}_E). $$ Une seule relation \(u^3 = u\) découpe ainsi \(E\) en trois sous-espaces stables par \(u\), sur lesquels \(u\) agit respectivement comme l'application nulle, comme l'identité et comme l'opposée de l'identité de ce sous-espace.
La décomposition en noyaux \(E = \bigoplus_i \mathrm{Ker}\bigl(P_i(u)\bigr)\) présente l'espace comme une rangée de boîtes stables par \(u\) indépendantes, une par facteur premier d'un polynôme annulateur.
Méthode — Décomposer l'espace à partir d'un polynôme annulateur
Étant donné un polynôme annulateur non nul \(P\) de \(u\) : - factoriser \(P\) en facteurs deux à deux premiers entre eux \(P = P_1 \cdots P_r\) --- par exemple ses facteurs irréductibles unitaires distincts élevés à leurs puissances, un facteur scalaire non nul étant sans effet sur les noyaux ;
- l'espace se découpe alors en \(E = \bigoplus_i \mathrm{Ker}\bigl(P_i(u)\bigr)\), somme directe de sous-espaces stables par \(u\) ;
- étudier \(u\) sur chaque \(\mathrm{Ker}\bigl(P_i(u)\bigr)\) séparément --- l'endomorphisme induit y est annulé par le seul facteur \(P_i\).
Compétences à pratiquer
- Décomposer un espace par un polynôme annulateur
III
Polynômes annulateurs et diagonalisabilité
III.1
Valeurs propres et racines du polynôme minimal
Un polynôme annulateur dit quelque chose sur les valeurs propres : toute valeur propre doit en être une racine. Le polynôme minimal le dit exactement --- ses racines dans \(\mathbb{K}\) sont précisément le spectre. Cela cerne les valeurs propres sans calculer le moindre déterminant.
Proposition — Valeurs propres et polynômes annulateurs
Si \(u(x) = \lambda x\), alors \(P(u)(x) = P(\lambda)\,x\) pour tout \(P \in \mathbb{K}[X]\). Par conséquent toute valeur propre de \(u\) est une racine de tout polynôme annulateur de \(u\).
De \(u(x) = \lambda x\) une récurrence immédiate donne \(u^k(x) = \lambda^k x\) pour tout \(k\). Donc, pour \(P = \sum_k a_k X^k\), $$ P(u)(x) = \sum_k a_k\, u^k(x) = \sum_k a_k\, \lambda^k x = P(\lambda)\, x. $$ Soit maintenant \(\lambda\) une valeur propre, de vecteur propre \(x \ne 0_E\), et \(P\) un polynôme annulateur. Alors \(P(\lambda)\,x = P(u)(x) = 0_E\), et \(x \ne 0_E\) force \(P(\lambda) = 0\) : \(\lambda\) est racine de \(P\).
Exemple — Borner le spectre
Si \(u^2 = u\), alors \(X^2 - X\) annule \(u\), donc toute valeur propre est racine de \(X^2 - X\) : \(\mathrm{Sp}(u) \subset \{0, 1\}\). Si \(u^3 = \mathrm{Id}_E\) avec \(E\) un espace vectoriel réel, alors \(X^3 - 1\) annule \(u\) ; sa seule racine réelle est \(1\), donc \(\mathrm{Sp}(u) \subset \{1\}\) --- éventuellement vide, si \(u\) n'a pas de valeur propre réelle. Un polynôme annulateur borne le spectre avant tout calcul de sous-espace propre. Theorem — Les racines du polynôme minimal
Les racines de \(\pi_u\) appartenant à \(\mathbb{K}\) sont exactement les valeurs propres de \(u\) : $$ \textcolor{colorprop}{\{\text{racines de }\pi_u\text{ dans }\mathbb{K}\} = \mathrm{Sp}(u).} $$
\(\pi_u\) annule \(u\), donc par la proposition ci-dessus toute valeur propre de \(u\) est racine de \(\pi_u\) : \(\mathrm{Sp}(u) \subset \{\text{racines de }\pi_u\text{ dans }\mathbb{K}\}\).
Réciproquement, soit \(\lambda \in \mathbb{K}\) une racine de \(\pi_u\). Écrivons \(\pi_u = (X - \lambda)\,Q\) avec \(Q \in \mathbb{K}[X]\) et \(\deg Q = \deg \pi_u - 1 < \deg \pi_u\). Par minimalité de \(\pi_u\), \(Q\) n'annule pas \(u\), donc \(Q(u) \ne 0\) : il existe un vecteur \(y\) avec \(Q(u)(y) \ne 0_E\). Alors $$ (u - \lambda\,\mathrm{Id}_E)\bigl(Q(u)(y)\bigr) = \bigl((X - \lambda)\,Q\bigr)(u)(y) = \pi_u(u)(y) = 0_E, $$ donc \(Q(u)(y)\) est un vecteur non nul vérifiant \(u\bigl(Q(u)(y)\bigr) = \lambda\, Q(u)(y)\) : \(\lambda\) est valeur propre de \(u\).
Réciproquement, soit \(\lambda \in \mathbb{K}\) une racine de \(\pi_u\). Écrivons \(\pi_u = (X - \lambda)\,Q\) avec \(Q \in \mathbb{K}[X]\) et \(\deg Q = \deg \pi_u - 1 < \deg \pi_u\). Par minimalité de \(\pi_u\), \(Q\) n'annule pas \(u\), donc \(Q(u) \ne 0\) : il existe un vecteur \(y\) avec \(Q(u)(y) \ne 0_E\). Alors $$ (u - \lambda\,\mathrm{Id}_E)\bigl(Q(u)(y)\bigr) = \bigl((X - \lambda)\,Q\bigr)(u)(y) = \pi_u(u)(y) = 0_E, $$ donc \(Q(u)(y)\) est un vecteur non nul vérifiant \(u\bigl(Q(u)(y)\bigr) = \lambda\, Q(u)(y)\) : \(\lambda\) est valeur propre de \(u\).
Exemple — Spectre lu sur le polynôme minimal
Si \(\pi_u = (X - 2)^3 (X + 1)\) sur \(\mathbb{K} = \mathbb{R}\), alors \(\mathrm{Sp}(u) = \{2, -1\}\) exactement --- les multiplicités dans \(\pi_u\) ne jouent aucun rôle ici. Attention, un annulateur non minimal ne donne qu'une inclusion : \(X(X-1)(X-2)\) annule tout projecteur \(p\) (car \(X^2 - X\) le divise), pourtant \(\mathrm{Sp}(p) \subset \{0, 1\}\), strictement inclus dans l'ensemble des racines \(\{0, 1, 2\}\). Seul \(\pi_u\) cerne le spectre. Méthode — Borner le spectre à l'aide d'un polynôme annulateur
Pour localiser les valeurs propres de \(u\) sans calculer de sous-espaces propres : - exhiber un polynôme annulateur \(P\) quelconque --- alors \(\mathrm{Sp}(u)\) est contenu dans l'ensemble des racines de \(P\) appartenant à \(\mathbb{K}\) ;
- pour le spectre exact, utiliser le polynôme minimal : \(\mathrm{Sp}(u)\) est exactement l'ensemble des racines de \(\pi_u\) dans \(\mathbb{K}\).
Compétences à pratiquer
- Localiser le spectre par un polynôme annulateur
III.2
Le critère polynomial de diagonalisabilité
La diagonalisabilité a été caractérisée dans Réduction : éléments propres, diagonalisation en comptant les dimensions des sous-espaces propres. Le polynôme minimal en donne un test bien plus économique : \(u\) est diagonalisable exactement lorsque \(\pi_u\) est scindé à racines simples --- un seul polynôme à examiner.
Theorem — Le critère polynomial de diagonalisabilité
Pour \(u \in \mathcal{L}(E)\), les propriétés suivantes sont équivalentes : - [(i)] \(u\) est diagonalisable ;
- [(ii)] un polynôme non nul scindé à racines simples annule \(u\) ;
- [(iii)] \(\pi_u\) est scindé à racines simples.
(i)\(\Rightarrow\)(ii). Si \(u\) est diagonalisable, \(E = \bigoplus_{\lambda \in \mathrm{Sp}(u)} E_\lambda(u)\). Posons \(P = \prod_{\lambda \in \mathrm{Sp}(u)}(X - \lambda)\), scindé à racines simples (les valeurs propres sont distinctes). Pour \(x \in E_\mu(u)\), le facteur \((X - \mu)\) de \(P\) donne \(P(u)(x) = 0_E\) ; comme tout vecteur de \(E\) est une somme de tels vecteurs, \(P(u) = 0\). Donc \(P\) est un annulateur non nul scindé à racines simples.
(ii)\(\Rightarrow\)(iii). Soit \(P\) un annulateur non nul scindé à racines simples. Alors \(\pi_u \mid P\), donc \(\pi_u\) est un diviseur unitaire de \(P\) ; les racines de \(\pi_u\) forment un sous-ensemble des racines (distinctes) de \(P\), donc \(\pi_u\) est scindé à racines simples.
(iii)\(\Rightarrow\)(i). Écrivons \(\pi_u = \prod_{i=1}^r (X - \lambda_i)\) avec les \(\lambda_i\) distincts. Les facteurs \((X - \lambda_i)\) sont deux à deux premiers entre eux, et \(\pi_u\) annule \(u\), donc la proposition du § 2.2 donne $$ E = \bigoplus_{i=1}^r \mathrm{Ker}(u - \lambda_i\,\mathrm{Id}_E) = \bigoplus_{i=1}^r E_{\lambda_i}(u). $$ \(E\) est une somme directe de sous-espaces propres de \(u\), donc \(u\) est diagonalisable.
(ii)\(\Rightarrow\)(iii). Soit \(P\) un annulateur non nul scindé à racines simples. Alors \(\pi_u \mid P\), donc \(\pi_u\) est un diviseur unitaire de \(P\) ; les racines de \(\pi_u\) forment un sous-ensemble des racines (distinctes) de \(P\), donc \(\pi_u\) est scindé à racines simples.
(iii)\(\Rightarrow\)(i). Écrivons \(\pi_u = \prod_{i=1}^r (X - \lambda_i)\) avec les \(\lambda_i\) distincts. Les facteurs \((X - \lambda_i)\) sont deux à deux premiers entre eux, et \(\pi_u\) annule \(u\), donc la proposition du § 2.2 donne $$ E = \bigoplus_{i=1}^r \mathrm{Ker}(u - \lambda_i\,\mathrm{Id}_E) = \bigoplus_{i=1}^r E_{\lambda_i}(u). $$ \(E\) est une somme directe de sous-espaces propres de \(u\), donc \(u\) est diagonalisable.
Exemple — Projecteurs et symétries sont diagonalisables
Un projecteur vérifie \(p^2 - p = 0\), donc \(X^2 - X = X(X-1)\) l'annule --- scindé à racines simples \(0\) et \(1\) ; par le critère, tout projecteur est diagonalisable. Une symétrie vérifie \(s^2 - \mathrm{Id}_E = 0\), donc \(X^2 - 1 = (X-1)(X+1)\) l'annule --- scindé à racines simples ; toute symétrie est diagonalisable. Aucun calcul de sous-espace propre n'est nécessaire. Exemple — La diagonalisabilité dépend du corps
La matrice \(R = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}\) vérifie \(R^2 = -I_2\), donc \(X^2 + 1\) l'annule ; et \(R\) n'est pas une homothétie, donc aucun polynôme de degré \(1\) ne l'annule --- d'où \(\pi_R = X^2 + 1\). Sur \(\mathbb{R}\), \(X^2 + 1\) n'est pas scindé, donc \(R\) n'est pas diagonalisable dans \(\mathcal{M}_2(\mathbb{R})\). Sur \(\mathbb{C}\), \(X^2 + 1 = (X - \mathrm{i})(X + \mathrm{i})\) est scindé à racines simples, donc la même matrice, vue dans \(\mathcal{M}_2(\mathbb{C})\), est diagonalisable. Un annulateur quelconque non scindé ne prouve rien sur la diagonalisabilité. Pour établir que \(u\) n'est pas diagonalisable, utiliser le polynôme minimal --- \(u\) est diagonalisable si et seulement si \(\pi_u\) est scindé à racines simples --- ou un critère de Réduction : éléments propres, diagonalisation. Proposition — Diagonalisabilité d'un endomorphisme induit
Si \(u\) est diagonalisable et \(F\) un sous-espace non nul stable par \(u\), l'endomorphisme induit par \(u\) sur \(F\) est diagonalisable.
Soit \(u_F\) l'endomorphisme induit. Comme \(F\) est stable par \(u\), \(\pi_u(u_F) = \bigl(\pi_u(u)\bigr)_{|F} = 0\), donc \(\pi_u\) annule \(u_F\). Comme \(u\) est diagonalisable, \(\pi_u\) est scindé à racines simples ; un polynôme non nul scindé à racines simples annule \(u_F\), donc \(u_F\) est diagonalisable par le critère.
Exemple — Diagonalisabilité sans sous-espaces propres
Montrer que \(M = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\) est diagonalisable, sans calculer ses sous-espaces propres.
Un calcul direct donne \(M^2 = I_2\), donc le polynôme \(X^2 - 1\) annule \(M\). Or \(X^2 - 1 = (X - 1)(X + 1)\) est scindé sur \(\mathbb{R}\) avec les deux racines simples \(1\) et \(-1\). Un polynôme non nul scindé à racines simples annule \(M\), donc par le critère polynomial \(M\) est diagonalisable.
Méthode — Démontrer la diagonalisabilité par un polynôme annulateur
Pour montrer que \(u\) est diagonalisable sans calculer de sous-espaces propres : - trouver un polynôme non nul annulant \(u\) --- typiquement à partir d'une relation telle que \(u^2 = \mathrm{Id}_E\), \(u^2 = u\), ou une identité donnée ;
- vérifier qu'il est scindé à racines simples ; si oui, \(u\) est diagonalisable ;
- pour prouver que \(u\) n'est pas diagonalisable, un annulateur quelconque ne suffit pas : invoquer le polynôme minimal (\(u\) est diagonalisable si et seulement si \(\pi_u\) est scindé à racines simples), ou un critère de Réduction : éléments propres, diagonalisation.
Compétences à pratiquer
- Démontrer la diagonalisabilité par un polynôme
IV
Cayley-Hamilton et sous-espaces caractéristiques
IV.1
Le théorème de Cayley-Hamilton
Jusqu'ici un polynôme annulateur devait être trouvé à la main. Le théorème de Cayley--Hamilton en fournit un gratuitement : le polynôme caractéristique annule toujours l'endomorphisme. Tout endomorphisme porte ainsi un polynôme annulateur canonique de degré \(n\).
Theorem — Le théorème de Cayley-Hamilton
Pour tout \(u \in \mathcal{L}(E)\), $$ \textcolor{colorprop}{\chi_u(u) = 0_{\mathcal{L}(E)}.} $$ Le polynôme caractéristique de \(u\) annule \(u\).
Pour \(x = 0_E\), \(\chi_u(u)(0_E) = 0_E\) trivialement ; fixons \(x \ne 0_E\). Les entiers \(j \ge 1\) pour lesquels \(\bigl(x, u(x), \dots, u^{j-1}(x)\bigr)\) est libre sont bornés par \(n = \dim E\), il existe donc un plus grand tel \(p\) ; soit \(F\) le sous-espace engendré par \(\bigl(x, u(x), \dots, u^{p-1}(x)\bigr)\), de dimension \(p\).
Par maximalité de \(p\), le vecteur \(u^p(x)\) est combinaison linéaire des précédents : $$ u^p(x) = \sum_{k=0}^{p-1} a_k\, u^k(x). $$ Donc \(F\) est stable par \(u\), et dans la base \(\bigl(x, u(x), \dots, u^{p-1}(x)\bigr)\) --- où \(u\) envoie chaque vecteur sur le suivant, et le dernier sur \(u^p(x) = \sum_k a_k u^k(x)\) --- la matrice de l'endomorphisme induit \(u_F\) est la matrice compagnon $$ C = \begin{pmatrix} 0 & 0 & \cdots & 0 & a_0 \\ 1 & 0 & \cdots & 0 & a_1 \\ 0 & 1 & \cdots & 0 & a_2 \\ \vdots & & \ddots & & \vdots \\ 0 & 0 & \cdots & 1 & a_{p-1} \end{pmatrix}. $$ Développons \(\det(X I_p - C)\) selon sa première ligne \((X, 0, \dots, 0, -a_0)\) : le coefficient \(X\) contribue \(X\,\det(X I_{p-1} - C')\), où \(C'\) est la matrice compagnon de \(X^{p-1} - \sum_{k=1}^{p-1} a_k X^{k-1}\) ; le coefficient \(-a_0\) contribue \((-a_0)\,(-1)^{1+p}\,(-1)^{p-1} = -a_0\), son mineur étant triangulaire supérieur de coefficients diagonaux \(-1\). Par récurrence sur \(p\) --- le cas de base \(p = 1\) étant \(\det(X - a_0) = X - a_0\) --- \(\det(X I_{p-1} - C') = X^{p-1} - \sum_{k=1}^{p-1} a_k X^{k-1}\), d'où $$ \chi_{u_F} = \det(X I_p - C) = X\Bigl(X^{p-1} - \sum_{k=1}^{p-1} a_k X^{k-1}\Bigr) - a_0 = X^p - \sum_{k=0}^{p-1} a_k X^k. $$ Donc \(\chi_{u_F}(u)(x) = u^p(x) - \sum_{k=0}^{p-1} a_k\, u^k(x) = 0_E\). Comme \(F\) est un sous-espace non nul stable par \(u\), \(\chi_{u_F} \mid \chi_u\) (rappelé de Réduction : éléments propres, diagonalisation) ; en écrivant \(\chi_u = \chi_{u_F}\, R\), $$ \chi_u(u)(x) = R(u)\bigl(\chi_{u_F}(u)(x)\bigr) = R(u)(0_E) = 0_E. $$ Ceci vaut pour tout \(x \ne 0_E\), et aussi pour \(x = 0_E\), donc \(\chi_u(u) = 0\).
Par maximalité de \(p\), le vecteur \(u^p(x)\) est combinaison linéaire des précédents : $$ u^p(x) = \sum_{k=0}^{p-1} a_k\, u^k(x). $$ Donc \(F\) est stable par \(u\), et dans la base \(\bigl(x, u(x), \dots, u^{p-1}(x)\bigr)\) --- où \(u\) envoie chaque vecteur sur le suivant, et le dernier sur \(u^p(x) = \sum_k a_k u^k(x)\) --- la matrice de l'endomorphisme induit \(u_F\) est la matrice compagnon $$ C = \begin{pmatrix} 0 & 0 & \cdots & 0 & a_0 \\ 1 & 0 & \cdots & 0 & a_1 \\ 0 & 1 & \cdots & 0 & a_2 \\ \vdots & & \ddots & & \vdots \\ 0 & 0 & \cdots & 1 & a_{p-1} \end{pmatrix}. $$ Développons \(\det(X I_p - C)\) selon sa première ligne \((X, 0, \dots, 0, -a_0)\) : le coefficient \(X\) contribue \(X\,\det(X I_{p-1} - C')\), où \(C'\) est la matrice compagnon de \(X^{p-1} - \sum_{k=1}^{p-1} a_k X^{k-1}\) ; le coefficient \(-a_0\) contribue \((-a_0)\,(-1)^{1+p}\,(-1)^{p-1} = -a_0\), son mineur étant triangulaire supérieur de coefficients diagonaux \(-1\). Par récurrence sur \(p\) --- le cas de base \(p = 1\) étant \(\det(X - a_0) = X - a_0\) --- \(\det(X I_{p-1} - C') = X^{p-1} - \sum_{k=1}^{p-1} a_k X^{k-1}\), d'où $$ \chi_{u_F} = \det(X I_p - C) = X\Bigl(X^{p-1} - \sum_{k=1}^{p-1} a_k X^{k-1}\Bigr) - a_0 = X^p - \sum_{k=0}^{p-1} a_k X^k. $$ Donc \(\chi_{u_F}(u)(x) = u^p(x) - \sum_{k=0}^{p-1} a_k\, u^k(x) = 0_E\). Comme \(F\) est un sous-espace non nul stable par \(u\), \(\chi_{u_F} \mid \chi_u\) (rappelé de Réduction : éléments propres, diagonalisation) ; en écrivant \(\chi_u = \chi_{u_F}\, R\), $$ \chi_u(u)(x) = R(u)\bigl(\chi_{u_F}(u)(x)\bigr) = R(u)(0_E) = 0_E. $$ Ceci vaut pour tout \(x \ne 0_E\), et aussi pour \(x = 0_E\), donc \(\chi_u(u) = 0\).
Remarque. L'énoncé du théorème de Cayley--Hamilton est entièrement au programme ; sa démonstration est « non exigible » aux concours. Elle est donnée ci-dessus, le seul point auxiliaire --- le polynôme caractéristique d'une matrice compagnon --- étant un calcul de déterminant standard (développement par cofacteurs, récurrence sur la taille).
Exemple — Cayley-Hamilton pour une matrice 2 par 2
Pour \(M = \begin{pmatrix} a & b \\ c & d \end{pmatrix}\), \(\chi_M = X^2 - (a + d)X + (ad - bc)\). À partir de \(M^2 = \begin{pmatrix} a^2 + bc & b(a+d) \\ c(a+d) & d^2 + bc \end{pmatrix}\), les coefficients hors diagonale de \(M^2 - (a+d)M\) s'annulent et ceux de la diagonale se réduisent : $$ M^2 - (a+d)M = \begin{pmatrix} bc - ad & 0 \\
0 & bc - ad \end{pmatrix} = (bc - ad)\,I_2, $$ donc $$ \chi_M(M) = M^2 - (a+d)M + (ad - bc)I_2 = (bc - ad)I_2 + (ad - bc)I_2 = 0. $$ Proposition — Le polynôme minimal divise le polynôme caractéristique
Pour tout \(u \in \mathcal{L}(E)\), \(\pi_u \mid \chi_u\) ; en particulier \(\deg \pi_u \le n\).
Par Cayley--Hamilton, \(\chi_u\) annule \(u\) ; et \(\pi_u\) divise tout polynôme annulateur, donc \(\pi_u \mid \chi_u\). Donc \(\deg \pi_u \le \deg \chi_u = n\).
Proposition — Racines communes au polynôme minimal et au polynôme caractéristique
Les polynômes \(\pi_u\) et \(\chi_u\) ont le même ensemble de racines dans \(\mathbb{K}\), à savoir \(\mathrm{Sp}(u)\) (leurs multiplicités peuvent différer). Par conséquent, si \(\chi_u\) est scindé, alors \(\pi_u\) est scindé.
Les racines de \(\pi_u\) dans \(\mathbb{K}\) sont exactement \(\mathrm{Sp}(u)\) (§ 3.1), et les racines de \(\chi_u\) dans \(\mathbb{K}\) sont exactement \(\mathrm{Sp}(u)\) (Réduction : éléments propres, diagonalisation) : les deux ensembles de racines dans \(\mathbb{K}\) coïncident. De plus \(\pi_u \mid \chi_u\) par la proposition précédente, et un diviseur unitaire d'un polynôme scindé est scindé (ses racines, comptées avec multiplicité, forment un sous-ensemble de celles du dividende), donc \(\chi_u\) scindé force \(\pi_u\) scindé.
Méthode — Calculer un inverse ou une puissance par Cayley-Hamilton
La relation \(\chi_u(u) = 0\) est une identité polynomiale de degré \(n\) en \(u\) : - en écrivant \(\chi_u = X^n + \dots + c_1 X + c_0\), si \(c_0 \ne 0\) (c'est-à-dire \(u\) inversible) alors \(u^{-1}\) est un polynôme en \(u\), lu sur \(\chi_u(u) = 0\) ;
- toute puissance élevée \(u^k\) se ramène à une combinaison de \(\mathrm{Id}_E, u, \dots, u^{n-1}\) en prenant le reste de \(X^k\) dans la division euclidienne par \(\chi_u\).
Exemple — Un inverse par Cayley-Hamilton
Pour \(M = \begin{pmatrix} 1 & 1 & 0 \\ 0 & 1 & 1 \\ 0 & 0 & 1 \end{pmatrix}\), \(\chi_M = (X - 1)^3 = X^3 - 3X^2 + 3X - 1\). Cayley--Hamilton donne \(M^3 - 3M^2 + 3M - I_3 = 0\), d'où \(M(M^2 - 3M + 3I_3) = I_3\) et $$ M^{-1} = M^2 - 3M + 3I_3 = \begin{pmatrix} 1 & -1 & 1 \\
0 & 1 & -1 \\
0 & 0 & 1 \end{pmatrix}. $$ Compétences à pratiquer
- Utiliser le théorème de Cayley-Hamilton
IV.2
Sous-espaces caractéristiques
Lorsque \(\chi_u\) est scindé, Cayley--Hamilton offre un polynôme annulateur scindé, et le lemme des noyaux qu'on lui applique décompose \(E\) en un sous-espace stable par \(u\) par valeur propre --- les sous-espaces caractéristiques. Ils contiennent les sous-espaces propres et mesurent exactement l'écart de \(u\) à la diagonalisabilité.
Définition — Sous-espace caractéristique
Soit \(\lambda\) une valeur propre de \(u\), de multiplicité \(m(\lambda)\). Le sous-espace caractéristique de \(u\) associé à \(\lambda\) est $$ \textcolor{colordef}{F_\lambda(u) = \mathrm{Ker}\bigl((u - \lambda\,\mathrm{Id}_E)^{m(\lambda)}\bigr).} $$
Le noyau de \(u - \lambda\,\mathrm{Id}_E\) est contenu dans le noyau de toute puissance de celui-ci, donc le sous-espace propre est inclus dans le sous-espace caractéristique : $$ E_\lambda(u) = \mathrm{Ker}(u - \lambda\,\mathrm{Id}_E) \subset F_\lambda(u). $$ En particulier \(F_\lambda(u) \ne \{0_E\}\), puisque \(\lambda\) est une valeur propre.
Theorem — Décomposition en sous-espaces caractéristiques
Si \(\chi_u\) est scindé, alors $$ E = \bigoplus_{\lambda \in \mathrm{Sp}(u)} F_\lambda(u), $$ somme directe de sous-espaces stables par \(u\).
Comme \(\chi_u\) est scindé, \(\chi_u = \prod_{\lambda \in \mathrm{Sp}(u)} (X - \lambda)^{m(\lambda)}\). Les facteurs \((X - \lambda)^{m(\lambda)}\), attachés à des valeurs propres distinctes, sont deux à deux premiers entre eux. Par Cayley--Hamilton, \(\chi_u\) annule \(u\). La proposition du § 2.2 donne alors $$ E = \bigoplus_{\lambda \in \mathrm{Sp}(u)} \mathrm{Ker}\bigl((u - \lambda\,\mathrm{Id}_E)^{m(\lambda)}\bigr) = \bigoplus_{\lambda \in \mathrm{Sp}(u)} F_\lambda(u), $$ chaque facteur stable par \(u\).
Proposition — Dimension d'un sous-espace caractéristique
Si \(\chi_u\) est scindé, alors \(\dim F_\lambda(u) = m(\lambda)\) pour toute valeur propre \(\lambda\).
Soit \(u_\lambda\) l'endomorphisme induit par \(u\) sur \(F_\lambda(u)\). Par définition de \(F_\lambda(u)\), \((u_\lambda - \lambda\,\mathrm{Id})^{m(\lambda)} = 0\), donc \(u_\lambda - \lambda\,\mathrm{Id}\) est nilpotent. Un endomorphisme nilpotent d'un espace de dimension \(q\) a pour polynôme caractéristique \(X^q\) (Réduction : éléments propres, diagonalisation), et \(\chi_{u_\lambda}(X) = \chi_{u_\lambda - \lambda\mathrm{Id}}(X - \lambda)\) (le décalage \(\det(XI - M) = \det((X-\lambda)I - (M - \lambda I))\)) ; donc \(\chi_{u_\lambda} = (X - \lambda)^{\dim F_\lambda(u)}\).
Comme \(F_\lambda(u)\) est un sous-espace non nul stable par \(u\), \(\chi_{u_\lambda} \mid \chi_u\) (Réduction : éléments propres, diagonalisation), donc \((X - \lambda)^{\dim F_\lambda(u)} \mid \chi_u\) et \(\dim F_\lambda(u) \le m(\lambda)\). En sommant sur \(\lambda \in \mathrm{Sp}(u)\) : \(\sum_\lambda \dim F_\lambda(u) = \dim E = n\) (la somme directe du théorème précédent), tandis que \(\sum_\lambda m(\lambda) = n\) (\(\chi_u\) scindé de degré \(n\)). Des inégalités \(\dim F_\lambda(u) \le m(\lambda)\) dont les deux membres ont la même somme \(n\) sont toutes des égalités, donc \(\dim F_\lambda(u) = m(\lambda)\) pour toute \(\lambda\).
Comme \(F_\lambda(u)\) est un sous-espace non nul stable par \(u\), \(\chi_{u_\lambda} \mid \chi_u\) (Réduction : éléments propres, diagonalisation), donc \((X - \lambda)^{\dim F_\lambda(u)} \mid \chi_u\) et \(\dim F_\lambda(u) \le m(\lambda)\). En sommant sur \(\lambda \in \mathrm{Sp}(u)\) : \(\sum_\lambda \dim F_\lambda(u) = \dim E = n\) (la somme directe du théorème précédent), tandis que \(\sum_\lambda m(\lambda) = n\) (\(\chi_u\) scindé de degré \(n\)). Des inégalités \(\dim F_\lambda(u) \le m(\lambda)\) dont les deux membres ont la même somme \(n\) sont toutes des égalités, donc \(\dim F_\lambda(u) = m(\lambda)\) pour toute \(\lambda\).
Exemple — Le sous-espace propre strictement dans le sous-espace caractéristique
Pour \(M = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}\), \(\chi_M = (X - 1)^2\), donc \(1\) est la seule valeur propre, avec \(m(1) = 2\). Le sous-espace propre est \(E_1(M) = \mathrm{Ker}(M - I_2)\), de dimension \(1\). Le sous-espace caractéristique est \(F_1(M) = \mathrm{Ker}\bigl((M - I_2)^2\bigr) = \mathrm{Ker}(0) = \mathbb{R}^2\), de dimension \(2 = m(1)\). Ici \(E_1(M) \subsetneq F_1(M)\) --- l'écart est exactement le défaut de diagonalisabilité de \(M\). Theorem — Diagonalisabilité par les sous-espaces caractéristiques
Supposons \(\chi_u\) scindé. Alors \(u\) est diagonalisable si et seulement si \(F_\lambda(u) = E_\lambda(u)\) pour toute valeur propre \(\lambda\).
\(u\) est diagonalisable si et seulement si \(\sum_{\lambda} \dim E_\lambda(u) = n\) (Réduction : éléments propres, diagonalisation). Or \(E_\lambda(u) \subset F_\lambda(u)\) avec \(\dim F_\lambda(u) = m(\lambda)\), donc \(\dim E_\lambda(u) \le m(\lambda)\), et \(E_\lambda(u) = F_\lambda(u)\) exactement lorsque \(\dim E_\lambda(u) = m(\lambda)\). Comme \(\sum_\lambda m(\lambda) = n\), l'égalité \(\sum_\lambda \dim E_\lambda(u) = n\) a lieu si et seulement si \(\dim E_\lambda(u) = m(\lambda)\) pour toute \(\lambda\), c'est-à-dire si et seulement si \(E_\lambda(u) = F_\lambda(u)\) pour toute \(\lambda\).
Exemple — Une décomposition en sous-espaces caractéristiques
Pour \(M = \begin{pmatrix} 2 & 1 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 3 \end{pmatrix}\), \(\chi_M = (X - 2)^2 (X - 3)\), donc \(m(2) = 2\) et \(m(3) = 1\). Ici \((M - 2I_3)^2 = \begin{pmatrix} 0 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix}\), donc \(F_2(M) = \mathrm{Ker}\bigl((M - 2I_3)^2\bigr) = \{(x, y, 0)\}\), de dimension \(2\), et \(F_3(M) = \mathrm{Ker}(M - 3I_3) = \{(0, 0, z)\}\), de dimension \(1\). La décomposition est \(\mathbb{R}^3 = F_2(M) \oplus F_3(M)\). Comme \(E_2(M) = \mathrm{Ker}(M - 2I_3) = \{(x, 0, 0)\}\) est de dimension \(1 < 2 = \dim F_2(M)\), la matrice \(M\) n'est pas diagonalisable.
Lorsque \(\chi_u\) est scindé, la décomposition \(E = \bigoplus_\lambda F_\lambda(u)\) met \(u\) sous forme diagonale par blocs, un bloc par valeur propre ; sur \(F_\lambda(u)\) l'endomorphisme induit est \(\lambda\,\mathrm{Id} + \text{(nilpotent)}\), les parties nilpotentes sur tous les sous-espaces caractéristiques s'annulant simultanément exactement lorsque \(u\) est diagonalisable.
Méthode — Calculer les sous-espaces caractéristiques
Lorsque \(\chi_u\) est scindé : - calculer \(\chi_u\) et lire ses racines \(\lambda\) avec leurs multiplicités \(m(\lambda)\) ;
- pour chaque \(\lambda\), calculer \(F_\lambda(u) = \mathrm{Ker}\bigl((u - \lambda\,\mathrm{Id}_E)^{m(\lambda)}\bigr)\) --- de dimension \(m(\lambda)\) ;
- alors \(E = \bigoplus_\lambda F_\lambda(u)\) ; une base adaptée à cette décomposition met \(u\) sous forme diagonale par blocs, un bloc par valeur propre, et en choisissant convenablement la base de chaque \(F_\lambda(u)\) ce bloc devient triangulaire avec l'unique coefficient diagonal \(\lambda\).
Pour aller plus loin
Ce chapitre a transformé une seule relation polynomiale \(P(u) = 0\) en toute la machinerie de la réduction : le polynôme minimal, le lemme des noyaux, le critère de diagonalisabilité, Cayley--Hamilton, les sous-espaces caractéristiques. Lorsque \(\chi_u\) est scindé, la décomposition \(E = \bigoplus_\lambda F_\lambda(u)\) présente \(u\), sur chaque bloc, comme une homothétie plus un endomorphisme nilpotent --- le point de départ de la décomposition de Dunford et de la réduction de Jordan, toutes deux hors programme et nommées ici comme l'horizon. Le pendant euclidien, le chapitre Endomorphismes autoadjoints, réduit une autre famille distinguée par le théorème spectral.
Compétences à pratiquer
- Calculer les sous-espaces caractéristiques
Aller à la section