CommeUnJeu · L2 MP
Compléments d'algèbre linéaire
Les chapitres de MPSI Espaces vectoriels de dimension finie et Représentation matricielle des applications linéaires ont construit le langage de travail de l'algèbre linéaire : dimension, bases, somme \(F + G\) et somme directe \(F \oplus G\) de deux sous-espaces, et matrice d'une application linéaire. Ce chapitre en est la continuation directe. Il donne trois outils, chacun une manière de décomposer un grand objet en pièces plus petites.
D'abord : la somme et la somme directe d'une famille finie \(F_1, \dots, F_p\) de sous-espaces, avec les bases adaptées à une décomposition \(E = F_1 \oplus \dots \oplus F_p\). Ensuite : les matrices par blocs --- une matrice découpée en blocs rectangulaires, sur lesquels somme et produit se calculent bloc par bloc, et dont le déterminant se réduit à un produit de déterminants de blocs lorsque la matrice est triangulaire par blocs. Enfin : les sous-espaces stables d'un endomorphisme et l'endomorphisme induit, le pont exact entre une décomposition stable de \(E\) et une matrice diagonale par blocs.
Le chapitre a trois sections, et elles convergent vers un résultat phare : lorsque \(E\) se décompose en somme directe de sous-espaces tous stables par un endomorphisme \(u\), la matrice de \(u\) dans une base adaptée est diagonale par blocs. Découper \(u\) ainsi en pièces indépendantes est exactement ce que fera la théorie de la réduction des chapitres suivants.
Notations permanentes. \(\mathbb{K}\) désigne un sous-corps de \(\mathbb{C}\) --- en pratique \(\mathbb{R}\) ou \(\mathbb{C}\). \(E\) est un \(\mathbb{K}\)-espace vectoriel, de dimension finie sauf mention contraire. Les sous-espaces sont notés \(F, G, F_1, \dots, F_p\) avec \(p \geq 1\). On note \(\dim E\) la dimension, \(\operatorname{Vect}(\cdot)\) le sous-espace engendré, \(\mathcal{L}(E)\) les endomorphismes de \(E\), et \(\operatorname{Mat}_{\mathcal{B}}(u)\) la matrice de \(u \in \mathcal{L}(E)\) dans une base \(\mathcal{B}\). Les notions de somme de deux sous-espaces, somme directe de deux sous-espaces, sous-espaces supplémentaires, formule de Grassmann, déterminant et sa multiplicativité sont celles des chapitres prérequis et sont utilisées ici sans redémonstration.
D'abord : la somme et la somme directe d'une famille finie \(F_1, \dots, F_p\) de sous-espaces, avec les bases adaptées à une décomposition \(E = F_1 \oplus \dots \oplus F_p\). Ensuite : les matrices par blocs --- une matrice découpée en blocs rectangulaires, sur lesquels somme et produit se calculent bloc par bloc, et dont le déterminant se réduit à un produit de déterminants de blocs lorsque la matrice est triangulaire par blocs. Enfin : les sous-espaces stables d'un endomorphisme et l'endomorphisme induit, le pont exact entre une décomposition stable de \(E\) et une matrice diagonale par blocs.
Le chapitre a trois sections, et elles convergent vers un résultat phare : lorsque \(E\) se décompose en somme directe de sous-espaces tous stables par un endomorphisme \(u\), la matrice de \(u\) dans une base adaptée est diagonale par blocs. Découper \(u\) ainsi en pièces indépendantes est exactement ce que fera la théorie de la réduction des chapitres suivants.
Notations permanentes. \(\mathbb{K}\) désigne un sous-corps de \(\mathbb{C}\) --- en pratique \(\mathbb{R}\) ou \(\mathbb{C}\). \(E\) est un \(\mathbb{K}\)-espace vectoriel, de dimension finie sauf mention contraire. Les sous-espaces sont notés \(F, G, F_1, \dots, F_p\) avec \(p \geq 1\). On note \(\dim E\) la dimension, \(\operatorname{Vect}(\cdot)\) le sous-espace engendré, \(\mathcal{L}(E)\) les endomorphismes de \(E\), et \(\operatorname{Mat}_{\mathcal{B}}(u)\) la matrice de \(u \in \mathcal{L}(E)\) dans une base \(\mathcal{B}\). Les notions de somme de deux sous-espaces, somme directe de deux sous-espaces, sous-espaces supplémentaires, formule de Grassmann, déterminant et sa multiplicativité sont celles des chapitres prérequis et sont utilisées ici sans redémonstration.
I
Somme et somme directe d'une famille finie de sous-espaces
I.1
Somme d'une famille finie de sous-espaces
Dans Espaces vectoriels de dimension finie, la somme \(F + G\) de deux sous-espaces a été définie comme l'ensemble des \(x + y\) avec \(x \in F\) et \(y \in G\), et reconnue comme le plus petit sous-espace contenant les deux. Rien dans cette idée n'est propre à deux sous-espaces. Cette sous-section la généralise à une famille finie \(F_1, \dots, F_p\) : la somme est encore un sous-espace, encore le plus petit contenant chaque \(F_i\).
Définition — Somme d'une famille finie de sous-espaces
Soient \(F_1, \dots, F_p\) des sous-espaces de \(E\). Leur somme, notée \(\sum_{i=1}^p F_i\) ou \(F_1 + \dots + F_p\), est l'ensemble des sommes d'un vecteur pris dans chaque \(F_i\) : $$ \sum_{i=1}^p F_i = \left\{\, x_1 + x_2 + \dots + x_p \ :\ x_i \in F_i \text{ pour tout } i \,\right\}. $$ Exemple — Trois droites de coordonnées de \(\mathbb{R}^3\)
Soit \((e_1, e_2, e_3)\) la base canonique de \(\mathbb{R}^3\) et \(D_i = \operatorname{Vect}(e_i)\). Une somme \(x_1 e_1 + x_2 e_2 + x_3 e_3\) avec \(x_i \in \mathbb{R}\) est le vecteur général de \(\mathbb{R}^3\), donc \(D_1 + D_2 + D_3 = \mathbb{R}^3\) : trois droites passant par l'origine, non contenues dans un plan commun, remplissent déjà l'espace tout entier. Exemple — Deux plans de \(\mathbb{R}^3\)
Prenons \(P_1 = \operatorname{Vect}(e_1, e_2)\) et \(P_2 = \operatorname{Vect}(e_2, e_3)\), deux plans distincts de \(\mathbb{R}^3\). Tout \(x = (a, b, c)\) vaut \((a, b - c, 0) + (0, c, c)\) avec le premier terme dans \(P_1\) et le second dans \(P_2\), donc \(P_1 + P_2 = \mathbb{R}^3\). Deux plans dont l'intersection se réduit à la droite \(\operatorname{Vect}(e_2)\) engendrent déjà l'espace. Proposition — La somme est le plus petit sous-espace contenant chaque terme
Soient \(F_1, \dots, F_p\) des sous-espaces de \(E\). Alors \(\sum_{i=1}^p F_i\) est \textcolor{colorprop}{un sous-espace de \(E\)}, il \textcolor{colorprop}{contient chaque \(F_i\)}, et il est \textcolor{colorprop}{contenu dans tout sous-espace de \(E\) contenant chaque \(F_i\)} --- c'est leur plus petit majorant commun.
Notons \(S = \sum_{i=1}^p F_i\). Le vecteur nul vaut \(0 = 0 + \dots + 0\) avec chaque terme dans \(F_i\), donc \(0 \in S\). Si \(x = \sum x_i\) et \(y = \sum y_i\) sont dans \(S\) (avec \(x_i, y_i \in F_i\)) et \(\lambda \in \mathbb{K}\), alors \(\lambda x + y = \sum (\lambda x_i + y_i)\), et chaque \(\lambda x_i + y_i \in F_i\) puisque \(F_i\) est un sous-espace ; donc \(\lambda x + y \in S\). Ainsi \(S\) est un sous-espace. Chaque \(F_j\) est contenu dans \(S\) : un vecteur \(x_j \in F_j\) vaut \(0 + \dots + x_j + \dots + 0 \in S\). Enfin, soit \(H\) un sous-espace contenant chaque \(F_i\) ; pour \(x = \sum x_i \in S\), chaque \(x_i \in F_i \subset H\), et \(H\) est stable par somme, donc \(x \in H\). Ainsi \(S \subset H\).
Un vecteur de la somme est, par définition, exprimable comme somme de morceaux pris dans les \(F_i\). La figure montre une telle décomposition, les morceaux disposés bout à bout.
Ici \(x = x_1 + x_2 + x_3\) avec \(x_i \in F_i\).
Méthode — Montrer qu'un vecteur appartient à une somme\(\virgule\) ou calculer une somme
Pour démontrer \(x \in F_1 + \dots + F_p\), exhiber une décomposition \(x = x_1 + \dots + x_p\) avec chaque \(x_i \in F_i\). Pour démontrer une égalité \(F_1 + \dots + F_p = H\), démontrer les deux inclusions : \(\subset\) a lieu, une fois \(H\) reconnu comme un sous-espace contenant chaque \(F_i\), par la propriété du « plus petit sous-espace » ; \(\supset\) revient à décomposer tout vecteur de \(H\). Compétences à pratiquer
- Calculer une somme de sous-espaces
I.2
Somme directe et ses caractérisations
Pour deux sous-espaces, \(F \oplus G\) signifiait que tout vecteur de \(F + G\) se décompose d'exactement une façon. La même exigence --- l'unicité de la décomposition --- définit la somme directe d'une famille finie. L'intérêt est pratique : les critères. On en donne trois, l'un par le vecteur nul, l'un par étapes, l'un par la dimension ; chacun transforme « la somme est directe » en quelque chose de vérifiable.
Définition — Somme directe d'une famille finie
Les sous-espaces \(F_1, \dots, F_p\) sont dits en somme directe lorsque tout vecteur \(x\) de \(\sum_{i=1}^p F_i\) admet une décomposition unique \(x = x_1 + \dots + x_p\) avec \(x_i \in F_i\). La somme se note alors \(\bigoplus_{i=1}^p F_i\) ou \(F_1 \oplus \dots \oplus F_p\). Exemple — Une somme directe et une somme non directe
Dans \(\mathbb{R}^3\) muni de la base canonique, \(\operatorname{Vect}(e_1) \oplus \operatorname{Vect}(e_2) \oplus \operatorname{Vect}(e_3) = \mathbb{R}^3\) : un vecteur \((a, b, c)\) ne s'écrit que \(a e_1 + b e_2 + c e_3\), les coordonnées étant uniques. Au contraire, avec \(F_1 = \operatorname{Vect}(e_1)\), \(F_2 = \operatorname{Vect}(e_2)\) et \(F_3 = \operatorname{Vect}(e_1 + e_2)\), le vecteur \(e_1 + e_2\) de \(F_1 + F_2 + F_3\) s'écrit à la fois \(e_1 + e_2 + 0\) et \(0 + 0 + (e_1 + e_2)\) : la somme \(F_1 + F_2 + F_3\) n'est pas directe. Proposition — Caractérisation par le vecteur nul
La somme \(\sum_{i=1}^p F_i\) est directe si et seulement si $$ \textcolor{colorprop}{x_1 + \dots + x_p = 0 \ \text{ avec } x_i \in F_i \quad \Longrightarrow \quad x_1 = \dots = x_p = 0.} $$ Autrement dit : la seule décomposition du vecteur nul est la décomposition triviale.
Si la somme est directe, le vecteur nul a une décomposition unique ; comme \(0 = 0 + \dots + 0\) en est une, c'est la seule, ce qui est l'implication annoncée. Réciproquement, supposons l'implication vraie, et soit \(x \in \sum F_i\) admettant deux décompositions \(x = \sum x_i = \sum x_i'\) avec \(x_i, x_i' \in F_i\). Par différence, \(\sum (x_i - x_i') = 0\) avec \(x_i - x_i' \in F_i\) ; l'implication force \(x_i - x_i' = 0\), soit \(x_i = x_i'\) pour tout \(i\). La décomposition de \(x\) est donc unique, et la somme est directe.
Proposition — Caractérisation par étapes
La somme \(\sum_{i=1}^p F_i\) est directe si et seulement si, pour tout \(k \in \{2, \dots, p\}\), $$ \textcolor{colorprop}{(F_1 + \dots + F_{k-1}) \cap F_k = \{0\}.} $$ Chaque étape ajoute un sous-espace, en demandant qu'il ne rencontre la somme des précédents qu'en \(0\).
Pour \(p = 1\) il n'y a aucune condition à vérifier et la somme \(F_1\) est trivialement directe, supposons donc \(p \geq 2\). Supposons d'abord la somme directe, et fixons \(k\). Soit \(y \in (F_1 + \dots + F_{k-1}) \cap F_k\) ; écrivons \(y = x_1 + \dots + x_{k-1}\) avec \(x_i \in F_i\). Alors \(x_1 + \dots + x_{k-1} + (-y) + 0 + \dots + 0 = 0\) est une décomposition de \(0\) sur \(F_1, \dots, F_p\) (le terme \(-y\) dans \(F_k\)). Par la caractérisation par le vecteur nul, chaque terme est nul, en particulier \(y = 0\) ; l'intersection vaut donc \(\{0\}\).
Réciproquement, supposons toutes les conditions d'intersection vérifiées, et soit \(x_1 + \dots + x_p = 0\) avec \(x_i \in F_i\). Alors \(x_1 + \dots + x_{p-1} = -x_p\) appartient à \((F_1 + \dots + F_{p-1}) \cap F_p = \{0\}\), donc \(x_p = 0\) et \(x_1 + \dots + x_{p-1} = 0\). En répétant avec \(k = p-1, p-2, \dots, 2\), on retire \(x_{p-1}, \dots, x_2\) tour à tour, et il reste \(x_1 = 0\). Le vecteur nul n'a donc que la décomposition triviale, et la somme est directe.
Réciproquement, supposons toutes les conditions d'intersection vérifiées, et soit \(x_1 + \dots + x_p = 0\) avec \(x_i \in F_i\). Alors \(x_1 + \dots + x_{p-1} = -x_p\) appartient à \((F_1 + \dots + F_{p-1}) \cap F_p = \{0\}\), donc \(x_p = 0\) et \(x_1 + \dots + x_{p-1} = 0\). En répétant avec \(k = p-1, p-2, \dots, 2\), on retire \(x_{p-1}, \dots, x_2\) tour à tour, et il reste \(x_1 = 0\). Le vecteur nul n'a donc que la décomposition triviale, et la somme est directe.
Un piège. La condition par étapes n'est pas la même que « les \(F_i\) sont deux à deux en somme directe ». Trois droites peuvent être deux à deux indépendantes sans être en somme directe.
Prenons \(D_1, D_2, D_3\) trois droites distinctes de \(\mathbb{R}^2\), avec \(D_3 = \operatorname{Vect}(e_1 + e_2)\). Deux à deux, deux droites distinctes ne se rencontrent qu'en \(0\). Pourtant \(e_1 + e_2 + \bigl(-(e_1 + e_2)\bigr) = 0\) est une décomposition non triviale de \(0\) sur \(D_1, D_2, D_3\), donc \(D_1 + D_2 + D_3\) n'est pas directe : ici \((D_1 + D_2) \cap D_3 = D_3 \neq \{0\}\).
Proposition — Caractérisation par la dimension
Si \(F_1, \dots, F_p\) sont de dimension finie, alors $$ \dim\left(\sum_{i=1}^p F_i\right) \leq \sum_{i=1}^p \dim F_i, $$ et \textcolor{colorprop}{il y a égalité si et seulement si la somme est directe}.
Considérons l'application \(\Phi : F_1 \times \dots \times F_p \to \sum_{i=1}^p F_i\), \((x_1, \dots, x_p) \mapsto x_1 + \dots + x_p\). Elle est linéaire, et surjective par la définition de la somme. L'espace produit \(F_1 \times \dots \times F_p\) est de dimension \(\sum \dim F_i\) (dimension d'un produit, rappelée d'Espaces vectoriels de dimension finie). Le théorème du rang appliqué à \(\Phi\) donne $$ \sum_{i=1}^p \dim F_i = \dim \operatorname{Im} \Phi + \dim \operatorname{Ker} \Phi = \dim\left(\sum_{i=1}^p F_i\right) + \dim \operatorname{Ker} \Phi. $$ D'où \(\dim(\sum F_i) \leq \sum \dim F_i\), avec égalité exactement lorsque \(\dim \operatorname{Ker} \Phi = 0\), soit \(\Phi\) injective. Or \(\Phi\) est injective si et seulement si \((x_1, \dots, x_p) \mapsto \sum x_i\) a un noyau trivial, soit \(\sum x_i = 0 \Rightarrow\) tous les \(x_i = 0\) --- exactement la caractérisation de la directe par le vecteur nul.
Méthode — Démontrer qu'une somme est directe
Trois voies standard, à choisir selon les données : - Vecteur nul. Supposer \(x_1 + \dots + x_p = 0\) avec \(x_i \in F_i\) et en déduire que chaque \(x_i = 0\). La méthode par défaut, toujours disponible.
- Par étapes. Vérifier \((F_1 + \dots + F_{k-1}) \cap F_k = \{0\}\) pour \(k = 2, \dots, p\). Commode quand les sommes partielles sont faciles à décrire.
- Dimension. En dimension finie, une fois \(\dim(\sum F_i) = \sum \dim F_i\) établie, la somme est directe. La voie la plus rapide quand toutes les dimensions sont connues.
Compétences à pratiquer
- Démontrer qu'une somme est directe
I.3
Décomposition d'un espace et bases adaptées
Lorsque la somme directe des \(F_i\) remplit l'espace entier, on dit que \(E\) est décomposé. Le chapitre de MPSI a construit, pour \(E = F \oplus G\), une base « adaptée » au découpage, en concaténant une base de \(F\) et une base de \(G\). La même construction fonctionne pour un nombre quelconque de termes, et donne le critère qui relie une décomposition à une base.
Définition — Décomposition et base adaptée
On dit que \(E\) est décomposé en la somme directe de \(F_1, \dots, F_p\) lorsque \(E = \bigoplus_{i=1}^p F_i\). Une base \(\mathcal{B}\) de \(E\) est adaptée à cette décomposition lorsqu'elle est la concaténation, dans l'ordre \(1, \dots, p\), d'une base \(\mathcal{B}_1\) de \(F_1\), puis d'une base \(\mathcal{B}_2\) de \(F_2\), \dots, puis d'une base \(\mathcal{B}_p\) de \(F_p\). Exemple — La base canonique de \(\mathbb{K}^n\)
Soit \(D_i = \operatorname{Vect}(e_i)\) la \(i\)-ième droite de coordonnées de \(\mathbb{K}^n\). Alors \(\mathbb{K}^n = D_1 \oplus \dots \oplus D_n\), et la base canonique \((e_1, \dots, e_n)\) --- concaténation des bases à un vecteur \((e_i)\) des \(D_i\) --- est adaptée à cette décomposition. Exemple — Les polynômes par degré
Dans \(\mathbb{K}_n[X]\), posons \(L_k = \operatorname{Vect}(X^k)\) pour \(k = 0, \dots, n\). Un polynôme de degré au plus \(n\) s'écrit de manière unique \(a_0 X^0 + a_1 X^1 + \dots + a_n X^n\), donc \(\mathbb{K}_n[X] = L_0 \oplus L_1 \oplus \dots \oplus L_n\), et la base monomiale \((1, X, \dots, X^n)\) est adaptée à cette décomposition. Proposition — Critère de la base adaptée
Soient \(F_1, \dots, F_p\) des sous-espaces de dimension finie de \(E\). Alors \(E = \bigoplus_{i=1}^p F_i\) si et seulement si, pour un --- de façon équivalente, pour tout --- choix d'une base \(\mathcal{B}_i\) de chaque \(F_i\), la concaténation \(\mathcal{B}_1, \dots, \mathcal{B}_p\) (dans cet ordre) est \textcolor{colorprop}{une base de \(E\)}.
Fixons une base \(\mathcal{B}_i\) de chaque \(F_i\) et soit \(\mathcal{C}\) leur concaténation.
- Si \(E = \bigoplus F_i\). La famille \(\mathcal{C}\) engendre \(E\), puisque \(E = \sum F_i\) et que chaque vecteur de \(F_i\) est combinaison de \(\mathcal{B}_i\). Elle est libre : une combinaison nulle de \(\mathcal{C}\) se regroupe, selon les \(F_i\), en \(y_1 + \dots + y_p = 0\) avec \(y_i \in F_i\) (la part dans \(F_i\) de la combinaison) ; la directe force chaque \(y_i = 0\), et la liberté de \(\mathcal{B}_i\) force alors chaque coefficient à l'intérieur de \(\mathcal{B}_i\) à s'annuler. Donc \(\mathcal{C}\) est une base de \(E\).
- Si \(\mathcal{C}\) est une base de \(E\). Alors \(E\) est engendré par \(\mathcal{C}\), donc \(E = \sum F_i\). Pour voir que la somme est directe, soit \(y_1 + \dots + y_p = 0\) avec \(y_i \in F_i\) ; en développant chaque \(y_i\) sur \(\mathcal{B}_i\), on en fait une combinaison nulle de \(\mathcal{C}\), donc tous les coefficients sont nuls par liberté, d'où chaque \(y_i = 0\). La caractérisation par le vecteur nul donne \(E = \bigoplus F_i\).
Remarque (lecture facultative). Lorsque \(E = \bigoplus_{i=1}^p F_i\), le regroupement \(E = F_i \oplus \bigl(\bigoplus_{j \neq i} F_j\bigr)\) vaut pour chaque \(i\), donc la projection \(p_i\) sur \(F_i\) parallèlement à \(\bigoplus_{j \neq i} F_j\) est bien définie. Ces projecteurs vérifient \(p_i^2 = p_i\) et \(p_1 + \dots + p_p = \operatorname{id}_E\). C'est une note annexe ; le chapitre ne la développe pas davantage.
Méthode — Construire une base adaptée à une décomposition
Étant donné \(E = \bigoplus_{i=1}^p F_i\) : choisir une base de chaque \(F_i\) séparément --- les termes sont indépendants, aucune compatibilité à respecter --- puis les écrire l'une après l'autre dans l'ordre \(1, \dots, p\). Le résultat est une base adaptée, et par le critère --- \(E\) étant de dimension finie --- son cardinal vaut \(\dim F_1 + \dots + \dim F_p = \dim E\).
La figure montre le plus petit cas non trivial : \(\mathbb{R}^3\) découpé en une droite plus un plan, avec une base adaptée --- un vecteur engendrant la droite, deux engendrant le plan.
\(\mathbb{R}^3 = D \oplus P\) : \((e_1, e_2)\) est une base du plan \(P\), \((e_3)\) une base de la droite \(D\), et \((e_1, e_2, e_3)\) est une base de \(\mathbb{R}^3\) adaptée à la décomposition.
Compétences à pratiquer
- Former une base adaptée
II
Matrices par blocs
II.1
Partition en blocs et opérations par blocs
Une matrice peut être découpée par des lignes horizontales et verticales en une grille de matrices rectangulaires plus petites, ses blocs. Le chapitre Représentation matricielle des applications linéaires a déjà utilisé ce découpage dans le cas \(2 \times 2\), avec la règle du produit par blocs. Cette sous-section énonce la partition et les opérations --- somme, transposée, produit --- pour une grille générale : chacune se calcule bloc par bloc, exactement comme si les blocs étaient des scalaires, l'ordre étant conservé pour le produit.
Définition — Partition en blocs
Soit \(A \in \mathcal{M}_{n,m}(\mathbb{K})\). Une partition en blocs de \(A\) est la donnée d'un découpage des \(n\) lignes en groupes consécutifs de tailles strictement positives \(n_1, \dots, n_r\) (avec \(n_1 + \dots + n_r = n\)) et des \(m\) colonnes en groupes consécutifs de tailles strictement positives \(m_1, \dots, m_s\). Les sous-matrices obtenues \(A_{ij} \in \mathcal{M}_{n_i, m_j}(\mathbb{K})\) sont les blocs, et l'on écrit \(A = (A_{ij})_{1 \leq i \leq r,\, 1 \leq j \leq s}\). Deux matrices partitionnées sont compatibles pour la somme lorsqu'elles ont les mêmes découpages de lignes et de colonnes, et compatibles pour le produit lorsque le découpage en colonnes du facteur de gauche égale le découpage en lignes du facteur de droite. Exemple — Une matrice partitionnée de deux façons
La même matrice \(3 \times 4\) $$ A = \begin{pmatrix} 1 & 0 & 2 & 3 \\
0 & 1 & 4 & 5 \\
0 & 0 & 6 & 7 \end{pmatrix} $$ peut être découpée en lignes \(2 + 1\) et colonnes \(2 + 2\), donnant quatre blocs avec \(A_{11} = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\) ; ou en lignes \(3\) et colonnes \(1+1+1+1\), donnant ses quatre colonnes. La partition est une grille de lecture, non une propriété de \(A\) : on la choisit selon le calcul. Définition — Matrices triangulaires et diagonales par blocs
Soit \(A \in \mathcal{M}_n(\mathbb{K})\) une matrice carrée partitionnée avec des découpages de lignes et de colonnes identiques \(n_1, \dots, n_r\), de sorte que chaque bloc diagonal \(A_{ii}\) est carré de taille \(n_i\). Alors \(A\) est triangulaire supérieure par blocs si \(A_{ij} = 0\) pour \(i > j\), triangulaire inférieure par blocs si \(A_{ij} = 0\) pour \(i < j\), et diagonale par blocs si \(A_{ij} = 0\) pour \(i \neq j\). Une matrice diagonale par blocs de blocs diagonaux \(A_1, \dots, A_r\) se note \(\operatorname{Diag}(A_1, \dots, A_r)\). Exemple — Une matrice triangulaire et une diagonale par blocs
Avec des découpages de lignes et de colonnes \(2 + 1\), la matrice de gauche est triangulaire supérieure par blocs et celle de droite est diagonale par blocs : $$ \begin{pmatrix} 1 & 2 & 5 \\
3 & 4 & 6 \\
0 & 0 & 7 \end{pmatrix}, \qquad \begin{pmatrix} 1 & 2 & 0 \\
3 & 4 & 0 \\
0 & 0 & 7 \end{pmatrix} = \operatorname{Diag}\!\left( \begin{pmatrix} 1 & 2 \\
3 & 4 \end{pmatrix}, (7) \right). $$ Le bloc en bas à gauche, de taille \(1 \times 2\), est nul dans les deux ; les blocs diagonaux ont pour tailles \(2\) et \(1\). Proposition — Opérations par blocs
Soient \(A = (A_{ij})\) et \(B = (B_{ij})\) des matrices partitionnées. - Si \(A\) et \(B\) sont compatibles pour la somme, alors \(A + B\) a pour bloc \((i,j)\) la matrice \(A_{ij} + B_{ij}\), et \(\lambda A\) a pour bloc \((i,j)\) la matrice \(\lambda A_{ij}\).
- La transposée \(A^{\top}\) a pour bloc \((i,j)\) la matrice \((A_{ji})^{\top}\) (la grille de blocs est transposée, et chaque bloc transposé).
- Si \(A\) et \(B\) sont compatibles pour le produit, alors \(AB\) a pour bloc \((i,j)\) la matrice \(\textcolor{colorprop}{\sum_{k} A_{ik} B_{kj}}\), les blocs étant multipliés dans cet ordre.
Les points (1) et (2) sont immédiats : un bloc de \(A + B\), de \(\lambda A\) ou de \(A^{\top}\) se lit coefficient par coefficient, et chaque coefficient obéit à la règle scalaire, donc le bloc obéit à la règle matricielle.
Pour (3), notons le découpage en colonnes de \(A\) (égal au découpage en lignes de \(B\)) \(p_1, \dots, p_t\). Fixons un coefficient scalaire de \(AB\), disons dans le bloc-ligne \(i\) et le bloc-colonne \(j\), aux positions locales \((s, u)\). Sa valeur est \(\sum_{\ell} a_{s\ell} b_{\ell u}\), la somme sur toutes les colonnes \(\ell\) de \(A\). Découpons cet ensemble d'indices selon le groupement : \(\ell\) parcourt le bloc \(1\), puis le bloc \(2\), \dots, puis le bloc \(t\). La part de la somme sur le bloc \(k\) est \(\sum_{\ell \in \text{bloc } k} a_{s\ell} b_{\ell u}\), qui est exactement le coefficient \((s, u)\) du produit matriciel \(A_{ik} B_{kj}\). En sommant sur \(k\), le coefficient \((s,u)\) du bloc \((i,j)\) de \(AB\) vaut le coefficient \((s,u)\) de \(\sum_k A_{ik} B_{kj}\). Comme cela vaut pour toute position locale, le bloc \((i,j)\) de \(AB\) est \(\sum_k A_{ik} B_{kj}\).
Pour (3), notons le découpage en colonnes de \(A\) (égal au découpage en lignes de \(B\)) \(p_1, \dots, p_t\). Fixons un coefficient scalaire de \(AB\), disons dans le bloc-ligne \(i\) et le bloc-colonne \(j\), aux positions locales \((s, u)\). Sa valeur est \(\sum_{\ell} a_{s\ell} b_{\ell u}\), la somme sur toutes les colonnes \(\ell\) de \(A\). Découpons cet ensemble d'indices selon le groupement : \(\ell\) parcourt le bloc \(1\), puis le bloc \(2\), \dots, puis le bloc \(t\). La part de la somme sur le bloc \(k\) est \(\sum_{\ell \in \text{bloc } k} a_{s\ell} b_{\ell u}\), qui est exactement le coefficient \((s, u)\) du produit matriciel \(A_{ik} B_{kj}\). En sommant sur \(k\), le coefficient \((s,u)\) du bloc \((i,j)\) de \(AB\) vaut le coefficient \((s,u)\) de \(\sum_k A_{ik} B_{kj}\). Comme cela vaut pour toute position locale, le bloc \((i,j)\) de \(AB\) est \(\sum_k A_{ik} B_{kj}\).
Proposition — Produit de matrices triangulaires par blocs
Soient \(A\) et \(B\) deux matrices carrées partageant la même partition en blocs diagonaux carrés de tailles \(n_1, \dots, n_r\). - Si \(A\) et \(B\) sont triangulaires supérieures par blocs, \(AB\) l'est aussi, et ses blocs diagonaux sont \(A_{ii} B_{ii}\). Idem avec « inférieures » à la place de « supérieures ».
- En particulier \(\operatorname{Diag}(A_1, \dots, A_r) \, \operatorname{Diag}(B_1, \dots, B_r) = \operatorname{Diag}(A_1 B_1, \dots, A_r B_r)\).
Par la règle du produit par blocs, le bloc \((i,j)\) de \(AB\) est \(\sum_k A_{ik} B_{kj}\). Supposons \(A\) et \(B\) triangulaires supérieures par blocs : \(A_{ik} = 0\) lorsque \(i > k\), et \(B_{kj} = 0\) lorsque \(k > j\). Prenons \(i > j\). Dans la somme \(\sum_k A_{ik} B_{kj}\), un terme avec \(k < i\) a \(A_{ik} = 0\) ; un terme avec \(k \geq i\) a \(k \geq i > j\), donc \(k > j\) et \(B_{kj} = 0\). Tout terme s'annule, donc le bloc \((i,j)\) de \(AB\) est \(0\) : \(AB\) est triangulaire supérieure par blocs. Pour \(i = j\), le seul terme éventuellement non nul est \(k = i\), donnant le bloc diagonal \(A_{ii} B_{ii}\). Le cas triangulaire inférieure est identique avec les inégalités renversées. Le point (2) est le cas particulier où tous les blocs hors diagonale de \(A\) et \(B\) sont nuls.
Exemple — Un inverse triangulaire par blocs
Soit \(M = \begin{pmatrix} A & B \\ 0 & D \end{pmatrix}\) triangulaire supérieure par blocs avec \(A\) et \(D\) blocs carrés inversibles. Alors \(M\) est inversible, avec $$ M^{-1} = \begin{pmatrix} A^{-1} & -A^{-1} B D^{-1} \\
0 & D^{-1} \end{pmatrix}. $$ En effet le produit par blocs de \(M\) par cette matrice donne \(\begin{pmatrix} A A^{-1} & -A A^{-1} B D^{-1} + B D^{-1} \\ 0 & D D^{-1} \end{pmatrix} = \begin{pmatrix} I & 0 \\ 0 & I \end{pmatrix}\), et de même de l'autre côté. (Que \(A\) et \(D\) inversibles soit aussi nécessaire est montré plus loin.) Méthode — Calculer par blocs
Choisir la partition de sorte que les blocs soient des matrices reconnaissables (identité, zéro, un bloc inversible connu). Puis sommer, transposer et multiplier bloc par bloc, en traitant les blocs comme des scalaires mais en conservant l'ordre de gauche à droite dans chaque produit \(A_{ik} B_{kj}\). Pour un inverse, poser une matrice par blocs de même forme à blocs inconnus, multiplier, et résoudre les équations par blocs obtenues.
La figure fixe le vocabulaire : une partition en blocs est une grille, le bloc \(A_{ij}\) se trouvant au groupe-ligne \(i\) et au groupe-colonne \(j\).
Ici les lignes sont découpées \(n_1 + n_2\) et les colonnes \(m_1 + m_2 + m_3\).
Compétences à pratiquer
- Calculer par blocs
II.2
Déterminant d'une matrice triangulaire par blocs
Le déterminant et sa multiplicativité \(\det(XY) = \det X \det Y\) sont rappelés de Déterminants. Lorsqu'une matrice carrée est triangulaire par blocs --- tout un coin de blocs hors diagonale s'annulant --- son déterminant se réduit à un produit sur les blocs diagonaux --- l'analogue par blocs de « le déterminant d'une matrice triangulaire est le produit de ses coefficients diagonaux ».
Theorem — Déterminant d'une matrice triangulaire par blocs
Soit \(M \in \mathcal{M}_n(\mathbb{K})\) triangulaire par blocs (supérieure ou inférieure) de blocs diagonaux carrés \(A_1, \dots, A_r\). Alors $$ \textcolor{colorprop}{\det M = \det A_1 \times \det A_2 \times \dots \times \det A_r.} $$
Traitons le cas triangulaire supérieure par blocs ; le cas inférieure s'en déduit par \(\det M = \det M^{\top}\), puisque la transposition change une matrice triangulaire inférieure en triangulaire supérieure par blocs, de mêmes blocs diagonaux transposés, et \(\det A_k^{\top} = \det A_k\).
- Lemme de base. Pour \(\begin{pmatrix} I & C \\ 0 & B \end{pmatrix}\) avec \(I\) un bloc identité, développons le déterminant par cofacteurs selon la première colonne : son seul coefficient non nul est le \(1\) en position \((1,1)\), dont le cofacteur est le déterminant de la même forme avec une ligne et une colonne identité de moins. En répétant le long du bloc identité, \(\det \begin{pmatrix} I & C \\ 0 & B \end{pmatrix} = \det B\). De même, pour \(\begin{pmatrix} A & 0 \\ 0 & I \end{pmatrix}\), un développement répété par cofacteurs selon la dernière colonne --- dont le seul coefficient non nul est le \(1\) du bas --- donne \(\det \begin{pmatrix} A & 0 \\ 0 & I \end{pmatrix} = \det A\).
- Deux blocs diagonaux. Pour \(M = \begin{pmatrix} A & C \\ 0 & B \end{pmatrix}\), le produit par blocs donne la factorisation \(M = \begin{pmatrix} I & C \\ 0 & B \end{pmatrix} \begin{pmatrix} A & 0 \\ 0 & I \end{pmatrix}\). Par multiplicativité et le lemme de base, \(\det M = \det B \times \det A = \det A \times \det B\).
- Cas général. Regroupons les blocs diagonaux en \(A_1\) et la matrice triangulaire par blocs \(M'\) formée de \(A_2, \dots, A_r\) : alors \(M\) est triangulaire supérieure par blocs aux deux blocs diagonaux \(A_1\) et \(M'\), donc \(\det M = \det A_1 \times \det M'\). Une récurrence sur \(r\) donne \(\det M' = \det A_2 \times \dots \times \det A_r\), d'où la formule.
Exemple — Un déterminant numérique triangulaire par blocs
La matrice $$ M = \begin{pmatrix} 2 & 1 & 5 & 9 \\
3 & 2 & 7 & 4 \\
0 & 0 & 1 & 6 \\
0 & 0 & 2 & 1 \end{pmatrix} $$ est triangulaire supérieure par blocs pour le découpage \(2 + 2\), de blocs diagonaux \(A_1 = \begin{pmatrix} 2 & 1 \\ 3 & 2 \end{pmatrix}\) et \(A_2 = \begin{pmatrix} 1 & 6 \\ 2 & 1 \end{pmatrix}\). Donc \(\det M = \det A_1 \times \det A_2 = (4 - 3)(1 - 12) = 1 \times (-11) = -11\), sans aucun développement \(4 \times 4\). Proposition — Inversibilité d'une matrice triangulaire par blocs
Une matrice triangulaire par blocs \(M\) de blocs diagonaux carrés \(A_1, \dots, A_r\) est inversible si et seulement si \textcolor{colorprop}{chaque bloc diagonal \(A_k\) est inversible}.
Par le critère d'inversibilité (Déterminants), \(M\) est inversible si et seulement si \(\det M \neq 0\). Le Théorème donne \(\det M = \det A_1 \times \dots \times \det A_r\), un produit de scalaires ; il est non nul exactement lorsque chaque facteur \(\det A_k\) est non nul, soit lorsque chaque \(A_k\) est inversible.
Exemple — Le déterminant d'une matrice par blocs symétrique
Soient \(A, B \in \mathcal{M}_n(\mathbb{K})\). On évalue \(\det \begin{pmatrix} A & B \\ B & A \end{pmatrix}\) en multipliant à gauche par \(\begin{pmatrix} I & I \\ 0 & I \end{pmatrix}\), puis à droite par \(\begin{pmatrix} I & -I \\ 0 & I \end{pmatrix}\) : $$ \begin{pmatrix} I & I \\
0 & I \end{pmatrix} \begin{pmatrix} A & B \\
B & A \end{pmatrix} \begin{pmatrix} I & -I \\
0 & I \end{pmatrix} = \begin{pmatrix} A+B & A+B \\
B & A \end{pmatrix} \begin{pmatrix} I & -I \\
0 & I \end{pmatrix} = \begin{pmatrix} A+B & 0 \\
B & A-B \end{pmatrix}. $$ Les deux facteurs triangulaires par blocs ont pour déterminant \(1\) (leurs blocs diagonaux sont des identités), donc par multiplicativité et le Théorème, $$ \det \begin{pmatrix} A & B \\
B & A \end{pmatrix} = \det \begin{pmatrix} A+B & 0 \\
B & A-B \end{pmatrix} = \det(A+B)\,\det(A-B). $$ Méthode — Calculer un déterminant par triangularisation par blocs
Face à un déterminant de matrice partitionnée : si un bloc hors diagonale est déjà nul, appliquer directement le Théorème. Sinon, lorsque la structure des blocs le permet, multiplier à gauche et à droite par des matrices triangulaires par blocs de déterminant \(1\) (blocs diagonaux tous des identités) pour annuler un bloc hors diagonale, puis appliquer le Théorème --- la matrice par blocs symétrique ci-dessus en est le cas modèle. La multiplicativité garantit que le déterminant est inchangé par de telles multiplications.
La figure résume la forme que le Théorème exploite : sous la diagonale, uniquement des zéros ; sur la diagonale, les blocs carrés dont les déterminants se multiplient.
Une matrice triangulaire supérieure par blocs : les blocs \(\ast\) sont quelconques, les blocs en bas à gauche sont nuls, et \(\det M\) est le produit de \(\det A_1, \det A_2, \det A_3\).
Compétences à pratiquer
- Calculer un déterminant par blocs
III
Sous-espaces stables et endomorphisme induit
III.1
Sous-espaces stables
Soit \(u\) un endomorphisme de \(E\). Un sous-espace sur lequel \(u\) « reste à l'intérieur » --- renvoie tout vecteur du sous-espace dans le sous-espace --- peut être étudié pour lui-même, sans le reste de \(E\). Un tel sous-espace est dit stable. Cette sous-section définit la stabilité et donne deux façons de la reconnaître.
Définition — Sous-espace stable
Soit \(u \in \mathcal{L}(E)\) et \(F\) un sous-espace de \(E\). On dit que \(F\) est stable par \(u\) --- ou que \(u\) stabilise \(F\) --- lorsque \(u(F) \subset F\), c'est-à-dire lorsque \(u(x) \in F\) pour tout \(x \in F\). Exemple — Sous-espaces toujours stables
Pour tout \(u \in \mathcal{L}(E)\), les sous-espaces \(\{0\}\) et \(E\) sont stables, puisque \(u(\{0\}) = \{0\}\) et \(u(E) \subset E\). Il en va de même de \(\operatorname{Ker} u\) --- si \(u(x) = 0\) alors \(u(u(x)) = u(0) = 0\), donc \(u(x) \in \operatorname{Ker} u\) --- et de \(\operatorname{Im} u\) --- \(u(\operatorname{Im} u) \subset \operatorname{Im} u\) par définition de l'image. Exemple — Droites stables et une rotation
Pour \(x \neq 0\), la droite \(\mathbb{K}x\) est stable par \(u\) si et seulement si \(u(x) \in \mathbb{K}x\), soit \(u(x) = \lambda x\) pour un scalaire \(\lambda\) : une droite stable est une direction que \(u\) se contente de redimensionner. En conséquence la rotation de \(\mathbb{R}^2\) d'angle \(\theta \not\equiv 0 \ [\pi]\) ne stabilise aucune droite : une rotation d'un tel angle n'envoie aucun vecteur non nul sur un multiple de lui-même, donc ses seuls sous-espaces stables sont \(\{0\}\) et \(\mathbb{R}^2\). Proposition — Stabilité par une famille génératrice
Soit \(u \in \mathcal{L}(E)\) et \(F = \operatorname{Vect}(e_1, \dots, e_d)\) un sous-espace engendré par la famille \((e_1, \dots, e_d)\). Alors $$ \textcolor{colorprop}{F \text{ est stable par } u \iff u(e_k) \in F \text{ pour tout } k.} $$
Si \(F\) est stable, alors chaque \(e_k \in F\) donne \(u(e_k) \in F\). Réciproquement, supposons \(u(e_k) \in F\) pour tout \(k\). Un vecteur \(x \in F\) s'écrit \(x = \sum_k \lambda_k e_k\), donc par linéarité \(u(x) = \sum_k \lambda_k u(e_k)\), combinaison linéaire des vecteurs \(u(e_k)\), tous dans \(F\) ; comme \(F\) est un sous-espace, \(u(x) \in F\). D'où \(u(F) \subset F\).
Proposition — Des endomorphismes qui commutent préservent noyaux et images
Soient \(u, v \in \mathcal{L}(E)\) avec \(u \circ v = v \circ u\). Alors \(\operatorname{Ker} v\) et \(\operatorname{Im} v\) sont \textcolor{colorprop}{stables par \(u\)}. - Noyau. Soit \(x \in \operatorname{Ker} v\), donc \(v(x) = 0\). Alors \(v(u(x)) = u(v(x)) = u(0) = 0\), donc \(u(x) \in \operatorname{Ker} v\). D'où \(u(\operatorname{Ker} v) \subset \operatorname{Ker} v\).
- Image. \(u(\operatorname{Im} v) = \operatorname{Im}(u \circ v) = \operatorname{Im}(v \circ u) \subset \operatorname{Im} v\), l'égalité centrale étant la commutation \(u \circ v = v \circ u\) et la dernière inclusion ayant lieu car \(\operatorname{Im}(v \circ u) = v(u(E)) \subset v(E) = \operatorname{Im} v\).
Exemple — Un noyau stabilisé par un endomorphisme qui commute
Fixons \(u \in \mathcal{L}(E)\) et un scalaire \(\lambda\), et posons \(v = u - \lambda \operatorname{id}_E\). Comme \(u\) commute avec \(v\) (tous deux sont des polynômes en \(u\)), la Proposition précédente s'applique : \(\operatorname{Ker}(u - \lambda \operatorname{id}_E)\) est stable par \(u\). Plus généralement il est stable par tout endomorphisme commutant avec \(u\). Ce noyau réapparaîtra, nommé, au chapitre suivant. Méthode — Démontrer la stabilité d'un sous-espace
Pour démontrer \(F\) stable par \(u\) : si \(F\) est donné par une famille génératrice, vérifier que l'image de chaque générateur appartient à \(F\) --- par la Proposition cela suffit. Si \(F\) est un noyau ou une image, chercher un endomorphisme qui commute avec l'application concernée. Pour démontrer \(F\) non stable, exhiber un vecteur \(x \in F\) avec \(u(x) \notin F\).
La figure montre la stabilité géométriquement : un plan \(F\) stable par \(u\) garde chacun de ses vecteurs à l'intérieur de \(F\) après application de \(u\).
À la fois \(x\) et \(u(x)\) sont dans le plan \(F\) : appliquer \(u\) ne sort jamais de \(F\).
Compétences à pratiquer
- Démontrer la stabilité d'un sous-espace
III.2
Endomorphisme induit et forme triangulaire par blocs
Lorsque \(F\) est stable par \(u\), restreindre \(u\) à \(F\) produit une application de \(F\) dans \(F\) --- un endomorphisme de \(F\) à part entière, l'endomorphisme induit. Choisir une base de \(E\) commençant par une base de \(F\) rend alors la stabilité visible dans la matrice : elle devient un bloc nul.
Définition — Endomorphisme induit
Soit \(u \in \mathcal{L}(E)\) et \(F\) un sous-espace stable par \(u\). L'endomorphisme induit par \(u\) sur \(F\), noté \(u_F\), est l'application \(u_F : F \to F\), \(x \mapsto u(x)\). Il est bien défini --- car \(u(F) \subset F\), la valeur \(u(x)\) appartient à \(F\) --- et c'est un endomorphisme de \(F\). Exemple — Deux endomorphismes induits
Prenons \(u \in \mathcal{L}(E)\). Sur le sous-espace stable \(\operatorname{Ker} u\), l'endomorphisme induit \(u_{\operatorname{Ker} u}\) est l'application nulle de \(\operatorname{Ker} u\), puisque \(u\) y est nul. Sur une droite stable \(\mathbb{K}x\) avec \(u(x) = \lambda x\), l'endomorphisme induit est l'homothétie de rapport \(\lambda\) de cette droite. Exemple — Endomorphisme induit et restriction
L'endomorphisme induit \(u_F\) et la restriction \(u_{|F}\) effectuent la même affectation \(x \mapsto u(x)\) sur \(F\) ; ce qui les distingue est l'ensemble d'arrivée déclaré. La restriction \(u_{|F} : F \to E\) a \(E\) pour ensemble d'arrivée ; c'est une application linéaire de \(F\) dans \(E\). L'endomorphisme induit \(u_F : F \to F\) est cette même application corestreinte à \(F\) comme ensemble d'arrivée --- ce qui n'est légitime que parce que \(F\) est stable --- et c'est un endomorphisme, donc il peut être composé avec lui-même, possède une matrice dans une base de \(F\), et ainsi de suite. Les deux applications prennent les mêmes valeurs ; elles diffèrent par leur ensemble d'arrivée déclaré, et seul \(u_F\) est un endomorphisme. Theorem — Traduction matricielle de la stabilité
Soit \(u \in \mathcal{L}(E)\), soit \(\mathcal{B} = (e_1, \dots, e_n)\) une base de \(E\), et soit \(F = \operatorname{Vect}(e_1, \dots, e_r)\) avec \(1 \le r \le n-1\). Écrivons la matrice en blocs pour le découpage \(r + (n-r)\) : $$ \operatorname{Mat}_{\mathcal{B}}(u) = \begin{pmatrix} A & C \\
B & D \end{pmatrix}. $$ Alors \(F\) est \textcolor{colorprop}{stable par \(u\) si et seulement si \(B = 0\)}, et dans ce cas \(A = \operatorname{Mat}_{(e_1, \dots, e_r)}(u_F)\) --- le bloc en haut à gauche est la matrice de l'endomorphisme induit.
Un vecteur \(x \in F\) a pour colonne de coordonnées \(\begin{pmatrix} X \\ 0 \end{pmatrix}\) (les \(n-r\) dernières coordonnées sont nulles, car \(x\) est combinaison de \(e_1, \dots, e_r\)). Le produit par blocs donne la colonne de coordonnées de \(u(x)\) : $$ \operatorname{Mat}_{\mathcal{B}}(u(x)) = \begin{pmatrix} A & C \\
B & D \end{pmatrix}\begin{pmatrix} X \\
0 \end{pmatrix} = \begin{pmatrix} AX \\
BX \end{pmatrix}. $$ Or \(u(x) \in F\) signifie que ses \(n-r\) dernières coordonnées sont nulles, soit \(BX = 0\). Donc \(F\) est stable --- \(u(x) \in F\) pour tout \(x \in F\) --- si et seulement si \(BX = 0\) pour tout \(X \in \mathbb{K}^r\), ce qui a lieu si et seulement si \(B = 0\). Lorsque \(B = 0\), la colonne de \(u(x)\) est \(\begin{pmatrix} AX \\ 0 \end{pmatrix}\), donc les coordonnées de \(u_F(x)\) dans \((e_1, \dots, e_r)\) sont \(AX\) ; quand \(X\) parcourt les colonnes de coordonnées de \(F\), cela dit que \(A = \operatorname{Mat}_{(e_1, \dots, e_r)}(u_F)\).
Exemple — Lire la stabilité sur une matrice
Soit \(u \in \mathcal{L}(\mathbb{R}^3)\) de matrice \(\begin{pmatrix} 2 & 1 & 5 \\ 0 & 3 & 4 \\ 0 & 0 & 7 \end{pmatrix}\) dans la base canonique. Pour \(F = \operatorname{Vect}(e_1, e_2)\) le bloc en bas à gauche est \(\begin{pmatrix} 0 & 0 \end{pmatrix}\), nul, donc \(F\) est stable, et l'endomorphisme induit a pour matrice \(\begin{pmatrix} 2 & 1 \\ 0 & 3 \end{pmatrix}\) dans \((e_1, e_2)\). Pour \(G = \operatorname{Vect}(e_1)\) la colonne de \(u(e_1)\) est \((2, 0, 0)\), encore dans \(G\), donc \(G\) est aussi stable. Méthode — Utiliser un sous-espace stable pour triangulariser par blocs
Étant donné un sous-espace \(F\) stable par \(u\) : compléter une base de \(F\) en une base \(\mathcal{B}\) de \(E\). Dans \(\mathcal{B}\), la matrice de \(u\) est automatiquement triangulaire supérieure par blocs, \(\begin{pmatrix} A & C \\ 0 & D \end{pmatrix}\), avec \(A\) la matrice de l'endomorphisme induit \(u_F\). C'est l'étape standard pour commencer à simplifier la matrice d'un endomorphisme.
La figure consigne la forme : un \(F\) stable engendré par les premiers vecteurs de base force le bloc en bas à gauche à s'annuler, laissant \(\operatorname{Mat}(u_F)\) en haut.
\(F = \operatorname{Vect}(e_1, \dots, e_r)\) stable : le bloc en bas à gauche est nul.
Compétences à pratiquer
- Identifier un endomorphisme induit
III.3
Décomposition en sous-espaces stables
Le chapitre boucle maintenant. Un seul sous-espace stable rendait la matrice triangulaire par blocs ; toute une décomposition de \(E\) en sous-espaces stables la rend diagonale par blocs. Chaque bloc diagonal est la matrice d'un endomorphisme induit, et l'endomorphisme \(u\) a été découpé en pièces indépendantes, une par terme.
Theorem — Forme diagonale par blocs sur une décomposition stable
Soit \(u \in \mathcal{L}(E)\), supposons \(E = \bigoplus_{i=1}^p F_i\) avec chaque \(F_i \neq \{0\}\), et fixons une base \(\mathcal{B}\) adaptée à cette décomposition. Alors \textcolor{colorprop}{chaque \(F_i\) est stable par \(u\) si et seulement si \(\operatorname{Mat}_{\mathcal{B}}(u)\) est diagonale par blocs}, \(\operatorname{Mat}_{\mathcal{B}}(u) = \operatorname{Diag}(A_1, \dots, A_p)\) pour le découpage \(\dim F_1, \dots, \dim F_p\). Dans ce cas chaque bloc diagonal \(A_i\) est la matrice de l'endomorphisme induit par \(u\) sur \(F_i\), dans la base de \(F_i\) extraite de \(\mathcal{B}\).
La base adaptée \(\mathcal{B}\) groupe ses vecteurs en \(p\) tranches consécutives, la \(i\)-ième tranche étant une base de \(F_i\) ; partitionnons \(\operatorname{Mat}_{\mathcal{B}}(u)\) en \(p \times p\) blocs en conséquence, le bloc \((i, j)\) ayant pour taille \(\dim F_i \times \dim F_j\). Le bloc-colonne \(j\) contient les colonnes de coordonnées des vecteurs \(u(e)\) pour \(e\) dans la base de \(F_j\). Par le critère de la famille génératrice, \(F_j\) est stable par \(u\) exactement lorsque chacun de ces \(u(e)\) appartient à \(F_j\), soit exactement lorsque les colonnes de coordonnées n'ont de coefficients non nuls que dans le bloc-ligne \(j\) --- c'est-à-dire que tout bloc hors diagonale du bloc-colonne \(j\) s'annule. Donc tous les \(F_j\) sont stables si et seulement si tout bloc hors diagonale s'annule, soit la matrice est diagonale par blocs. Lorsque c'est le cas, le bloc diagonal \(A_i\) rassemble les coordonnées, dans la base de \(F_i\), des images \(u(e) = u_{F_i}(e)\) des vecteurs de base de \(F_i\) ; donc \(A_i\) est la matrice de \(u_{F_i}\) dans cette base. Cela redémontre, en coordonnées par blocs, la même correspondance stabilité / bloc nul que la sous-section précédente.
Exemple — Deux plans stables dans \(\mathbb{R}^4\)
Soit \(u \in \mathcal{L}(\mathbb{R}^4)\) de matrice \(\begin{pmatrix} 1 & 2 & 0 & 0 \\ 3 & 4 & 0 & 0 \\ 0 & 0 & 5 & 6 \\ 0 & 0 & 7 & 8 \end{pmatrix}\) dans la base canonique. Les plans \(F_1 = \operatorname{Vect}(e_1, e_2)\) et \(F_2 = \operatorname{Vect}(e_3, e_4)\) vérifient \(\mathbb{R}^4 = F_1 \oplus F_2\), et la matrice est diagonale par blocs pour le découpage \(2 + 2\) : les deux plans sont stables, l'endomorphisme induit sur \(F_1\) a pour matrice \(\begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix}\), et celui sur \(F_2\) a pour matrice \(\begin{pmatrix} 5 & 6 \\ 7 & 8 \end{pmatrix}\). Exemple — Une droite stable et un plan stable
Supposons que \(u \in \mathcal{L}(\mathbb{R}^3)\) vérifie \(u(e_1) = 2 e_1\) et stabilise le plan \(P = \operatorname{Vect}(e_2, e_3)\). Alors \(\mathbb{R}^3 = \operatorname{Vect}(e_1) \oplus P\) est une décomposition en sous-espaces stables, et dans la base adaptée \((e_1, e_2, e_3)\) la matrice de \(u\) est diagonale par blocs \(\begin{pmatrix} 2 & 0 & 0 \\ 0 & \ast & \ast \\ 0 & \ast & \ast \end{pmatrix}\) : un bloc \(1 \times 1\) valant \((2)\) pour la droite, un bloc \(2 \times 2\) pour le plan. Méthode — Diagonaliser par blocs un endomorphisme
Pour mettre la matrice de \(u\) sous forme diagonale par blocs : trouver une décomposition \(E = \bigoplus F_i\) en sous-espaces chacun stable par \(u\), construire une base adaptée, et lire les blocs diagonaux comme les matrices des endomorphismes induits \(u_{F_i}\). Tout l'effort réside dans la recherche de la décomposition stable --- l'objet de la théorie de la réduction qui suit.
La figure montre l'état final : \(E\) découpé en \(p\) pièces stables, la matrice de \(u\) une diagonale de blocs avec des zéros partout ailleurs.
\(\operatorname{Mat}_{\mathcal{B}}(u) = \operatorname{Diag}(A_1, A_2, A_3)\) avec \(A_i = \operatorname{Mat}(u_{F_i})\) : tout bloc hors diagonale s'annule.
Pour aller plus loin
Ce chapitre a construit la machinerie mais laissé ouverte la question centrale : comment trouver une décomposition de \(E\) en sous-espaces stables par un endomorphisme \(u\) donné ? La forme diagonale par blocs est la récompense ; la décomposition stable est le travail. Les chapitres suivants y répondent --- par les valeurs propres, les sous-espaces propres, les polynômes caractéristique et minimal --- et le résultat phare là-bas, la diagonalisabilité, est exactement le cas où \(E\) se décompose en droites stables, faisant de chaque bloc diagonal un seul scalaire.
Compétences à pratiquer
- Décomposer en sous-espaces stables
Aller à la section