CommeUnJeu · L1 PCSI
Représentation matricielle des applications linéaires
Deux objets algébriques ont été développés jusqu'ici en parallèle : les applications linéaires (chapitre Applications linéaires), étudiées pour leurs propriétés abstraites (noyau, image, rang, isomorphisme, \(\mathcal{L}(E, F)\) comme espace vectoriel, \(\mathcal{L}(E)\) comme anneau), et les matrices (chapitre Calcul matriciel), étudiées pour leur calcul algébrique (\(M_{n, p}(\mathbb{K})\) comme espace vectoriel, produit matriciel, groupe \(\mathrm{GL}_n(\mathbb{K})\)). Ce chapitre recolle les deux. Dans un espace vectoriel de dimension finie muni d'une base, toute application linéaire est codée par une unique matrice, et toute matrice correspond à une unique application linéaire. La composition d'applications devient le produit matriciel, l'isomorphisme devient l'inversibilité matricielle, le rang d'une application devient le rang de sa matrice. Désormais, toute question sur une application linéaire devient un calcul matriciel, et tout résultat de calcul matriciel se relève en un énoncé sans coordonnées.
Le chapitre se déploie en cinq sections. La première section introduit la matrice d'un vecteur, d'une famille de vecteurs et d'une application linéaire dans des bases données ; elle énonce la formule clé \(\mathrm{Mat}_{\mathcal{B}'}(u(x)) = \mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u) \cdot \mathrm{Mat}_{\mathcal{B}}(x)\) et montre comment lire les images depuis les colonnes. La deuxième section boucle le dictionnaire : l'application \(u \mapsto \mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u)\) est un isomorphisme d'espaces vectoriels \(\mathcal{L}(E, F) \to M_{n, p}(\mathbb{K})\), la composition d'applications correspond au produit matriciel, et \(u \in \mathrm{GL}(E)\) si et seulement si \(\mathrm{Mat}_{\mathcal{B}}(u) \in \mathrm{GL}_n(\mathbb{K})\). La troisième section développe le rang d'une matrice et démontre le théorème du rang version matricielle, le théorème de la forme normale du rang et l'égalité du rang en lignes et en colonnes. La quatrième section explique l'écriture par blocs et la forme prise par la matrice d'un endomorphisme dans une base adaptée à une somme directe stable \(E = F \oplus G\). La cinquième section résume le dictionnaire en un tableau.
Le chapitre s'arrête volontairement au dictionnaire lui-même. Les formules générales de changement de base \(A' = Q^{-1} A P\) et \(A' = P^{-1} A P\), les relations nommées « matrices équivalentes » et « matrices semblables », la trace d'un endomorphisme (qui nécessite l'indépendance par rapport à la base, donc la formule de changement de base) et le langage de classification \(A \sim J_r\) sont reportés au chapitre suivant Changement de bases. La diagonalisation, la trigonalisation et toute théorie de la réduction sont hors programme. Tout au long du chapitre, \(\mathbb{K} \in \{\mathbb{R}, \mathbb{C}\}\), tous les espaces vectoriels sont des \(\mathbb{K}\)-espaces vectoriels de dimension finie, \(n, p, q\) désignent des entiers strictement positifs, et \(r\) désigne un entier naturel, généralement un rang, avec \(0 \le r \le \min(n, p)\) lorsque c'est pertinent.
Le chapitre se déploie en cinq sections. La première section introduit la matrice d'un vecteur, d'une famille de vecteurs et d'une application linéaire dans des bases données ; elle énonce la formule clé \(\mathrm{Mat}_{\mathcal{B}'}(u(x)) = \mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u) \cdot \mathrm{Mat}_{\mathcal{B}}(x)\) et montre comment lire les images depuis les colonnes. La deuxième section boucle le dictionnaire : l'application \(u \mapsto \mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u)\) est un isomorphisme d'espaces vectoriels \(\mathcal{L}(E, F) \to M_{n, p}(\mathbb{K})\), la composition d'applications correspond au produit matriciel, et \(u \in \mathrm{GL}(E)\) si et seulement si \(\mathrm{Mat}_{\mathcal{B}}(u) \in \mathrm{GL}_n(\mathbb{K})\). La troisième section développe le rang d'une matrice et démontre le théorème du rang version matricielle, le théorème de la forme normale du rang et l'égalité du rang en lignes et en colonnes. La quatrième section explique l'écriture par blocs et la forme prise par la matrice d'un endomorphisme dans une base adaptée à une somme directe stable \(E = F \oplus G\). La cinquième section résume le dictionnaire en un tableau.
Le chapitre s'arrête volontairement au dictionnaire lui-même. Les formules générales de changement de base \(A' = Q^{-1} A P\) et \(A' = P^{-1} A P\), les relations nommées « matrices équivalentes » et « matrices semblables », la trace d'un endomorphisme (qui nécessite l'indépendance par rapport à la base, donc la formule de changement de base) et le langage de classification \(A \sim J_r\) sont reportés au chapitre suivant Changement de bases. La diagonalisation, la trigonalisation et toute théorie de la réduction sont hors programme. Tout au long du chapitre, \(\mathbb{K} \in \{\mathbb{R}, \mathbb{C}\}\), tous les espaces vectoriels sont des \(\mathbb{K}\)-espaces vectoriels de dimension finie, \(n, p, q\) désignent des entiers strictement positifs, et \(r\) désigne un entier naturel, généralement un rang, avec \(0 \le r \le \min(n, p)\) lorsque c'est pertinent.
I
Matrice d'une application linéaire
On commence par coder un seul vecteur par sa colonne de coordonnées dans une base choisie. Étendre l'idée à une famille de vecteurs fournit une matrice colonne par colonne. Appliquée aux images \(u(e_1), \dots, u(e_p)\) des vecteurs de base d'une application linéaire \(u\), la même idée produit la matrice de \(u\) dans deux bases. Le contenu numérique du chapitre se condense alors en une identité --- multiplier la matrice de \(u\) par la colonne de \(x\) donne la colonne de \(u(x)\) --- de sorte que l'action de \(u\) se lit directement sur sa matrice. La dépendance par rapport aux bases choisies est essentielle : la même application admet plusieurs matrices selon les bases choisies au départ et à l'arrivée.
Définition — Matrice d'un vecteur dans une base
Soit \(E\) un \(\mathbb{K}\)-espace vectoriel de dimension finie \(p\), muni d'une base \(\mathcal{B} = (e_1, \dots, e_p)\). Tout vecteur \(x \in E\) se décompose de manière unique sous la forme $$ x = x_1 e_1 + \dots + x_p e_p, \qquad (x_1, \dots, x_p) \in \mathbb{K}^p. $$ La matrice du vecteur \(x\) dans la base \(\mathcal{B}\) est la matrice colonne de ses coordonnées : $$ \mathrm{Mat}_{\mathcal{B}}(x) = \begin{pmatrix} x_1 \\
\vdots \\
x_p \end{pmatrix} \in M_{p, 1}(\mathbb{K}). $$ Exemple
Prenons \(E = \mathbb{R}_n[X]\) et la base canonique \(\mathcal{B} = (1, X, X^2, \dots, X^n)\). Le polynôme \(P = 1 - X^2\) se décompose en \(P = 1 \cdot 1 + 0 \cdot X + (-1) \cdot X^2 + 0 \cdot X^3 + \dots + 0 \cdot X^n\), donc $$ \mathrm{Mat}_{\mathcal{B}}(P) = \begin{pmatrix} 1 \\
0 \\
-1 \\
0 \\
\vdots \\
0 \end{pmatrix} \in M_{n+1, 1}(\mathbb{R}). $$ Exemple
Le même vecteur a des colonnes différentes dans des bases différentes. Dans \(E = \mathbb{R}^2\), prenons \(x = (3, 5)\), la base canonique \(\mathcal{B}_c = ((1, 0), (0, 1))\), et la base \(\mathcal{B}' = (e'_1, e'_2)\) avec \(e'_1 = (1, 1)\) et \(e'_2 = (1, -1)\). Dans \(\mathcal{B}_c\) la colonne se lit directement : $$ \mathrm{Mat}_{\mathcal{B}_c}(x) = \begin{pmatrix} 3 \\
5 \end{pmatrix}. $$ Dans \(\mathcal{B}'\), les coordonnées \((a, b)\) sont déterminées par \(x = a e'_1 + b e'_2\), soit \((3, 5) = (a + b, a - b)\), ce qui donne \(a = 4\) et \(b = -1\) : $$ \mathrm{Mat}_{\mathcal{B}'}(x) = \begin{pmatrix} 4 \\
-1 \end{pmatrix}. $$ Définition — Matrice d'une famille de vecteurs
Soit \(E\) un \(\mathbb{K}\)-espace vectoriel de dimension finie \(p\) muni d'une base \(\mathcal{B} = (e_1, \dots, e_p)\), et soit \(\mathcal{F} = (x_1, \dots, x_q)\) une famille de \(q\) vecteurs de \(E\). Chaque vecteur \(x_j\) admet des coordonnées uniques \(x_j = a_{1j} e_1 + \dots + a_{pj} e_p\) dans \(\mathcal{B}\). La matrice de la famille \(\mathcal{F}\) dans la base \(\mathcal{B}\) est la matrice dont la \(j\)-ième colonne est la colonne de \(x_j\) : $$ \mathrm{Mat}_{\mathcal{B}}(\mathcal{F}) = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1q} \\
a_{21} & a_{22} & \cdots & a_{2q} \\
\vdots & \vdots & \ddots & \vdots \\
a_{p1} & a_{p2} & \cdots & a_{pq} \end{pmatrix} \in M_{p, q}(\mathbb{K}). $$
La matrice étiquetée ci-dessous illustre la convention : chaque colonne \(j\) est la colonne de \(x_j\) dans \(\mathcal{B}\).
Moyen mnémotechnique. Colonnes = vecteurs de la famille \(\mathcal{F}\). Lignes = coordonnées dans la base \(\mathcal{B}\). La taille est \(p \times q\) : \(p\) lignes parce que la base \(\mathcal{B}\) a \(p\) vecteurs, \(q\) colonnes parce que la famille \(\mathcal{F}\) contient \(q\) vecteurs.
Exemple
Prenons la base canonique \(\mathcal{B} = (1, X, X^2, \dots, X^n)\) de \(\mathbb{R}_n[X]\) et la famille \(\mathcal{F} = (P_0, P_1, \dots, P_n)\) avec \(P_i = (X + 1)^i\). La formule du binôme donne \(P_i = \sum_{k = 0}^i \binom{i}{k} X^k\), donc la colonne de \(P_i\) contient les coefficients binomiaux \(\binom{i}{0}, \binom{i}{1}, \dots, \binom{i}{i}, 0, \dots, 0\) : $$ \mathrm{Mat}_{\mathcal{B}}(\mathcal{F}) = \begin{pmatrix} 1 & 1 & 1 & \cdots & 1 \\
0 & 1 & 2 & \cdots & \binom{n}{1} \\
0 & 0 & 1 & \cdots & \binom{n}{2} \\
\vdots & \vdots & \vdots & \ddots & \vdots \\
0 & 0 & 0 & \cdots & 1 \end{pmatrix}. $$ C'est une matrice triangulaire supérieure dont la diagonale ne contient que des \(1\). Définition — Matrice d'une application linéaire dans des bases données
Soit \(E\) et \(F\) deux \(\mathbb{K}\)-espaces vectoriels de dimension finie \(p\) et \(n\), munis respectivement des bases \(\mathcal{B} = (e_1, \dots, e_p)\) et \(\mathcal{B}' = (f_1, \dots, f_n)\). Soit \(u \colon E \to F\) une application linéaire. Pour chaque \(j \in \llbracket 1, p \rrbracket\), le vecteur \(u(e_j)\) se décompose de manière unique sur \(\mathcal{B}'\) : $$ u(e_j) = a_{1j} f_1 + \dots + a_{nj} f_n. $$ La matrice de \(u\) dans les bases \(\mathcal{B}\) et \(\mathcal{B}'\) est la matrice de \(M_{n, p}(\mathbb{K})\) dont la \(j\)-ième colonne est la colonne de \(u(e_j)\) dans \(\mathcal{B}'\) : $$ \mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u) = \mathrm{Mat}_{\mathcal{B}'}(u(e_1), \dots, u(e_p)) = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1p} \\
a_{21} & a_{22} & \cdots & a_{2p} \\
\vdots & \vdots & \ddots & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{np} \end{pmatrix}. $$ Les colonnes sont indexées par la base de départ \(\mathcal{B}\), les lignes par la base d'arrivée \(\mathcal{B}'\).Notation pour un endomorphisme. Lorsque \(E = F\) et \(\mathcal{B} = \mathcal{B}'\) (une seule base utilisée au départ et à l'arrivée), la notation se simplifie en \(\mathrm{Mat}_{\mathcal{B}}(u) \in M_n(\mathbb{K})\).
La matrice étiquetée ci-dessous illustre la convention : chaque colonne \(j\) est la colonne de \(u(e_j)\) dans \(\mathcal{B}'\).
Moyen mnémotechnique. Colonnes = images des vecteurs de la base de départ. Lignes = coordonnées dans la base d'arrivée. La taille est \(n \times p\) : \(n\) lignes parce que l'espace d'arrivée est de dimension \(n\), \(p\) colonnes parce que l'espace de départ est de dimension \(p\).
Proposition — Taille de \(\mathrm{Mat}_{\mathcal{B}\virgule \mathcal{B}'}(u)\)
Si \(E\) et \(F\) sont de dimensions respectives \(p\) et \(n\), alors \(\mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u) \in M_{n, p}(\mathbb{K})\) pour tout \(u \in \mathcal{L}(E, F)\). Exemple
La dérivation \(\Function{\Phi}{\mathbb{R}_n[X]}{\mathbb{R}_n[X]}{P}{P'}\) est un endomorphisme. Prenons la base canonique \(\mathcal{B} = (1, X, X^2, \dots, X^n)\). On a \(\Phi(1) = 0\), et pour chaque \(i \in \llbracket 1, n \rrbracket\), \(\Phi(X^i) = i X^{i-1}\), donc la colonne de \(\Phi(X^i)\) dans \(\mathcal{B}\) a un seul coefficient non nul \(i\) à la ligne \(i - 1\) si les lignes sont numérotées à partir de \(0\). La matrice est diagonale décalée vers le haut : $$ \mathrm{Mat}_{\mathcal{B}}(\Phi) = \begin{pmatrix} 0 & 1 & 0 & \cdots & 0 \\
0 & 0 & 2 & \cdots & 0 \\
\vdots & & \ddots & \ddots & \vdots \\
0 & & & 0 & n \\
0 & 0 & \cdots & 0 & 0 \end{pmatrix} \in M_{n+1}(\mathbb{R}). $$ Exemple
Une même application linéaire admet plusieurs matrices selon les bases choisies. Considérons \(u \colon \mathbb{R}^2 \to \mathbb{R}^2\), \(u(x, y) = (x + y, x - y)\).Dans les bases canoniques \(\mathcal{B}_c = ((1, 0), (0, 1))\) au départ et à l'arrivée, \(u(1, 0) = (1, 1)\) et \(u(0, 1) = (1, -1)\), donc $$ \mathrm{Mat}_{\mathcal{B}_c, \mathcal{B}_c}(u) = \begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix}. $$ Conservons maintenant la base canonique au départ mais changeons la base d'arrivée en \(\mathcal{B}' = ((1, 1), (1, -1))\). Il faut exprimer \(u(1, 0) = (1, 1)\) et \(u(0, 1) = (1, -1)\) dans \(\mathcal{B}'\). On lit directement \((1, 1) = 1 \cdot (1, 1) + 0 \cdot (1, -1)\) et \((1, -1) = 0 \cdot (1, 1) + 1 \cdot (1, -1)\), donc $$ \mathrm{Mat}_{\mathcal{B}_c, \mathcal{B}'}(u) = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} = I_2. $$ Les deux matrices encodent la même application linéaire, vue à travers des lunettes différentes.
Theorem — Formule matrice-vecteur
Soit \(E\) et \(F\) deux \(\mathbb{K}\)-espaces vectoriels de dimension finie munis des bases \(\mathcal{B}\) et \(\mathcal{B}'\), et soit \(u \in \mathcal{L}(E, F)\). Pour tout \(x \in E\), $$ \mathrm{Mat}_{\mathcal{B}'}(u(x)) = \mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u) \cdot \mathrm{Mat}_{\mathcal{B}}(x). $$ De manière équivalente, en posant \(A = \mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u)\), \(X = \mathrm{Mat}_{\mathcal{B}}(x)\) et \(Y = \mathrm{Mat}_{\mathcal{B}'}(u(x))\) : $$ Y = A X. $$
Posons \(\mathcal{B} = (e_1, \dots, e_p)\), \(\mathcal{B}' = (f_1, \dots, f_n)\) et \(A = (a_{ij})\), c'est-à-dire \(u(e_j) = \sum_{i=1}^n a_{ij} f_i\) pour chaque \(j\). Écrivons \(x = \sum_{j=1}^p x_j e_j\). La linéarité de \(u\) donne : $$ \begin{aligned} u(x) &= u\Bigl(\sum_{j=1}^p x_j e_j\Bigr) && \text{(décomposition de \(x\) dans \(\mathcal{B}\))} \\
&= \sum_{j=1}^p x_j u(e_j) && \text{(linéarité de \(u\))} \\
&= \sum_{j=1}^p x_j \Bigl(\sum_{i=1}^n a_{ij} f_i\Bigr) && \text{(décomposition de \(u(e_j)\) dans \(\mathcal{B}'\))} \\
&= \sum_{i=1}^n \Bigl(\sum_{j=1}^p a_{ij} x_j\Bigr) f_i && \text{(échange des sommes finies)}. \end{aligned} $$ La \(i\)-ième coordonnée de \(u(x)\) dans \(\mathcal{B}'\) vaut donc \(\sum_{j=1}^p a_{ij} x_j\), qui est précisément le \(i\)-ième coefficient du produit matriciel \(A X\) : $$ \mathrm{Mat}_{\mathcal{B}'}(u(x)) = \begin{pmatrix} \sum_{j=1}^p a_{1j} x_j \\
\vdots \\
\sum_{j=1}^p a_{nj} x_j \end{pmatrix} = A X. $$
Exemple
Appliquons le théorème à la dérivation \(\Phi \colon \mathbb{R}_n[X] \to \mathbb{R}_n[X]\) et à \(P = 1 - X^2\). On a \(\mathrm{Mat}_{\mathcal{B}}(P) = (1, 0, -1, 0, \dots, 0)^\top\) et \(\mathrm{Mat}_{\mathcal{B}}(\Phi)\) est la matrice calculée plus haut. Alors $$ \mathrm{Mat}_{\mathcal{B}}(\Phi(P)) = \mathrm{Mat}_{\mathcal{B}}(\Phi) \cdot \mathrm{Mat}_{\mathcal{B}}(P) = \begin{pmatrix} 0 & 1 & 0 & \cdots \\
0 & 0 & 2 & \cdots \\
\vdots & & & \ddots \end{pmatrix} \begin{pmatrix} 1 \\
0 \\
-1 \\
0 \\
\vdots \end{pmatrix} = \begin{pmatrix} 0 \\
-2 \\
0 \\
0 \\
\vdots \end{pmatrix}, $$ qui est la colonne du polynôme \(-2 X\), confirmant \(\Phi(P) = P' = -2 X\). Méthode — Calculer la matrice d'une application linéaire
Pour calculer \(\mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u)\) où \(\mathcal{B} = (e_1, \dots, e_p)\) et \(\mathcal{B}' = (f_1, \dots, f_n)\) : - Pour chaque vecteur de la base de départ \(e_j\), calculer l'image \(u(e_j) \in F\).
- Décomposer \(u(e_j)\) de manière unique dans la base d'arrivée \(\mathcal{B}'\) : \(u(e_j) = a_{1j} f_1 + \dots + a_{nj} f_n\).
- Empiler les colonnes : la \(j\)-ième colonne est \((a_{1j}, \dots, a_{nj})^\top\).
Compétences à pratiquer
- Calculer la matrice d'une application linéaire
- Calculer dans des bases non canoniques
II
Dictionnaire \(\mathcal{L}(E\virgule F)\) et \(M_{n\virgule p}(\mathbb{K})\)
Le codage matriciel de la section précédente se révèle être une bijection : toute matrice correspond à une unique application linéaire, et toute application linéaire à une unique matrice. La correspondance dépasse la bijection --- elle respecte les opérations algébriques. La somme d'applications devient la somme de matrices, la composition d'applications devient le produit matriciel, et une application est inversible (un isomorphisme) si et seulement si sa matrice est inversible. Le chapitre atteint son message central : le calcul d'algèbre linéaire en dimension finie se réduit entièrement au calcul matriciel.
Définition — Application linéaire canoniquement associée à une matrice
Soit \(A \in M_{n, p}(\mathbb{K})\). L'application linéaire canoniquement associée à \(A\) est l'application $$ \Function{u_A}{\mathbb{K}^p}{\mathbb{K}^n}{X}{AX}, $$ où les vecteurs de \(\mathbb{K}^p\) et \(\mathbb{K}^n\) sont identifiés aux matrices colonnes de \(M_{p, 1}(\mathbb{K})\) et \(M_{n, 1}(\mathbb{K})\). L'application \(u_A\) est linéaire (immédiat à partir de la bilinéarité du produit matriciel), et l'on vérifie que \(\mathrm{Mat}_{\mathcal{B}_c, \mathcal{B}'_c}(u_A) = A\) où \(\mathcal{B}_c\) et \(\mathcal{B}'_c\) sont les bases canoniques. Exemple
La matrice de rotation d'angle \(\theta\) dans le plan, $$ R = \begin{pmatrix} \cos\theta & -\sin\theta \\
\sin\theta & \cos\theta \end{pmatrix} \in M_2(\mathbb{R}), $$ est canoniquement associée à la rotation de \(\mathbb{R}^2\) : $$ \Function{u_R}{\mathbb{R}^2}{\mathbb{R}^2}{(x, y)}{(x \cos\theta - y \sin\theta, \; x \sin\theta + y \cos\theta)}. $$ Exemple
La matrice de cisaillement $$ S = \begin{pmatrix} 1 & 1 \\
0 & 1 \end{pmatrix} $$ est canoniquement associée à \(u_S \colon (x, y) \mapsto (x + y, y)\) sur \(\mathbb{R}^2\). Proposition — Lire les images des vecteurs de base sur les colonnes
Soit \(A \in M_{n, p}(\mathbb{K})\) et \(u_A\) son application linéaire canoniquement associée. Pour chaque \(j \in \llbracket 1, p \rrbracket\), l'image du \(j\)-ième vecteur de la base canonique \(e_j\) de \(\mathbb{K}^p\) est la \(j\)-ième colonne de \(A\) : $$ u_A(e_j) = \text{\(j\)-ième colonne de } A. $$ Theorem — Isomorphisme de dictionnaire
Soit \(E\) et \(F\) deux \(\mathbb{K}\)-espaces vectoriels de dimension finie \(p\) et \(n\), munis des bases \(\mathcal{B}\) et \(\mathcal{B}'\). L'application $$ \Function{\Phi_{\mathcal{B}, \mathcal{B}'}}{\mathcal{L}(E, F)}{M_{n, p}(\mathbb{K})}{u}{\mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u)} $$ est un isomorphisme de \(\mathbb{K}\)-espaces vectoriels.
Posons \(\mathcal{B} = (e_1, \dots, e_p)\), \(\mathcal{B}' = (f_1, \dots, f_n)\).
- Linéarité. Soit \(u, v \in \mathcal{L}(E, F)\) et \(\lambda \in \mathbb{K}\). Pour chaque \(j\), \((\lambda u + v)(e_j) = \lambda u(e_j) + v(e_j)\) ; la décomposition dans \(\mathcal{B}'\) montre que la \(j\)-ième colonne de \(\mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(\lambda u + v)\) vaut \(\lambda \cdot (\text{colonne \)j\( de } \mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u)) + \text{colonne \)j\( de } \mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(v)\). Donc \(\Phi_{\mathcal{B}, \mathcal{B}'}(\lambda u + v) = \lambda \Phi_{\mathcal{B}, \mathcal{B}'}(u) + \Phi_{\mathcal{B}, \mathcal{B}'}(v)\).
- Injectivité. Si \(\Phi_{\mathcal{B}, \mathcal{B}'}(u) = 0\), alors chaque \(u(e_j) = 0\). Comme les \(e_j\) forment une base, tout \(x \in E\) est une combinaison linéaire des \(e_j\), donc \(u(x) = 0\) par linéarité. Ainsi \(u = 0\).
- Surjectivité. Soit \(A = (a_{ij}) \in M_{n, p}(\mathbb{K})\). Définissons \(u \colon E \to F\) en posant \(u(e_j) = \sum_{i=1}^n a_{ij} f_i\) pour chaque \(j\) et en prolongeant par linéarité --- ceci est bien défini parce que \((e_j)\) est une base. Par construction \(\mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u) = A\), donc \(\Phi_{\mathcal{B}, \mathcal{B}'}\) est surjective.
Corollary — Dimension de \(\mathcal{L}(E\virgule F)\)
Si \(E\) et \(F\) sont de dimension finie, alors $$ \dim \mathcal{L}(E, F) = \dim(E) \times \dim(F). $$ Remarque. Cette formule était déjà établie au chapitre Applications linéaires. L'isomorphisme de dictionnaire en donne une seconde démonstration, plus concrète : \(\mathcal{L}(E, F) \cong M_{n, p}(\mathbb{K})\) et \(\dim M_{n, p}(\mathbb{K}) = n p\). Exemple
\(\dim \mathcal{L}(\mathbb{R}^2, \mathbb{R}^3) = 2 \times 3 = 6\). Une application linéaire \(\mathbb{R}^2 \to \mathbb{R}^3\) est décrite par \(6\) scalaires (les coefficients de sa matrice \(3 \times 2\) dans les bases canoniques). Theorem — La composition devient produit matriciel
Soit \(E\), \(F\), \(G\) trois \(\mathbb{K}\)-espaces vectoriels de dimension finie munis des bases \(\mathcal{B}\), \(\mathcal{B}'\), \(\mathcal{B}''\). Soit \(u \in \mathcal{L}(E, F)\) et \(v \in \mathcal{L}(F, G)\). Alors $$ \mathrm{Mat}_{\mathcal{B}, \mathcal{B}''}(v \circ u) = \mathrm{Mat}_{\mathcal{B}', \mathcal{B}''}(v) \cdot \mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u). $$
Posons \(\mathcal{B} = (e_1, \dots, e_p)\). Les colonnes des deux matrices se lisent sur les vecteurs \(e_j\) de la base de départ.
Pour chaque \(j\), la \(j\)-ième colonne de \(\mathrm{Mat}_{\mathcal{B}, \mathcal{B}''}(v \circ u)\) est la colonne de \((v \circ u)(e_j)\) dans \(\mathcal{B}''\), soit \(\mathrm{Mat}_{\mathcal{B}''}(v(u(e_j)))\).
D'après la formule matrice-vecteur appliquée à \(v\) et au vecteur \(u(e_j) \in F\) : $$ \mathrm{Mat}_{\mathcal{B}''}(v(u(e_j))) = \mathrm{Mat}_{\mathcal{B}', \mathcal{B}''}(v) \cdot \mathrm{Mat}_{\mathcal{B}'}(u(e_j)). $$ Le second membre est le produit de \(\mathrm{Mat}_{\mathcal{B}', \mathcal{B}''}(v)\) par la \(j\)-ième colonne de \(\mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u)\), ce qui est précisément la \(j\)-ième colonne de \(\mathrm{Mat}_{\mathcal{B}', \mathcal{B}''}(v) \cdot \mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u)\).
Les deux matrices ayant les mêmes colonnes, elles sont égales.
Pour chaque \(j\), la \(j\)-ième colonne de \(\mathrm{Mat}_{\mathcal{B}, \mathcal{B}''}(v \circ u)\) est la colonne de \((v \circ u)(e_j)\) dans \(\mathcal{B}''\), soit \(\mathrm{Mat}_{\mathcal{B}''}(v(u(e_j)))\).
D'après la formule matrice-vecteur appliquée à \(v\) et au vecteur \(u(e_j) \in F\) : $$ \mathrm{Mat}_{\mathcal{B}''}(v(u(e_j))) = \mathrm{Mat}_{\mathcal{B}', \mathcal{B}''}(v) \cdot \mathrm{Mat}_{\mathcal{B}'}(u(e_j)). $$ Le second membre est le produit de \(\mathrm{Mat}_{\mathcal{B}', \mathcal{B}''}(v)\) par la \(j\)-ième colonne de \(\mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u)\), ce qui est précisément la \(j\)-ième colonne de \(\mathrm{Mat}_{\mathcal{B}', \mathcal{B}''}(v) \cdot \mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u)\).
Les deux matrices ayant les mêmes colonnes, elles sont égales.
Corollary — Isomorphisme d'anneau pour les endomorphismes
Soit \(E\) un \(\mathbb{K}\)-espace vectoriel de dimension finie \(n\) et \(\mathcal{B}\) une base de \(E\). L'application $$ \Function{\Phi_{\mathcal{B}}}{\mathcal{L}(E)}{M_n(\mathbb{K})}{u}{\mathrm{Mat}_{\mathcal{B}}(u)} $$ est un isomorphisme d'anneaux : c'est une bijection qui respecte la somme, la composition (devenant produit matriciel), et envoie \(\mathrm{Id}_E\) sur \(I_n\). L'isomorphisme dépend du choix de la base \(\mathcal{B}\) : une autre base produit un autre isomorphisme. Cette dépendance par rapport à la base est précisément la motivation du chapitre suivant Changement de bases. Méthode — Retrouver \(u(x)\) par le produit matriciel
Pour calculer l'image d'un vecteur \(x \in E\) par une application linéaire \(u \in \mathcal{L}(E, F)\) lorsque l'on dispose des matrices : - Choisir des bases \(\mathcal{B}\) de \(E\) et \(\mathcal{B}'\) de \(F\).
- Écrire la matrice \(A = \mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u)\) et la colonne \(X = \mathrm{Mat}_{\mathcal{B}}(x)\).
- Calculer \(Y = A X\).
- L'image \(u(x)\) est le vecteur de \(F\) dont les coordonnées dans \(\mathcal{B}'\) sont les entrées de \(Y\).
Theorem — Isomorphisme \(\Leftrightarrow\) matrice inversible
Soit \(E\) un \(\mathbb{K}\)-espace vectoriel de dimension finie \(n\), \(\mathcal{B}\) une base de \(E\) et \(u \in \mathcal{L}(E)\). Alors $$ u \in \mathrm{GL}(E) \iff \mathrm{Mat}_{\mathcal{B}}(u) \in \mathrm{GL}_n(\mathbb{K}), $$ et dans ce cas $$ \mathrm{Mat}_{\mathcal{B}}(u^{-1}) = (\mathrm{Mat}_{\mathcal{B}}(u))^{-1}. $$ Variante. Plus généralement, si \(\dim E = \dim F = n\) et si \(\mathcal{B}, \mathcal{B}'\) sont des bases de \(E, F\), alors \(u \colon E \to F\) est un isomorphisme si et seulement si \(\mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u) \in \mathrm{GL}_n(\mathbb{K})\).
Conséquence directe de l'isomorphisme d'anneaux \(\Phi_{\mathcal{B}} \colon \mathcal{L}(E) \to M_n(\mathbb{K})\). Un isomorphisme d'anneaux conserve les éléments inversibles et les inverses : un élément est inversible dans l'anneau source si et seulement si son image est inversible dans l'anneau d'arrivée, et l'inverse est envoyé sur l'inverse. Appliqué à \(u\) et \(\mathrm{Mat}_{\mathcal{B}}(u)\), ceci donne les deux équivalences.
Exemple
La dérivation \(\Phi \colon \mathbb{R}_n[X] \to \mathbb{R}_n[X]\) n'est pas un isomorphisme pour \(n \ge 1\). Sa matrice dans la base canonique est nilpotente (matrice strictement triangulaire supérieure) ; son noyau est \(\mathbb{R}\) (les constantes), de dimension \(1\), donc \(\Phi\) n'est pas injective. Exemple
Montrer que l'application linéaire \(u \colon \mathbb{R}^2 \to \mathbb{R}^2\), \(u(x, y) = (x + y, x - y)\) est un automorphisme et calculer \(u^{-1}\).
Injectivité par le noyau. Supposons \(u(x, y) = (0, 0)\), soit \(x + y = 0\) et \(x - y = 0\). Additionner les deux équations donne \(2 x = 0\), donc \(x = 0\), puis \(y = 0\). Ainsi \(\mathrm{Ker}\, u = \{0\}\).
De l'injectivité à la bijectivité. Comme \(u\) est un endomorphisme de l'espace de dimension finie \(\mathbb{R}^2\) et que \(u\) est injective, le théorème du rang du chapitre précédent donne \(\dim \mathrm{Im}\, u = 2 - 0 = 2\), donc \(\mathrm{Im}\, u = \mathbb{R}^2\) et \(u\) est surjective. Donc \(u\) est un automorphisme. Aucun calcul de déterminant n'est nécessaire.
Inverse. Résolvons \(u(x, y) = (X, Y)\), soit \(x + y = X\) et \(x - y = Y\). L'addition donne \(x = \frac{X + Y}{2}\), la soustraction donne \(y = \frac{X - Y}{2}\). D'où $$ u^{-1}(X, Y) = \Bigl(\frac{X + Y}{2}, \; \frac{X - Y}{2}\Bigr), \qquad \mathrm{Mat}_{\mathcal{B}_c}(u^{-1}) = \frac{1}{2} \begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix}. $$ On vérifie \(\mathrm{Mat}_{\mathcal{B}_c}(u) \cdot \mathrm{Mat}_{\mathcal{B}_c}(u^{-1}) = I_2\) directement.
De l'injectivité à la bijectivité. Comme \(u\) est un endomorphisme de l'espace de dimension finie \(\mathbb{R}^2\) et que \(u\) est injective, le théorème du rang du chapitre précédent donne \(\dim \mathrm{Im}\, u = 2 - 0 = 2\), donc \(\mathrm{Im}\, u = \mathbb{R}^2\) et \(u\) est surjective. Donc \(u\) est un automorphisme. Aucun calcul de déterminant n'est nécessaire.
Inverse. Résolvons \(u(x, y) = (X, Y)\), soit \(x + y = X\) et \(x - y = Y\). L'addition donne \(x = \frac{X + Y}{2}\), la soustraction donne \(y = \frac{X - Y}{2}\). D'où $$ u^{-1}(X, Y) = \Bigl(\frac{X + Y}{2}, \; \frac{X - Y}{2}\Bigr), \qquad \mathrm{Mat}_{\mathcal{B}_c}(u^{-1}) = \frac{1}{2} \begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix}. $$ On vérifie \(\mathrm{Mat}_{\mathcal{B}_c}(u) \cdot \mathrm{Mat}_{\mathcal{B}_c}(u^{-1}) = I_2\) directement.
Méthode — Montrer que \(u\) est un isomorphisme et calculer \(u^{-1}\)
Deux voies complémentaires sont possibles.Voie vectorielle. Montrer \(\mathrm{Ker}\, u = \{0\}\) en résolvant \(u(x) = 0\). Pour un endomorphisme en dimension finie, l'injectivité entraîne la bijectivité (théorème du rang). Calculer alors \(u^{-1}\) en résolvant \(u(x) = y\) pour \(y\) arbitraire.
Voie matricielle. Écrire la matrice \(A = \mathrm{Mat}_{\mathcal{B}}(u)\). Appliquer l'algorithme d'inversion du chapitre Calcul matriciel (Gauss-Jordan sur \([A \,|\, I_n]\) jusqu'à \([I_n \,|\, A^{-1}]\)). La matrice est inversible si et seulement si \(u\) l'est, par l'équivalence ci-dessus.
Les deux voies sont équivalentes ; choisir celle qui présente le moindre coût de calcul sur le cas étudié.
Compétences à pratiquer
- Montrer des isomorphismes via la matrice
- Trouver des bases où la matrice a une forme prescrite
III
Rang d'une matrice
Chaque matrice \(A \in M_{n, p}(\mathbb{K})\) correspond, via l'association canonique, à une application linéaire \(u_A \colon \mathbb{K}^p \to \mathbb{K}^n\). Les notions de noyau, image et rang --- intrinsèques à l'application linéaire --- se relèvent directement à la matrice : \(\mathrm{Ker}\, A\) est le noyau de \(u_A\), \(\mathrm{Im}\, A\) est l'image de \(u_A\) (engendrée par les colonnes de \(A\)), et \(\mathrm{rg}\, A\) est leur rang commun. Les deux résultats clés de la section sont le théorème du rang version matricielle (\(\dim \mathrm{Ker}\, A + \mathrm{rg}\, A = p\)) et un théorème de structure : toute matrice de rang \(r\) admet une forme normale \(P J_{n, p, r} Q\) avec \(P, Q\) inversibles. Cette forme normale est l'outil opératoire qui démontre, sans déterminants, que le rang en lignes égale le rang en colonnes.
Définition — Rang\(\virgule\) noyau et image d'une matrice
Soit \(A \in M_{n, p}(\mathbb{K})\) et \(u_A \colon \mathbb{K}^p \to \mathbb{K}^n\) son application linéaire canoniquement associée. On pose $$ \mathrm{Ker}\, A = \mathrm{Ker}\, u_A = \{ X \in M_{p, 1}(\mathbb{K}) : A X = 0 \}, \qquad \mathrm{Im}\, A = \mathrm{Im}\, u_A = \{ A X : X \in M_{p, 1}(\mathbb{K}) \}. $$ Le rang de \(A\) est la dimension de son image : $$ \mathrm{rg}\, A = \dim \mathrm{Im}\, A = \mathrm{rg}\, u_A. $$ Proposition — Rang \(\equal\) rang de la famille des colonnes
Pour \(A \in M_{n, p}(\mathbb{K})\) de colonnes \(C_1, \dots, C_p \in \mathbb{K}^n\) : $$ \mathrm{Im}\, A = \mathrm{Vect}(C_1, \dots, C_p), \qquad \mathrm{rg}\, A = \mathrm{rg}(C_1, \dots, C_p) = \dim \mathrm{Vect}(C_1, \dots, C_p). $$
L'image de \(u_A\) est engendrée par les images des vecteurs de la base canonique : \(\mathrm{Im}\, u_A = \mathrm{Vect}(u_A(e_1), \dots, u_A(e_p))\). D'après la proposition « Lire les images des vecteurs de base sur les colonnes » ci-dessus, \(u_A(e_j) = C_j\). Donc \(\mathrm{Im}\, A = \mathrm{Vect}(C_1, \dots, C_p)\), et \(\mathrm{rg}\, A\) est la dimension de cet engendré, soit le rang de la famille.
Exemple
Les matrices $$ A = \begin{pmatrix} 1 & 2 \\
2 & 4 \end{pmatrix}, \qquad B = I_n $$ ont \(\mathrm{rg}\, A = 1\) (les deux colonnes sont colinéaires) et \(\mathrm{rg}\, B = n\) (les colonnes forment une base). Proposition — Rang de \(\mathrm{Mat}(u)\) égal rang de \(u\)
Soit \(u \in \mathcal{L}(E, F)\) avec \(E, F\) de dimension finie et \(\mathcal{B}, \mathcal{B}'\) des bases de \(E, F\). Alors $$ \mathrm{rg}(\mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u)) = \mathrm{rg}(u). $$
Les colonnes de \(A = \mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u)\) sont les colonnes de \(u(e_1), \dots, u(e_p)\) dans \(\mathcal{B}'\). En écrivant \(\mathcal{B}' = (f_1, \dots, f_n)\), l'isomorphisme de coordonnées \(F \to \mathbb{K}^n\), \(y \mapsto \mathrm{Mat}_{\mathcal{B}'}(y)\) envoie \(\mathrm{Im}\, u = \mathrm{Vect}(u(e_1), \dots, u(e_p))\) bijectivement sur \(\mathrm{Vect}(C_1, \dots, C_p) = \mathrm{Im}\, A\). Un isomorphisme conserve la dimension, donc \(\mathrm{rg}\, A = \mathrm{rg}\, u\).
Theorem — Théorème du rang\(\virgule\) version matricielle
Soit \(A \in M_{n, p}(\mathbb{K})\). Alors $$ \dim \mathrm{Ker}\, A + \mathrm{rg}\, A = p. $$
Conséquence directe du théorème du rang du chapitre Applications linéaires appliqué à \(u_A \colon \mathbb{K}^p \to \mathbb{K}^n\) : \(\dim \mathrm{Ker}\, u_A + \dim \mathrm{Im}\, u_A = \dim(\mathbb{K}^p) = p\). Par définition de \(\mathrm{Ker}\, A\) et \(\mathrm{rg}\, A\), ceci s'écrit \(\dim \mathrm{Ker}\, A + \mathrm{rg}\, A = p\).
Theorem — Forme normale du rang
Soit \(A \in M_{n, p}(\mathbb{K})\) de rang \(r\). Définissons la forme normale du rang $$ J_{n, p, r} = \begin{pmatrix} I_r & 0 \\
0 & 0 \end{pmatrix} \in M_{n, p}(\mathbb{K}), $$ où le bloc en haut à gauche est l'identité \(I_r\) et les trois autres blocs sont des blocs nuls de tailles adéquates. Alors il existe \(P \in \mathrm{GL}_n(\mathbb{K})\) et \(Q \in \mathrm{GL}_p(\mathbb{K})\) tels que $$ A = P \, J_{n, p, r} \, Q. $$ Ce théorème est présenté ici comme un outil opératoire pour calculer des rangs --- pas encore comme un théorème de classification sous équivalence des matrices. La relation nommée « \(A\) et \(B\) sont équivalentes » et l'interprétation de \(P, Q\) comme matrices de changement de base seront vues au chapitre suivant Changement de bases. Ce théorème est structurellement important, mais dans les calculs courants on calcule généralement le rang par élimination de Gauss.
Soit \(u_A \colon \mathbb{K}^p \to \mathbb{K}^n\) l'application linéaire canoniquement associée ; par hypothèse \(\mathrm{rg}\, u_A = r\).
Choix de la base de départ. Choisir une base \((g_{r+1}, \dots, g_p)\) de \(\mathrm{Ker}\, u_A\) (de dimension \(p - r\) par le théorème du rang). La compléter en une base \(\mathcal{B}_E = (g_1, \dots, g_r, g_{r+1}, \dots, g_p)\) de \(\mathbb{K}^p\).
Choix de la base d'arrivée. Poser \(h_i = u_A(g_i)\) pour \(i \in \llbracket 1, r \rrbracket\). Montrons que \((h_1, \dots, h_r)\) est une base de \(\mathrm{Im}\, u_A\).
Libre. Si \(\sum_{i=1}^r \lambda_i h_i = 0\), alors \(u_A\bigl(\sum_{i=1}^r \lambda_i g_i\bigr) = 0\), donc \(\sum_{i=1}^r \lambda_i g_i \in \mathrm{Ker}\, u_A = \mathrm{Vect}(g_{r+1}, \dots, g_p)\). Comme \((g_1, \dots, g_p)\) est une base, tous les \(\lambda_i\) sont nuls.
Génératrice. Pour tout \(x = \sum_{i=1}^p x_i g_i\), comme \(g_{r+1}, \dots, g_p \in \mathrm{Ker}\, u_A\), \(u_A(x) = \sum_{i=1}^r x_i h_i\). Donc \(\mathrm{Im}\, u_A \subset \mathrm{Vect}(h_1, \dots, h_r)\) ; l'inclusion réciproque est immédiate.
Compléter \((h_1, \dots, h_r)\) en une base \(\mathcal{B}_F = (h_1, \dots, h_r, h_{r+1}, \dots, h_n)\) de \(\mathbb{K}^n\).
Conclusion par vérification directe. Soit \(S \in \mathrm{GL}_p(\mathbb{K})\) la matrice dont les colonnes sont les coordonnées de \(g_1, \dots, g_p\) dans la base canonique de \(\mathbb{K}^p\), et \(P \in \mathrm{GL}_n(\mathbb{K})\) la matrice dont les colonnes sont les coordonnées de \(h_1, \dots, h_n\) dans la base canonique de \(\mathbb{K}^n\). Posons \(Q = S^{-1} \in \mathrm{GL}_p(\mathbb{K})\).
Vérifions directement \(A = P \, J_{n, p, r} \, Q\). Soit \(X \in \mathbb{K}^p\) et posons \(Y = Q X = S^{-1} X\). Alors \(Y\) est la colonne des coordonnées du vecteur \(X\) dans la base \((g_1, \dots, g_p)\), donc \(X = \sum_{i=1}^p y_i g_i\). Comme \(g_{r+1}, \dots, g_p \in \mathrm{Ker}\, u_A\) : $$ A X = u_A(X) = \sum_{i=1}^r y_i u_A(g_i) = \sum_{i=1}^r y_i h_i. $$ D'autre part, \(J_{n, p, r} Y\) est la colonne \((y_1, \dots, y_r, 0, \dots, 0)^\top\), et la multiplication par \(P\) forme la même combinaison linéaire des colonnes \(h_1, \dots, h_n\) : $$ P J_{n, p, r} Y = \sum_{i=1}^r y_i h_i. $$ Ainsi \(A X = P J_{n, p, r} Q X\) pour tout \(X \in \mathbb{K}^p\), donc \(A = P J_{n, p, r} Q\).
Choix de la base de départ. Choisir une base \((g_{r+1}, \dots, g_p)\) de \(\mathrm{Ker}\, u_A\) (de dimension \(p - r\) par le théorème du rang). La compléter en une base \(\mathcal{B}_E = (g_1, \dots, g_r, g_{r+1}, \dots, g_p)\) de \(\mathbb{K}^p\).
Choix de la base d'arrivée. Poser \(h_i = u_A(g_i)\) pour \(i \in \llbracket 1, r \rrbracket\). Montrons que \((h_1, \dots, h_r)\) est une base de \(\mathrm{Im}\, u_A\).
Libre. Si \(\sum_{i=1}^r \lambda_i h_i = 0\), alors \(u_A\bigl(\sum_{i=1}^r \lambda_i g_i\bigr) = 0\), donc \(\sum_{i=1}^r \lambda_i g_i \in \mathrm{Ker}\, u_A = \mathrm{Vect}(g_{r+1}, \dots, g_p)\). Comme \((g_1, \dots, g_p)\) est une base, tous les \(\lambda_i\) sont nuls.
Génératrice. Pour tout \(x = \sum_{i=1}^p x_i g_i\), comme \(g_{r+1}, \dots, g_p \in \mathrm{Ker}\, u_A\), \(u_A(x) = \sum_{i=1}^r x_i h_i\). Donc \(\mathrm{Im}\, u_A \subset \mathrm{Vect}(h_1, \dots, h_r)\) ; l'inclusion réciproque est immédiate.
Compléter \((h_1, \dots, h_r)\) en une base \(\mathcal{B}_F = (h_1, \dots, h_r, h_{r+1}, \dots, h_n)\) de \(\mathbb{K}^n\).
Conclusion par vérification directe. Soit \(S \in \mathrm{GL}_p(\mathbb{K})\) la matrice dont les colonnes sont les coordonnées de \(g_1, \dots, g_p\) dans la base canonique de \(\mathbb{K}^p\), et \(P \in \mathrm{GL}_n(\mathbb{K})\) la matrice dont les colonnes sont les coordonnées de \(h_1, \dots, h_n\) dans la base canonique de \(\mathbb{K}^n\). Posons \(Q = S^{-1} \in \mathrm{GL}_p(\mathbb{K})\).
Vérifions directement \(A = P \, J_{n, p, r} \, Q\). Soit \(X \in \mathbb{K}^p\) et posons \(Y = Q X = S^{-1} X\). Alors \(Y\) est la colonne des coordonnées du vecteur \(X\) dans la base \((g_1, \dots, g_p)\), donc \(X = \sum_{i=1}^p y_i g_i\). Comme \(g_{r+1}, \dots, g_p \in \mathrm{Ker}\, u_A\) : $$ A X = u_A(X) = \sum_{i=1}^r y_i u_A(g_i) = \sum_{i=1}^r y_i h_i. $$ D'autre part, \(J_{n, p, r} Y\) est la colonne \((y_1, \dots, y_r, 0, \dots, 0)^\top\), et la multiplication par \(P\) forme la même combinaison linéaire des colonnes \(h_1, \dots, h_n\) : $$ P J_{n, p, r} Y = \sum_{i=1}^r y_i h_i. $$ Ainsi \(A X = P J_{n, p, r} Q X\) pour tout \(X \in \mathbb{K}^p\), donc \(A = P J_{n, p, r} Q\).
Proposition — La multiplication par une matrice inversible conserve le rang
Soit \(A \in M_{n, p}(\mathbb{K})\), \(P \in \mathrm{GL}_n(\mathbb{K})\), \(Q \in \mathrm{GL}_p(\mathbb{K})\). Alors $$ \mathrm{rg}(P A) = \mathrm{rg}\, A = \mathrm{rg}(A Q). $$ - Multiplication à gauche par \(P\) inversible. On observe que $$ \mathrm{Im}(P A) = \{ P A X : X \in \mathbb{K}^p \} = P(\mathrm{Im}\, A). $$ Comme \(P\) est un isomorphisme de \(\mathbb{K}^n\), sa restriction à \(\mathrm{Im}\, A\) est un isomorphisme de \(\mathrm{Im}\, A\) sur \(P(\mathrm{Im}\, A)\). Donc $$ \dim \mathrm{Im}(P A) = \dim \mathrm{Im}\, A, $$ d'où \(\mathrm{rg}(P A) = \mathrm{rg}\, A\).
- Multiplication à droite par \(Q\) inversible. Comme \(Q\) est un automorphisme de \(\mathbb{K}^p\), $$ \mathrm{Im}(A Q) = \{ A Q X : X \in \mathbb{K}^p \} = \{ A Y : Y \in \mathbb{K}^p \} = \mathrm{Im}\, A. $$ Donc \(\mathrm{rg}(A Q) = \mathrm{rg}\, A\).
Corollary — Rang en lignes \(\equal\) rang en colonnes
Pour tout \(A \in M_{n, p}(\mathbb{K})\), $$ \mathrm{rg}\, A = \mathrm{rg}\, A^\top. $$
Par la forme normale du rang, écrire \(A = P \, J_{n, p, r} \, Q\) avec \(P \in \mathrm{GL}_n(\mathbb{K})\) et \(Q \in \mathrm{GL}_p(\mathbb{K})\), où \(r = \mathrm{rg}\, A\). La transposée donne : $$ A^\top = Q^\top \, J_{n, p, r}^\top \, P^\top = Q^\top \, J_{p, n, r} \, P^\top, $$ puisque la transposée de \(J_{n, p, r}\) (matrice \(n \times p\) avec \(I_r\) en haut à gauche) est \(J_{p, n, r}\) (matrice \(p \times n\) avec \(I_r\) en haut à gauche). Les matrices \(P^\top \in \mathrm{GL}_n(\mathbb{K})\) et \(Q^\top \in \mathrm{GL}_p(\mathbb{K})\) sont inversibles (la transposée d'une matrice inversible est inversible). Par la proposition précédente, $$ \mathrm{rg}\, A^\top = \mathrm{rg}(J_{p, n, r}) = r = \mathrm{rg}\, A. $$
Theorem — Rang d'un produit
Soit \(A \in M_{n, m}(\mathbb{K})\) et \(B \in M_{m, p}(\mathbb{K})\). Alors $$ \mathrm{rg}(A B) \le \min(\mathrm{rg}\, A, \, \mathrm{rg}\, B). $$ De plus : - Si \(A \in \mathrm{GL}_m(\mathbb{K})\) (carrée inversible, \(n = m\)), alors \(\mathrm{rg}(A B) = \mathrm{rg}\, B\).
- Si \(B \in \mathrm{GL}_m(\mathbb{K})\) (carrée inversible, \(m = p\)), alors \(\mathrm{rg}(A B) = \mathrm{rg}\, A\).
- \(\mathrm{rg}(A B) \le \mathrm{rg}\, A\). Chaque colonne de \(A B\) est une combinaison linéaire des colonnes de \(A\) (puisque la colonne \(j\) de \(A B\) est \(A\) fois la colonne \(j\) de \(B\)). Donc \(\mathrm{Im}(A B) \subset \mathrm{Im}\, A\), soit \(\mathrm{rg}(A B) \le \mathrm{rg}\, A\).
- \(\mathrm{rg}(A B) \le \mathrm{rg}\, B\). Identifier avec les applications linéaires : \(u_{A B} = u_A \circ u_B\). Alors \(\mathrm{Im}(u_A \circ u_B) = u_A(\mathrm{Im}\, u_B)\), image par \(u_A\) d'un sous-espace de dimension \(\mathrm{rg}\, B\). La dimension de l'image d'un sous-espace par une application linéaire est au plus celle du sous-espace, donc \(\mathrm{rg}(A B) \le \mathrm{rg}\, B\).
- Raffinements en cas d'inversibilité. Si \(A\) inversible, la proposition précédente donne \(\mathrm{rg}(A B) = \mathrm{rg}\, B\). Symétriquement, si \(B\) inversible, \(\mathrm{rg}(A B) = \mathrm{rg}\, A\).
Méthode — Calculer le rang d'une matrice par élimination de Gauss
Le rang d'une matrice se calcule par opérations élémentaires sur les lignes ou les colonnes : - Appliquer des opérations élémentaires sur les lignes à \(A\) (échange de lignes, multiplication d'une ligne par un scalaire non nul, ajout d'un multiple d'une ligne à une autre) pour mettre \(A\) sous forme échelonnée en lignes.
- Le rang de \(A\) est le nombre de lignes non nulles (de manière équivalente, le nombre de pivots) dans la forme échelonnée.
Par le corollaire \(\mathrm{rg}\, A = \mathrm{rg}\, A^\top\), calculer le rang par opérations sur les colonnes est tout aussi valide.
Méthode — Déterminer \(\mathrm{Ker}\ A\) et \(\mathrm{Im}\ A\)
Pour \(A \in M_{n, p}(\mathbb{K})\) : - Noyau. Résoudre le système homogène \(A X = 0\) par élimination de Gauss sur les lignes de \(A\). La solution générale décrit \(\mathrm{Ker}\, A\) ; une base s'obtient en paramétrant les variables libres.
- Image. L'image est l'espace engendré par les colonnes originales de \(A\). Une méthode sûre est la suivante : réduire \(A\) par lignes sous forme échelonnée, repérer les colonnes pivot, puis prendre les colonnes correspondantes de la matrice originale \(A\). Ces colonnes originales forment une base de \(\mathrm{Im}\, A\). On peut aussi utiliser des opérations élémentaires sur les colonnes : elles reviennent à multiplier \(A\) à droite par une matrice inversible, donc elles conservent l'espace des colonnes. Dans ce cas, les colonnes non nulles de la matrice réduite par colonnes forment une autre base de \(\mathrm{Im}\, A\).
- Vérification de cohérence. Le théorème du rang matriciel \(\dim \mathrm{Ker}\, A + \mathrm{rg}\, A = p\) sert de contrôle entre les deux calculs.
Exemple
Calculer le noyau, l'image et le rang de $$ A = \begin{pmatrix} 1 & 2 & -1 \\
2 & -1 & 8 \\
1 & 1 & 1 \end{pmatrix} \in M_3(\mathbb{R}). $$
Noyau. Résoudre \(A X = 0\). Réduction par opérations sur les lignes : $$ \begin{pmatrix} 1 & 2 & -1 \\
2 & -1 & 8 \\
1 & 1 & 1 \end{pmatrix} \;\xrightarrow{L_2 \leftarrow L_2 - 2 L_1, \; L_3 \leftarrow L_3 - L_1}\; \begin{pmatrix} 1 & 2 & -1 \\
0 & -5 & 10 \\
0 & -1 & 2 \end{pmatrix} \;\xrightarrow{L_2 \leftarrow L_2 - 5 L_3}\; \begin{pmatrix} 1 & 2 & -1 \\
0 & 0 & 0 \\
0 & -1 & 2 \end{pmatrix}. $$ Après échange de lignes, la forme échelonnée a \(2\) pivots, donc \(\mathrm{rg}\, A = 2\). Le noyau est la droite des solutions \(x + 2 y - z = 0\), \(-y + 2 z = 0\). Avec \(z = t\) : \(y = 2 t\), \(x = z - 2 y = t - 4 t = -3 t\). Donc \(\mathrm{Ker}\, A = \mathbb{R} \cdot (-3, 2, 1)^\top\), de dimension \(1\).
Image. \(\mathrm{rg}\, A = 2\) signifie que \(\mathrm{Im}\, A\) est un plan dans \(\mathbb{R}^3\). Les deux premières colonnes \(C_1 = (1, 2, 1)^\top\) et \(C_2 = (2, -1, 1)^\top\) sont libres : si \(\alpha C_1 + \beta C_2 = 0\), les deux premières coordonnées donnent \(\alpha + 2 \beta = 0\) et \(2 \alpha - \beta = 0\), dont l'unique solution est \(\alpha = \beta = 0\). Elles forment une base de \(\mathrm{Im}\, A\) : \(\mathrm{Im}\, A = \mathrm{Vect}(C_1, C_2)\).
Vérification. \(\dim \mathrm{Ker}\, A + \mathrm{rg}\, A = 1 + 2 = 3 = p\). \(\checkmark\)
Image. \(\mathrm{rg}\, A = 2\) signifie que \(\mathrm{Im}\, A\) est un plan dans \(\mathbb{R}^3\). Les deux premières colonnes \(C_1 = (1, 2, 1)^\top\) et \(C_2 = (2, -1, 1)^\top\) sont libres : si \(\alpha C_1 + \beta C_2 = 0\), les deux premières coordonnées donnent \(\alpha + 2 \beta = 0\) et \(2 \alpha - \beta = 0\), dont l'unique solution est \(\alpha = \beta = 0\). Elles forment une base de \(\mathrm{Im}\, A\) : \(\mathrm{Im}\, A = \mathrm{Vect}(C_1, C_2)\).
Vérification. \(\dim \mathrm{Ker}\, A + \mathrm{rg}\, A = 1 + 2 = 3 = p\). \(\checkmark\)
Compétences à pratiquer
- Calculer rang\(\virgule\) noyau et image par Gauss
- Utiliser la forme normale du rang
- Estimer des rangs
IV
Écriture par blocs et bases adaptées
Une matrice peut être découpée en blocs rectangulaires. L'arithmétique sur ces blocs --- somme, produit --- suit les mêmes règles formelles que l'arithmétique scalaire, pourvu que les tailles soient compatibles. La vision par blocs devient particulièrement puissante lorsque les matrices sont lues dans des bases adaptées à une décomposition en somme directe, surtout lorsqu'un ou deux facteurs sont stables : un endomorphisme \(u\) qui stabilise un sous-espace \(F\) prend une forme triangulaire par blocs dans une base construite à partir de \(F\) et d'un supplémentaire, et une forme diagonale par blocs lorsque \(F\) et son supplémentaire sont tous deux stables. Les projecteurs et symétries, définis au chapitre précédent, en sont les exemples archétypaux.
Définition — Écriture par blocs d'une matrice
Soit \(A \in M_{n, p}(\mathbb{K})\). Choisir une partition \(n = n_1 + \dots + n_s\) des indices de lignes et une partition \(p = p_1 + \dots + p_t\) des indices de colonnes. La matrice \(A\) admet une écriture par blocs $$ A = \begin{pmatrix} A_{11} & A_{12} & \cdots & A_{1t} \\
A_{21} & A_{22} & \cdots & A_{2t} \\
\vdots & \vdots & \ddots & \vdots \\
A_{s1} & A_{s2} & \cdots & A_{st} \end{pmatrix}, $$ où le bloc \(A_{kl} \in M_{n_k, p_l}(\mathbb{K})\) regroupe les coefficients de \(A\) aux indices de lignes du \(k\)-ième groupe et indices de colonnes du \(l\)-ième groupe. Proposition — Produit par blocs
Soit \(A \in M_{n, p}(\mathbb{K})\) et \(B \in M_{p, q}(\mathbb{K})\), les partitions de lignes/colonnes étant choisies de sorte que la partition de colonnes de \(A\) coïncide avec la partition de lignes de \(B\). En écrivant $$ A = (A_{kl}), \qquad B = (B_{lm}), $$ le produit \(A B\) admet une écriture par blocs dont les blocs vérifient la formule $$ (A B)_{km} = \sum_l A_{kl} \, B_{lm}, $$ formellement identique à la règle du produit scalaire, les blocs jouant le rôle de coefficients. Exemple
Prenons les matrices \(4 \times 4\) par blocs, partitionnées en blocs \(2 \times 2\) : $$ A = \begin{pmatrix} 1 & 0 \,\big|\, 2 & 1 \\
0 & 1 \,\big|\, 1 & 0 \\
\hline 0 & 0 \,\big|\, 1 & 0 \\
0 & 0 \,\big|\, 0 & 1 \end{pmatrix} = \begin{pmatrix} I_2 & C \\
0 & I_2 \end{pmatrix}, \qquad B = \begin{pmatrix} I_2 & D \\
0 & I_2 \end{pmatrix}, $$ avec \(C = \begin{pmatrix} 2 & 1 \\ 1 & 0 \end{pmatrix}\) et \(D \in M_2(\mathbb{R})\) arbitraire. La règle du produit par blocs donne $$ A B = \begin{pmatrix} I_2 \cdot I_2 + C \cdot 0 & \;\; I_2 \cdot D + C \cdot I_2 \\
0 \cdot I_2 + I_2 \cdot 0 & \;\; 0 \cdot D + I_2 \cdot I_2 \end{pmatrix} = \begin{pmatrix} I_2 & D + C \\
0 & I_2 \end{pmatrix}. $$ Theorem — Matrice dans une base adaptée à une somme directe stable
Soit \(E\) un \(\mathbb{K}\)-espace vectoriel de dimension \(n\), et \(E = F \oplus G\) avec \(\dim F = r\) et \(\dim G = n - r\). Soit \(\mathcal{B}_F\) une base de \(F\), \(\mathcal{B}_G\) une base de \(G\), et \(\mathcal{B} = (\mathcal{B}_F, \mathcal{B}_G)\) la base de \(E\) obtenue par concaténation. Soit \(u \in \mathcal{L}(E)\). - Si \(F\) est stable par \(u\) (c'est-à-dire \(u(F) \subset F\)), alors $$ \mathrm{Mat}_{\mathcal{B}}(u) = \begin{pmatrix} A & B \\ 0 & D \end{pmatrix} $$ avec \(A \in M_r(\mathbb{K})\), \(D \in M_{n - r}(\mathbb{K})\), \(B \in M_{r, n - r}(\mathbb{K})\). Ici \(A = \mathrm{Mat}_{\mathcal{B}_F}(u|_F)\) est la matrice de la restriction.
- Si \(F\) et \(G\) sont tous deux stables par \(u\), alors \(B = 0\) et $$ \mathrm{Mat}_{\mathcal{B}}(u) = \begin{pmatrix} A & 0 \\ 0 & D \end{pmatrix} $$ (forme diagonale par blocs).
Posons \(\mathcal{B}_F = (e_1, \dots, e_r)\), \(\mathcal{B}_G = (e_{r+1}, \dots, e_n)\). Lisons les colonnes de \(\mathrm{Mat}_{\mathcal{B}}(u)\).
Les \(r\) premières colonnes. Pour \(j \in \llbracket 1, r \rrbracket\), le vecteur \(e_j\) appartient à \(F\), donc \(u(e_j) \in F\) (puisque \(F\) est stable). La décomposition \(u(e_j) = a_{1j} e_1 + \dots + a_{rj} e_r + 0 \cdot e_{r+1} + \dots + 0 \cdot e_n\) a des zéros aux indices \(i > r\). Ainsi le bloc en bas à gauche (lignes \(> r\), colonnes \(\le r\)) est nul. Sa partie haute est précisément \(\mathrm{Mat}_{\mathcal{B}_F}(u|_F)\).
Les \(n - r\) dernières colonnes. Pour \(j \in \llbracket r + 1, n \rrbracket\), le vecteur \(e_j\) appartient à \(G\) ; sans hypothèse de stabilité sur \(G\), l'image \(u(e_j)\) peut avoir des composantes arbitraires sur \(\mathcal{B}_F\) (donnant le bloc \(B\)) et sur \(\mathcal{B}_G\) (donnant le bloc \(D\)).
Si en plus \(G\) est stable par \(u\), alors \(u(e_j) \in G\) pour tout \(j > r\), donc la décomposition a des zéros aux indices \(i \le r\) : le bloc en haut à droite \(B\) est nul.
Les \(r\) premières colonnes. Pour \(j \in \llbracket 1, r \rrbracket\), le vecteur \(e_j\) appartient à \(F\), donc \(u(e_j) \in F\) (puisque \(F\) est stable). La décomposition \(u(e_j) = a_{1j} e_1 + \dots + a_{rj} e_r + 0 \cdot e_{r+1} + \dots + 0 \cdot e_n\) a des zéros aux indices \(i > r\). Ainsi le bloc en bas à gauche (lignes \(> r\), colonnes \(\le r\)) est nul. Sa partie haute est précisément \(\mathrm{Mat}_{\mathcal{B}_F}(u|_F)\).
Les \(n - r\) dernières colonnes. Pour \(j \in \llbracket r + 1, n \rrbracket\), le vecteur \(e_j\) appartient à \(G\) ; sans hypothèse de stabilité sur \(G\), l'image \(u(e_j)\) peut avoir des composantes arbitraires sur \(\mathcal{B}_F\) (donnant le bloc \(B\)) et sur \(\mathcal{B}_G\) (donnant le bloc \(D\)).
Si en plus \(G\) est stable par \(u\), alors \(u(e_j) \in G\) pour tout \(j > r\), donc la décomposition a des zéros aux indices \(i \le r\) : le bloc en haut à droite \(B\) est nul.
Le diagramme ci-dessous illustre la décomposition par blocs d'une matrice écrite dans une base adaptée à \(E = F \oplus G\) avec \(F\) et \(G\) tous deux stables.
Aide à la lecture. \(A\) est la matrice de \(u|_F\) dans \(\mathcal{B}_F\), \(D\) est la matrice de \(u|_G\) dans \(\mathcal{B}_G\).
Exemple
Soit \(p\) un projecteur sur \(F\) parallèlement à \(G\) (donc \(E = F \oplus G\), \(p(x) = x\) pour \(x \in F\), \(p(x) = 0\) pour \(x \in G\)), avec \(\dim F = r\). Dans une base \(\mathcal{B} = (\mathcal{B}_F, \mathcal{B}_G)\) adaptée à \(F \oplus G\) : $$ \mathrm{Mat}_{\mathcal{B}}(p) = \begin{pmatrix} I_r & 0 \\
0 & 0 \end{pmatrix}. $$ Les deux sous-espaces stables sont \(F = \mathrm{Im}\, p\) et \(G = \mathrm{Ker}\, p\). Exemple
Soit \(s\) une symétrie par rapport à \(F\) parallèlement à \(G\) (\(s(x) = x\) pour \(x \in F\), \(s(x) = -x\) pour \(x \in G\)), avec \(\dim F = r\), \(\dim G = n - r\). Dans une base adaptée : $$ \mathrm{Mat}_{\mathcal{B}}(s) = \begin{pmatrix} I_r & 0 \\
0 & -I_{n - r} \end{pmatrix}. $$ Exemple
L'homothétie \(h_\lambda \colon x \mapsto \lambda x\) a pour matrice \(\lambda I_n\) dans toute base de \(E\). Toute droite \(\mathbb{K} \cdot x\) est stable par \(h_\lambda\), donc la décomposition \(E = F \oplus G\) peut être choisie librement. Méthode — Lire \(\mathrm{Ker}\ u\) et \(\mathrm{Im}\ u\) sur une forme par blocs
Supposons que \(u\) ait pour matrice \(\mathrm{Mat}_{\mathcal{B}}(u) = \begin{pmatrix} A & 0 \\ 0 & 0 \end{pmatrix}\) avec \(A \in \mathrm{GL}_r(\mathbb{K})\) dans une base adaptée à \(E = F \oplus G\). Alors : - \(\mathrm{Im}\, u = F\) et \(\dim \mathrm{Im}\, u = r = \mathrm{rg}\, u\).
- \(\mathrm{Ker}\, u = G\) et \(\dim \mathrm{Ker}\, u = n - r\).
Compétences à pratiquer
- Matrices par blocs et bases adaptées
V
Synthèse : le dictionnaire en un tableau
Le chapitre a construit une correspondance bijective entre les objets de l'algèbre linéaire (vecteurs, applications linéaires, noyau, image, rang) et les objets matriciels (matrices colonnes, matrices rectangulaires, noyau d'une matrice, image d'une matrice, rang d'une matrice), et a montré que cette correspondance respecte chaque opération algébrique. Les deux points de vue sont complètement interchangeables en dimension finie. \renewcommand{\arraystretch}{1.3}
| Langage des espaces vectoriels | Langage matriciel |
| \(x \in E\) | \(X = \mathrm{Mat}_{\mathcal{B}}(x)\) |
| \(u \in \mathcal{L}(E, F)\) | \(A = \mathrm{Mat}_{\mathcal{B}, \mathcal{B}'}(u)\) |
| \(u(x)\) | \(A X\) |
| \(v \circ u\) | \(B A\) |
| \(u \in \mathrm{GL}(E)\) | \(A \in \mathrm{GL}_n(\mathbb{K})\) |
| \(\mathrm{rg}(u)\) | \(\mathrm{rg}(A)\) |
| \(\mathrm{Ker}\, u\) | \(\mathrm{Ker}\, A\) |
| \(\mathrm{Im}\, u\) | espace engendré par les colonnes de \(A\) |
Méthode — Choisir entre formalisme des applications linéaires et formalisme matriciel
Les deux formalismes décrivent le même objet ; le choix se fait par le coût du calcul en jeu. - Formalisme matriciel adapté lorsque les données sont explicites (coefficients numériques, base polynomiale) et qu'un calcul doit être effectué : inverser, calculer l'image d'un vecteur précis, trouver une base du noyau par élimination de Gauss.
- Formalisme des applications linéaires adapté lorsque le raisonnement est abstrait (énoncé valable dans toute base, propriétés qualitatives comme injectivité / surjectivité), ou lorsque l'application linéaire a une définition naturelle qui ne passe pas par les coordonnées (une projection, une dérivation, un opérateur d'intégration).
Une question s'ouvre pour le chapitre suivant. Deux bases du même espace vectoriel produisent deux matrices différentes pour la même application linéaire ; comment ces matrices se relient-elles ? Quantifier cette relation est l'objet du chapitre Changement de bases, où la trace d'un endomorphisme --- une quantité qui requiert l'indépendance par rapport à la base --- sera également définie.
Compétences à pratiquer
- Banque Vrai-Faux
- Exercices de synthèse
Aller à la section