CommeUnJeu · L1 PCSI
Systèmes linéaires
Un système linéaire de \(n\) équations à \(p\) inconnues se traduit littéralement en une équation matricielle \(A X = B\), avec \(A \in M_{n,p}(\mathbb{K})\), \(X \in M_{p,1}(\mathbb{K})\) et \(B \in M_{n,1}(\mathbb{K})\). À partir de cette unique réécriture, tout le calcul matriciel du chapitre précédent devient disponible : la linéarité de \(X \mapsto A X\) fournit un théorème de structure (toute solution est une solution particulière plus une solution du système homogène), les opérations élémentaires sur les lignes préservent l'ensemble des solutions, et l'algorithme du pivot de Gauss ramène tout système à une forme échelonnée d'où l'on lit directement les solutions. Le chapitre se conclut par une courte application : lorsque \(A\) est carrée inversible, le système est dit de Cramer et admet pour unique solution \(X = A^{-1} B\).
Ce chapitre est délibérément bref : par convention, toute technicité est exclue. Les exemples respectent cette consigne : au plus trois équations, au plus une inconnue libre ; les exemples plus lourds sont reportés dans le fichier d'exercices. Les formules de Cramer en termes de déterminants sont reportées à Déterminants, les critères d'existence et d'unicité par le rang à Espaces vectoriels de dimension finie et Changements de bases, l'interprétation géométrique à Sous-espaces affines, et la théorie formelle de la notation \(\mathrm{Vect}\) à Espaces vectoriels.
Ce chapitre est délibérément bref : par convention, toute technicité est exclue. Les exemples respectent cette consigne : au plus trois équations, au plus une inconnue libre ; les exemples plus lourds sont reportés dans le fichier d'exercices. Les formules de Cramer en termes de déterminants sont reportées à Déterminants, les critères d'existence et d'unicité par le rang à Espaces vectoriels de dimension finie et Changements de bases, l'interprétation géométrique à Sous-espaces affines, et la théorie formelle de la notation \(\mathrm{Vect}\) à Espaces vectoriels.
Conventions
Tout au long de ce chapitre, \(\mathbb{K}\) désigne \(\mathbb{R}\) ou \(\mathbb{C}\). La lettre \(n\) compte le nombre d'équations du système, la lettre \(p\) compte le nombre d'inconnues ; en général \(n \ne p\). La colonne nulle de taille \(n\) est notée \(0_{n,1}\) (souvent abrégée en \(0\) lorsque la taille est claire d'après le contexte). Toutes les opérations sur les lignes sont notées \(L_i \leftrightarrow L_j\) (échange), \(L_i \leftarrow \lambda L_i\) (dilatation, \(\lambda \ne 0\) --- aussi appelée « multiplication d'une ligne par un scalaire non nul ») et \(L_i \leftarrow L_i + \lambda L_j\) (transvection, \(i \ne j\)), conformément aux conventions du chapitre Calcul matriciel.
I
Forme matricielle d'un système linéaire
Un système linéaire de \(n\) équations à \(p\) inconnues est une liste d'équations de la forme \(a_{i1} x_1 + a_{i2} x_2 + \dots + a_{ip} x_p = b_i\) pour \(i = 1, \ldots, n\), chaque membre étant linéaire en les inconnues \(x_1, \ldots, x_p\). La liste entière se réécrit en une seule équation matricielle \(A X = B\), avec \(A\) la matrice des coefficients, \(X\) la colonne des inconnues et \(B\) la colonne des seconds membres. Cette unique réécriture suffira à importer tout le calcul matriciel du chapitre précédent dans l'étude des systèmes.
Définition — Système linéaire\(\virgule\) forme matricielle
Soient \(n, p \ge 1\) deux entiers strictement positifs, pas nécessairement égaux. Un système linéaire de \(n\) équations à \(p\) inconnues à coefficients dans \(\mathbb{K}\) est une liste $$ \begin{aligned} & a_{11} x_1 + a_{12} x_2 + \cdots + a_{1p} x_p = b_1, \\
& a_{21} x_1 + a_{22} x_2 + \cdots + a_{2p} x_p = b_2, \\
& \qquad\qquad\qquad\qquad \vdots \\
& a_{n1} x_1 + a_{n2} x_2 + \cdots + a_{np} x_p = b_n, \end{aligned} $$ où les \(a_{ij} \in \mathbb{K}\) sont les coefficients du système, les \(x_j\) sont les inconnues et les \(b_i \in \mathbb{K}\) sont les seconds membres. En posant \(A = (a_{ij}) \in M_{n,p}(\mathbb{K})\), \(X = (x_j) \in M_{p,1}(\mathbb{K})\) et \(B = (b_i) \in M_{n,1}(\mathbb{K})\), le système s'écrit $$ A X = B, $$ appelée la forme matricielle du système. La matrice \(A\) est la matrice du système, et \(B\) est son second membre. Exemple
Le système \(3 \times 3\) aux inconnues \((x, y, z) \in \mathbb{R}^3\) $$ \begin{aligned} & 2x + y - 3z = 3, \\
& \phantom{2x +\,} 5y + z = 2, \\
& 9x + 10y + 2z = 1 \end{aligned} \quad \text{s'écrit} \quad \begin{pmatrix} 2 & 1 & -3 \\
0 & 5 & 1 \\
9 & 10 & 2 \end{pmatrix} \begin{pmatrix} x \\
y \\
z \end{pmatrix} = \begin{pmatrix} 3 \\
2 \\
1 \end{pmatrix}. $$ Ici \(n = p = 3\) et la matrice \(A\) est carrée. Exemple
Le système non carré \(2 \times 3\) \(\{x + 2y - z = 4 \;;\; 3x - y + 5z = 0\}\) (deux équations, trois inconnues, donc \(n = 2\) et \(p = 3\)) s'écrit $$ \begin{pmatrix} 1 & 2 & -1 \\
3 & -1 & 5 \end{pmatrix} \begin{pmatrix} x \\
y \\
z \end{pmatrix} = \begin{pmatrix} 4 \\
0 \end{pmatrix}. $$ Réciproquement, le système non carré \(\{2x + y = 1 \;;\; x - 3y = 4 \;;\; -x + y = 2\}\) (trois équations, deux inconnues, donc \(n = 3\), \(p = 2\)) admet la forme matricielle $$ \begin{pmatrix} 2 & 1 \\
1 & -3 \\
-1 & 1 \end{pmatrix} \begin{pmatrix} x \\
y \end{pmatrix} = \begin{pmatrix} 1 \\
4 \\
2 \end{pmatrix}. $$ Le cas \(n \ne p\) est la règle, pas l'exception. Définition — Système homogène
Le système homogène associé à \(A X = B\) est le système $$ A X = 0_{n,1}, $$ obtenu en remplaçant le second membre par la colonne nulle de taille \(n\). Lorsque la taille est claire d'après le contexte, on abrège \(0_{n,1}\) en \(0\) et l'on écrit simplement \(A X = 0\). Exemple
Le système homogène associé au système \(3 \times 3\) de l'Exemple 1 est $$ \begin{pmatrix} 2 & 1 & -3 \\
0 & 5 & 1 \\
9 & 10 & 2 \end{pmatrix} \begin{pmatrix} x \\
y \\
z \end{pmatrix} = \begin{pmatrix} 0 \\
0 \\
0 \end{pmatrix}. $$ La matrice \(A\) est identique ; seul le second membre a changé. En particulier, \(X = (0, 0, 0)^\top\) est toujours solution du système homogène --- on l'appelle la solution triviale. Définition — Système compatible
Le système \(A X = B\) est compatible s'il admet au moins une solution \(X \in M_{p,1}(\mathbb{K})\), et incompatible sinon. Le système homogène \(A X = 0\) est toujours compatible (la solution triviale \(X = 0\) est solution). Proposition — Compatibilité par les colonnes de \(A\)
Soit \(A \in M_{n,p}(\mathbb{K})\) de colonnes \(C_1, \ldots, C_p \in M_{n,1}(\mathbb{K})\) et soit \(B \in M_{n,1}(\mathbb{K})\). Alors \(A X = B\) est compatible si et seulement si \(B\) est combinaison linéaire de \(C_1, \ldots, C_p\), c'est-à-dire $$ \textcolor{colorprop}{A X = B \text{ compatible } \iff \exists\, (x_1, \ldots, x_p) \in \mathbb{K}^p,\ B = x_1 C_1 + x_2 C_2 + \cdots + x_p C_p.} $$
Pour \(X = (x_1, \ldots, x_p)^\top \in M_{p,1}(\mathbb{K})\), le produit matriciel \(A X\) se déplie (comme démontré au chapitre Calcul matriciel) en une combinaison linéaire des colonnes de \(A\) pondérée par les entrées de \(X\) : $$ \begin{aligned} A X & = \begin{pmatrix} C_1 & C_2 & \cdots & C_p \end{pmatrix} \begin{pmatrix} x_1 \\
x_2 \\
\vdots \\
x_p \end{pmatrix} && \text{(vue par blocs de \(A\))} \\
& = x_1 C_1 + x_2 C_2 + \cdots + x_p C_p && \text{(règle colonne \(\times\) inconnue).} \end{aligned} $$ Donc \(A X = B\) admet une solution \(X\) si et seulement s'il existe des scalaires \(x_1, \ldots, x_p\) tels que \(x_1 C_1 + \cdots + x_p C_p = B\), ce qui est l'équivalence annoncée.
Ce critère est surtout conceptuel : en pratique, la réduction de Gauss (présentée plus loin) est la méthode standard pour tester la compatibilité.
Ce critère est surtout conceptuel : en pratique, la réduction de Gauss (présentée plus loin) est la méthode standard pour tester la compatibilité.
Exemple
Considérons \(A X = B\) avec \(A = \begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix}\) et \(B = \begin{pmatrix} 1 \\ 0 \end{pmatrix}\). Les deux colonnes de \(A\) sont \(C_1 = C_2 = (1, 1)^\top\). Toute combinaison linéaire \(x_1 C_1 + x_2 C_2 = (x_1 + x_2)(1, 1)^\top\) a ses deux coefficients égaux. Le second membre \(B = (1, 0)^\top\) a deux coefficients différents, donc \(B\) n'est pas combinaison linéaire des colonnes. Par la Proposition 1, le système est incompatible. Exemple
Prenons \(A = \begin{pmatrix} 1 & 0 & 1 \\ 0 & 1 & 1 \\ 0 & 0 & 0 \end{pmatrix}\) et \(B = \begin{pmatrix} 2 \\ 3 \\ 0 \end{pmatrix}\). Les colonnes de \(A\) sont \(C_1 = (1, 0, 0)^\top\), \(C_2 = (0, 1, 0)^\top\), \(C_3 = (1, 1, 0)^\top\). On observe que \(B = 2 C_1 + 3 C_2\) (avec \(x_3 = 0\)), donc \(B\) est combinaison linéaire des colonnes et par la Proposition 1 le système est compatible. La solution \(X = (2, 3, 0)^\top\) se lit directement sur la même identité. Compétences à pratiquer
- Écrire un système sous forme matricielle
- Vérifier la compatibilité
II
Structure de l'ensemble des solutions
Le théorème qui suit est le résultat le plus important du chapitre. Il ramène la question « à quoi ressemble l'ensemble des solutions de \(A X = B\) ? » à deux sous-questions indépendantes : (1) existe-t-il une solution ? et (2) à quoi ressemble l'ensemble des solutions du système homogène \(A X = 0\) ? La réponse se construit une fois pour toutes : toute solution est une solution particulière plus une solution quelconque du système homogène. La démonstration est une conséquence de deux lignes de la linéarité de \(X \mapsto A X\).
Theorem — Structure de l'ensemble des solutions
Soient \(A \in M_{n,p}(\mathbb{K})\) et \(B \in M_{n,1}(\mathbb{K})\). Supposons que le système \(A X = B\) soit compatible, et soit \(X_p \in M_{p,1}(\mathbb{K})\) une solution particulière quelconque, de sorte que \(A X_p = B\). Alors l'ensemble \(\mathcal{S}\) des solutions de \(A X = B\) est $$ \textcolor{colorprop}{\mathcal{S} = \{\, X_p + Y \;:\; Y \in M_{p,1}(\mathbb{K}),\ A Y = 0_{n,1} \,\}.} $$ Autrement dit, toute solution de \(A X = B\) est la somme de la solution particulière fixée \(X_p\) et d'une solution \(Y\) du système homogène associé.
Appliquons la linéarité de l'application \(X \mapsto A X\) (démontrée au chapitre Calcul matriciel) : pour tout \(X \in M_{p,1}(\mathbb{K})\), posons \(Y := X - X_p\). Alors $$ \begin{aligned} A X = B & \iff A X = A X_p && \text{(puisque \(A X_p = B\) par hypothèse)} \\
& \iff A X - A X_p = 0_{n,1} && \text{(soustraire \(A X_p\) aux deux membres)} \\
& \iff A (X - X_p) = 0_{n,1} && \text{(linéarité de \(X \mapsto A X\))} \\
& \iff A Y = 0_{n,1} && \text{(en posant \(Y := X - X_p\)).} \end{aligned} $$ Donc \(X\) est solution de \(A X = B\) si et seulement si \(Y = X - X_p\) est solution du système homogène, c'est-à-dire \(X = X_p + Y\) avec \(A Y = 0\). Les deux ensembles sont égaux.
Définition — Notation \(\mathrm{Vect}\) (convention d'écriture)
Pour des colonnes \(X_1, \ldots, X_r \in M_{p,1}(\mathbb{K})\), on note $$ \mathrm{Vect}(X_1, \ldots, X_r) := \{\, \lambda_1 X_1 + \lambda_2 X_2 + \cdots + \lambda_r X_r \;:\; \lambda_1, \ldots, \lambda_r \in \mathbb{K} \,\} $$ l'ensemble des combinaisons linéaires de \(X_1, \ldots, X_r\). Remarque. À ce stade du cours, \(\mathrm{Vect}(\ldots)\) est uniquement une convention d'écriture pour cet ensemble --- rien de plus. La théorie formelle des sous-espaces engendrés par une famille (sous-espace engendré, dimension, etc.) est développée au chapitre Espaces vectoriels ; nous utilisons cette notation ici seulement pour écrire l'ensemble des solutions d'un système sous forme compacte.
Exemple
Résoudre le système \(2 \times 3\) compatible \(\{x + 2y - z = 1 \;;\; 2x + 5y + z = 2\}\) dans \((x, y, z) \in \mathbb{R}^3\) et exprimer l'ensemble des solutions à la fois sous forme paramétrique explicite et à l'aide de la notation \(\mathrm{Vect}\).
Appliquons l'opération \(L_2 \leftarrow L_2 - 2 L_1\) au système : $$ \begin{aligned} & \begin{cases} x + 2y - z = 1, \\
2x + 5y + z = 2 \end{cases} && \text{(initial)} \\
\iff{} & \begin{cases} x + 2y - z = 1, \\
\phantom{x + 2}y + 3z = 0 \end{cases} && \text{(\(L_2 \leftarrow L_2 - 2 L_1\), transvection).} \end{aligned} $$ La seconde équation donne \(y = -3z\). En reportant dans la première : \(x = 1 - 2y + z = 1 - 2(-3z) + z = 1 + 7z\). Ainsi, avec \(\lambda := z\) comme paramètre libre, l'ensemble des solutions est $$ \mathcal{S} = \left\{\, \begin{pmatrix} 1 + 7\lambda \\
-3\lambda \\
\lambda \end{pmatrix} \;:\; \lambda \in \mathbb{R} \,\right\}. $$ De manière équivalente, en séparant la partie \(\lambda\)-indépendante (solution particulière \(X_p\)) de la partie \(\lambda\)-dépendante : $$ \mathcal{S} = \begin{pmatrix} 1 \\
0 \\
0 \end{pmatrix} + \mathrm{Vect}\!\left( \begin{pmatrix} 7 \\
-3 \\
1 \end{pmatrix} \right). $$ Les deux formes décrivent le même ensemble : la forme paramétrique rend la famille de solutions visible coordonnée par coordonnée, la forme \(\mathrm{Vect}\) rend visible la structure « particulière + homogène » du Théorème 1 d'un seul coup d'œil.
Méthode — Résoudre un système en particulière plus homogène
Pour décrire l'ensemble des solutions d'un système compatible \(A X = B\) : - trouver une solution particulière \(X_p\) telle que \(A X_p = B\) (par inspection ou par Gauss) ;
- décrire toutes les solutions du système homogène \(A Y = 0\) (typiquement sous la forme \(\mathrm{Vect}(Y_1, \ldots, Y_r)\) pour des colonnes explicites \(Y_1, \ldots, Y_r\)) ;
- conclure \(\mathcal{S} = X_p + \mathrm{Vect}(Y_1, \ldots, Y_r)\).
Compétences à pratiquer
- Exprimer l'ensemble des solutions comme particulière plus homogène
III
Interprétation géométrique
Le théorème de structure ci-dessus prend un visage géométrique familier lorsque les inconnues sont dans \(\mathbb{R}^2\) ou \(\mathbb{R}^3\). Dans \(\mathbb{R}^2\), une équation linéaire non dégénérée définit une droite ; dans \(\mathbb{R}^3\), une équation linéaire non dégénérée définit un plan. Un système est alors l'intersection de ces droites ou de ces plans. Esquissons le tableau de manière informelle ; la théorie affine rigoureuse (sous-espace affine, direction, dimension) fait l'objet du chapitre Sous-espaces affines.
Dans le plan \(\mathbb{R}^2\)
Une équation linéaire \(a x + b y = c\) avec \((a, b) \ne (0, 0)\) définit une droite \(D\) dans \(\mathbb{R}^2\). Si \((a, b) = (0, 0)\), l'équation dégénère : elle est trivialement vérifiée si \(c = 0\) (tout le plan est « solution »), ou incompatible si \(c \ne 0\).
Pour un système \(2 \times 2\) \(\{a_1 x + b_1 y = c_1 \;;\; a_2 x + b_2 y = c_2\}\) avec les deux paires \((a_i, b_i)\) non nulles, l'ensemble des solutions est l'intersection de deux droites \(D_1\) et \(D_2\). Trois situations typiques :
Pour un système \(2 \times 2\) \(\{a_1 x + b_1 y = c_1 \;;\; a_2 x + b_2 y = c_2\}\) avec les deux paires \((a_i, b_i)\) non nulles, l'ensemble des solutions est l'intersection de deux droites \(D_1\) et \(D_2\). Trois situations typiques :
- \(D_1\) et \(D_2\) sont sécantes : elles ont exactement un point commun, et le système admet une unique solution ;
- \(D_1\) et \(D_2\) sont parallèles distinctes : elles n'ont aucun point commun, et le système est incompatible ;
- \(D_1\) et \(D_2\) sont confondues : les deux équations décrivent la même droite, et l'ensemble des solutions est la droite elle-même.
Exemple
Résoudre et interpréter géométriquement chacun des deux systèmes \(2 \times 2\) $$ (S_1): \begin{cases} x + y = 3, \\
2x - y = 0; \end{cases} \qquad (S_2): \begin{cases} x + y = 1, \\
2x + 2y = 5. \end{cases} $$
Pour \((S_1)\), additionnons les deux équations : \(3x = 3\), d'où \(x = 1\) et \(y = 3 - x = 2\). L'unique solution est \((1, 2)\). Géométriquement, les droites \(x + y = 3\) et \(2x - y = 0\) sont sécantes au point \((1, 2)\).
Pour \((S_2)\), appliquons \(L_2 \leftarrow L_2 - 2 L_1\) : la seconde équation devient \(0 = 5 - 2 = 3 \ne 0\). Le système est incompatible. Géométriquement, \(x + y = 1\) et \(2x + 2y = 5\) (équivalente à \(x + y = 5/2\)) sont parallèles distinctes, et n'ont aucun point commun.
Pour \((S_2)\), appliquons \(L_2 \leftarrow L_2 - 2 L_1\) : la seconde équation devient \(0 = 5 - 2 = 3 \ne 0\). Le système est incompatible. Géométriquement, \(x + y = 1\) et \(2x + 2y = 5\) (équivalente à \(x + y = 5/2\)) sont parallèles distinctes, et n'ont aucun point commun.
Dans l'espace \(\mathbb{R}^3\)
Une équation linéaire \(a x + b y + c z = d\) avec \((a, b, c) \ne (0, 0, 0)\) définit un plan \(P\) dans \(\mathbb{R}^3\).
Pour un système \(2 \times 3\) (deux équations à trois inconnues), l'ensemble des solutions est l'intersection de deux plans \(P_1\) et \(P_2\). Selon la dépendance et la compatibilité, cette intersection est un plan (les deux équations décrivent le même plan), une droite (plans sécants), ou vide (plans parallèles distincts).
Pour un système \(3 \times 3\), une situation supplémentaire possible est un point unique, lorsque les trois plans se coupent en position générale.
Pas de tableau de classification : les cas sont illustrés sur des exemples.
Pour un système \(2 \times 3\) (deux équations à trois inconnues), l'ensemble des solutions est l'intersection de deux plans \(P_1\) et \(P_2\). Selon la dépendance et la compatibilité, cette intersection est un plan (les deux équations décrivent le même plan), une droite (plans sécants), ou vide (plans parallèles distincts).
Pour un système \(3 \times 3\), une situation supplémentaire possible est un point unique, lorsque les trois plans se coupent en position générale.
Pas de tableau de classification : les cas sont illustrés sur des exemples.
Exemple
Résoudre \(\{x + 2y + z = 5 \;;\; 3x + y - 2z = 0\}\) dans \((x, y, z) \in \mathbb{R}^3\) et interpréter géométriquement.
Appliquons deux opérations élémentaires, une micro-étape par ligne : $$ \begin{aligned} & \begin{cases} x + 2y + z = 5, \\
3x + y - 2z = 0 \end{cases} && \text{(initial)} \\
\iff{} & \begin{cases} x + 2y + z = 5, \\
\phantom{3x +} -5y - 5z = -15 \end{cases} && \text{(\(L_2 \leftarrow L_2 - 3 L_1\), transvection)} \\
\iff{} & \begin{cases} x + 2y + z = 5, \\
\phantom{3x + 5}y + z = 3 \end{cases} && \text{(\(L_2 \leftarrow -\tfrac{1}{5} L_2\), dilatation).} \end{aligned} $$ Prenons \(\lambda := z\) comme paramètre libre. La seconde équation donne \(y = 3 - \lambda\), la première donne \(x = 5 - 2y - z = 5 - 2(3 - \lambda) - \lambda = -1 + \lambda\). L'ensemble des solutions est $$ \mathcal{S} = \left\{ \begin{pmatrix} -1 + \lambda \\
3 - \lambda \\
\lambda \end{pmatrix} \;:\; \lambda \in \mathbb{R} \right\} = \begin{pmatrix} -1 \\
3 \\
0 \end{pmatrix} + \mathrm{Vect}\!\left( \begin{pmatrix} 1 \\
-1 \\
1 \end{pmatrix} \right). $$ Géométriquement, c'est la droite de \(\mathbb{R}^3\) passant par le point \(A = (-1, 3, 0)\) et dirigée par \(\vec{d} = (1, -1, 1)\). Les deux plans \(\{x + 2y + z = 5\}\) et \(\{3x + y - 2z = 0\}\) sont sécants ; ils se rencontrent le long de cette droite.
Compétences à pratiquer
- Résoudre un système de 2 équations dans \(\mathbb{R}^2\)
- Résoudre un système de 2 ou 3 équations dans \(\mathbb{R}^3\)
IV
Matrice augmentée et opérations élémentaires sur les lignes d'un système
L'algorithme du pivot de Gauss est mené en manipulant les coefficients du système. Pour l'exécuter proprement, on rassemble tous ces coefficients --- la matrice \(A\) et le second membre \(B\) --- en un seul objet, la matrice augmentée \((A \mid B)\), et l'on travaille dessus comme sur une seule matrice. Les trois opérations élémentaires sur les lignes du chapitre Calcul matriciel agissent alors sur cette matrice augmentée exactement comme avant, et (c'est le fait clé) elles préservent l'ensemble des solutions du système sous-jacent.
Définition — Matrice augmentée d'un système
Pour un système linéaire \(A X = B\) avec \(A \in M_{n,p}(\mathbb{K})\) et \(B \in M_{n,1}(\mathbb{K})\), la matrice augmentée est la matrice par blocs $$ (A \mid B) \in M_{n,\, p+1}(\mathbb{K}) $$ obtenue en juxtaposant la colonne \(B\) à droite de \(A\). La barre verticale « \(\mid\) » est purement visuelle ; elle sépare les \(p\) colonnes « coefficients » de l'unique colonne « second membre ». Les opérations élémentaires sur les lignes du système sont effectuées sur cette unique matrice. Exemple
Le système \(3 \times 3\) \(\{2x + y - 3z = 3 \;;\; 5y + z = 2 \;;\; 9x + 10y + 2z = 1\}\) a pour matrice \(A\) et second membre \(B\) $$ A = \begin{pmatrix} 2 & 1 & -3 \\
0 & 5 & 1 \\
9 & 10 & 2 \end{pmatrix}, \quad B = \begin{pmatrix} 3 \\
2 \\
1 \end{pmatrix}, $$ et la matrice augmentée est $$ (A \mid B) = \left( \begin{array}{ccc|c} 2 & 1 & -3 & 3 \\
0 & 5 & 1 & 2 \\
9 & 10 & 2 & 1 \end{array} \right) \in M_{3, 4}(\mathbb{R}). $$ Les trois premières colonnes sont les colonnes de \(A\), la quatrième est \(B\), la barre verticale les sépare. Définition — Opérations élémentaires sur les lignes d'un système
Les trois opérations élémentaires sur les lignes d'un système \(A X = B\) (de manière équivalente, de sa matrice augmentée \((A \mid B)\)) sont : - Échange \(L_i \leftrightarrow L_j\) (\(i \ne j\)) : échanger les lignes \(i\) et \(j\).
- Dilatation \(L_i \leftarrow \lambda L_i\) (\(\lambda \in \mathbb{K} \setminus \{0\}\)) : multiplier la ligne \(i\) par le scalaire non nul \(\lambda\).
- Transvection \(L_i \leftarrow L_i + \lambda L_j\) (\(i \ne j\), \(\lambda \in \mathbb{K}\)) : ajouter \(\lambda\) fois la ligne \(j\) à la ligne \(i\) (sur place).
Proposition — Les opérations élémentaires préservent l'ensemble des solutions
Soit \(A X = B\) un système linéaire de matrice augmentée \((A \mid B)\), et soit \(A' X = B'\) le système obtenu à partir de \(A X = B\) en appliquant une opération élémentaire sur les lignes à \((A \mid B)\). Alors \(A X = B\) et \(A' X = B'\) ont le même ensemble de solutions. En une phrase : une opération élémentaire sur les lignes change les équations mais pas leur ensemble de solutions.
Chaque opération élémentaire sur les lignes est réversible par une opération de même nature, il suffit donc de vérifier qu'aucune solution n'est créée ni détruite. Traitons les trois cas.
- Échange \(L_i \leftrightarrow L_j\). Échanger deux équations du système donne un système équivalent : les deux systèmes ont les mêmes équations en tant qu'ensemble, donc les mêmes solutions. L'échange inverse restaure l'original.
- Dilatation \(L_i \leftarrow \lambda L_i\), \(\lambda \ne 0\). Remplacer l'équation \(i\) « \(a_{i1} x_1 + \cdots + a_{ip} x_p = b_i\) » par « \(\lambda(a_{i1} x_1 + \cdots + a_{ip} x_p) = \lambda b_i\) » est équivalent (puisque \(\lambda \ne 0\), on peut diviser par \(\lambda\) pour retrouver l'original). Les autres équations sont inchangées. Donc mêmes solutions. La dilatation inverse \(L_i \leftarrow \tfrac{1}{\lambda} L_i\) restaure l'original.
- Transvection \(L_i \leftarrow L_i + \lambda L_j\), \(i \ne j\). Si \(X\) vérifie \(A X = B\), en particulier \(X\) vérifie les équations \(i\) et \(j\), donc aussi toute combinaison linéaire de celles-ci, en particulier l'équation \(i\) modifiée. Les autres équations sont inchangées, donc \(X\) vérifie le nouveau système. Réciproquement, la transvection inverse \(L_i \leftarrow L_i - \lambda L_j\) retrouve l'équation \(i\) originale à partir de la modifiée (en utilisant l'équation \(j\) inchangée), donc toute solution du nouveau système est solution de l'original.
Exemple
Illustrer les trois opérations sur le système \(2 \times 2\) \((S)\) : \(\{x + 2y = 3 \;;\; 3x + 5y = 7\}\), en travaillant sur la matrice augmentée.
La matrice augmentée est $$ (A \mid B) = \left( \begin{array}{cc|c} 1 & 2 & 3 \\
3 & 5 & 7 \end{array} \right). $$
- Échange \(L_1 \leftrightarrow L_2\). $$ \left( \begin{array}{cc|c} 1 & 2 & 3 \\ 3 & 5 & 7 \end{array} \right) \xrightarrow[L_1 \leftrightarrow L_2]{} \left( \begin{array}{cc|c} 3 & 5 & 7 \\ 1 & 2 & 3 \end{array} \right). $$ Le nouveau système \(\{3x + 5y = 7 \;;\; x + 2y = 3\}\) est le même système, équations listées dans l'ordre inverse.
- Dilatation \(L_2 \leftarrow 2 L_2\). $$ \left( \begin{array}{cc|c} 1 & 2 & 3 \\ 3 & 5 & 7 \end{array} \right) \xrightarrow[L_2 \leftarrow 2 L_2]{} \left( \begin{array}{cc|c} 1 & 2 & 3 \\ 6 & 10 & 14 \end{array} \right). $$ La nouvelle équation \(6x + 10y = 14\) est juste deux fois l'ancienne ; mêmes solutions.
- Transvection \(L_2 \leftarrow L_2 - 3 L_1\). $$ \left( \begin{array}{cc|c} 1 & 2 & 3 \\ 3 & 5 & 7 \end{array} \right) \xrightarrow[L_2 \leftarrow L_2 - 3 L_1]{} \left( \begin{array}{cc|c} 1 & 2 & 3 \\ 0 & -1 & -2 \end{array} \right). $$ La transvection a annulé le coefficient de \(x\) dans l'équation \(2\). Le nouveau système \(\{x + 2y = 3 \;;\; -y = -2\}\) est immédiatement résolvable : \(y = 2\), puis \(x = 3 - 2y = -1\). L'unique solution est \((-1, 2)\).
Remarque --- raccourci composé \(L_i \leftarrow \alpha L_i + \beta L_j\)
En pratique, on écrit fréquemment une opération composée \(L_i \leftarrow \alpha L_i + \beta L_j\) avec \(\alpha \ne 0\), \(i \ne j\). C'est un raccourci pour deux opérations élémentaires successives : la dilatation \(L_i \leftarrow \alpha L_i\) (légale puisque \(\alpha \ne 0\)) suivie de la transvection \(L_i \leftarrow L_i + \beta L_j\). La condition \(\alpha \ne 0\) est essentielle : appliquer « \(L_2 \leftarrow 0 \cdot L_2 + L_1\) » remplacerait la ligne 2 par \(L_1\), détruisant l'information de la ligne 2 et changeant l'ensemble des solutions. Lorsqu'un problème met en jeu un paramètre susceptible de s'annuler, traiter le cas où il s'annule avant d'écrire l'opération composée.
Compétences à pratiquer
- Écrire la matrice augmentée
- Appliquer les opérations élémentaires sur les lignes
V
Algorithme du pivot de Gauss
L'algorithme du pivot de Gauss est une procédure systématique qui, appliquée à la matrice augmentée \((A \mid B)\) d'un système linéaire quelconque, renvoie un système équivalent en forme échelonnée --- une forme à partir de laquelle l'ensemble des solutions se lit en quelques étapes de substitution remontante. Cette section reste brève et exempte de technicité ; c'est l'algorithme qui est important, pas la lourdeur de l'analyse de cas. Les exemples plus lourds sont reportés dans le fichier d'exercices.
Définition — Forme échelonnée d'un système
Un système (de manière équivalente, une matrice augmentée \((A \mid B)\)) est en forme échelonnée lorsque les deux conditions suivantes sont remplies : - toute ligne entièrement nulle apparaît en-dessous de toute ligne non entièrement nulle (les lignes nulles s'accumulent en bas) ;
- dans chaque ligne non nulle, le premier coefficient non nul --- appelé pivot de cette ligne --- est strictement à droite du pivot de la ligne du dessus.
Remarque. Ces notions sont maintenues ici à un niveau opérationnel. L'unicité formelle de la forme échelonnée réduite, la théorie du rang par les lignes et la théorie des colonnes de pivots appartiennent aux chapitres Espaces vectoriels de dimension finie et Changements de bases.
Méthode — Algorithme du pivot de Gauss
Pour résoudre un système linéaire \(A X = B\) par l'algorithme du pivot de Gauss : - Étape 1 --- écrire la matrice augmentée. Former \((A \mid B) \in M_{n,\, p+1}(\mathbb{K})\).
- Étape 2 --- choisir un pivot. Dans la colonne de coefficients non nulle la plus à gauche (l'une des \(p\) premières colonnes de \((A \mid B)\), pas la colonne du second membre), choisir un coefficient non nul comme pivot ; permuter des lignes (échange \(L_i \leftrightarrow L_1\)) pour l'amener en haut, si besoin. Préférer un pivot égal à \(1\) pour simplifier les calculs. Si, après l'Étape 3, tous les coefficients d'une ligne sont nuls mais que le second membre est non nul, la ligne s'écrit \(0 = c\) avec \(c \ne 0\) et le système est incompatible.
- Étape 3 --- éliminer sous le pivot. Soit \(r\) la ligne du pivot, \(k\) la colonne du pivot, et \(a_{rk}\) la valeur du pivot. Pour chaque ligne \(i > r\), appliquer la transvection \(L_i \leftarrow L_i - \dfrac{a_{ik}}{a_{rk}} L_r\) pour annuler le coefficient sous le pivot. À l'issue de cette étape, toute la colonne \(k\) sous le pivot est nulle.
- Étape 4 --- réitérer sur le sous-système. Masquer la ligne du pivot et la colonne du pivot ; la matrice augmentée plus petite obtenue est un sous-système auquel on réapplique les étapes 2--3. S'arrêter quand il n'y a plus de colonne non nulle.
- Étape 5 --- substituer en remontant. Le système est maintenant en forme échelonnée. Lire la solution en résolvant l'équation non nulle la plus basse pour son inconnue pivot, puis en substituant vers le haut. De manière équivalente (étape de remontée), annuler les coefficients au-dessus de chaque pivot par des transvections, jusqu'à atteindre la forme échelonnée réduite --- la solution se lit alors directement sur la matrice augmentée.
Exemple
Résoudre le système \(3 \times 3\) \(\{x + y + z = 4 \;;\; x + 2y + 3z = 9 \;;\; x + 3y + 6z = 16\}\) par Gauss, en travaillant sur la matrice augmentée.
Formons \((A \mid B)\) et réduisons étape par étape : $$ \begin{aligned} & \left( \begin{array}{ccc|c} 1 & 1 & 1 & 4 \\
1 & 2 & 3 & 9 \\
1 & 3 & 6 & 16 \end{array} \right) && \text{(initial)} \\
\xrightarrow[L_2 \leftarrow L_2 - L_1]{} \ & \left( \begin{array}{ccc|c} 1 & 1 & 1 & 4 \\
0 & 1 & 2 & 5 \\
1 & 3 & 6 & 16 \end{array} \right) && \text{(transvection)} \\
\xrightarrow[L_3 \leftarrow L_3 - L_1]{} \ & \left( \begin{array}{ccc|c} 1 & 1 & 1 & 4 \\
0 & 1 & 2 & 5 \\
0 & 2 & 5 & 12 \end{array} \right) && \text{(transvection)} \\
\xrightarrow[L_3 \leftarrow L_3 - 2 L_2]{} \ & \left( \begin{array}{ccc|c} 1 & 1 & 1 & 4 \\
0 & 1 & 2 & 5 \\
0 & 0 & 1 & 2 \end{array} \right) && \text{(transvection).} \end{aligned} $$ Le système est en forme échelonnée. Substituons en remontant : la troisième équation donne \(z = 2\) ; la deuxième donne \(y = 5 - 2z = 1\) ; la première donne \(x = 4 - y - z = 1\). L'unique solution est \((x, y, z) = (1, 1, 2)\).
Méthode — Lire l'ensemble des solutions après la réduction de Gauss
Une fois la matrice augmentée mise en forme échelonnée : - identifier les colonnes pivots et les colonnes non pivots ;
- désigner les inconnues associées aux colonnes non pivots comme paramètres libres (un par colonne non pivot parmi \(x_1, \ldots, x_p\)) ;
- exprimer les inconnues associées aux colonnes pivots par substitution remontante, en partant de l'équation non nulle la plus basse ;
- écrire la colonne solution comme une somme d'une colonne \(\lambda\)-indépendante (la solution particulière \(X_p\)) et d'une combinaison linéaire de colonnes \(\lambda\)-dépendantes ; réécrire sous la forme \(X_p + \mathrm{Vect}(Y_1, \ldots, Y_r)\) lorsqu'on souhaite faire apparaître la structure.
Exemple
Résoudre le système \(3 \times 4\) compatible de matrice augmentée $$ \left( \begin{array}{cccc|c} 1 & 2 & 0 & 1 & 3 \\
0 & 1 & 0 & -1 & 1 \\
0 & 0 & 1 & 2 & 4 \end{array} \right) $$ (déjà en forme échelonnée). Identifier les colonnes pivots et exprimer l'ensemble des solutions sous forme paramétrique et sous forme \(\mathrm{Vect}\).
Les pivots sont en position \((1, 1)\), \((2, 2)\), \((3, 3)\). Colonnes pivots : \(1\), \(2\), \(3\) ; colonne non pivot : \(4\). Désignons \(\lambda := x_4\) comme paramètre libre unique. Substituons en remontant à partir de la ligne du bas : $$ \begin{aligned} \text{(éq. 3)} \quad & x_3 + 2 \lambda = 4 \quad \Longrightarrow \quad x_3 = 4 - 2\lambda, \\
\text{(éq. 2)} \quad & x_2 - \lambda = 1 \quad \Longrightarrow \quad x_2 = 1 + \lambda, \\
\text{(éq. 1)} \quad & x_1 + 2 x_2 + \lambda = 3 \quad \Longrightarrow \quad x_1 = 3 - 2(1 + \lambda) - \lambda = 1 - 3\lambda. \end{aligned} $$ L'ensemble des solutions est, sous forme paramétrique, $$ \mathcal{S} = \left\{ \begin{pmatrix} 1 - 3\lambda \\
1 + \lambda \\
4 - 2\lambda \\
\lambda \end{pmatrix} \;:\; \lambda \in \mathbb{R} \right\} = \begin{pmatrix} 1 \\
1 \\
4 \\
0 \end{pmatrix} + \mathrm{Vect}\!\left( \begin{pmatrix} -3 \\
1 \\
-2 \\
1 \end{pmatrix} \right). $$ Il y a exactement un paramètre parce qu'il y a exactement une colonne non pivot (\(4 - 3 = 1\)).
Exemple
Déterminer si le système \(\{x + y + z = 1 \;;\; 2x + 2y + 2z = 1\}\) est compatible.
Appliquons \(L_2 \leftarrow L_2 - 2 L_1\) à la matrice augmentée : $$ \left( \begin{array}{ccc|c} 1 & 1 & 1 & 1 \\
2 & 2 & 2 & 1 \end{array} \right) \xrightarrow[L_2 \leftarrow L_2 - 2 L_1]{} \left( \begin{array}{ccc|c} 1 & 1 & 1 & 1 \\
0 & 0 & 0 & -1 \end{array} \right). $$ La seconde ligne s'écrit \(0 = -1\), ce qui est impossible. Le système est incompatible. Géométriquement, les deux plans \(\{x + y + z = 1\}\) et \(\{2x + 2y + 2z = 1\} = \{x + y + z = 1/2\}\) sont parallèles distincts dans \(\mathbb{R}^3\).
Exemple
Soit \(t \in \mathbb{R}\) un paramètre. Discuter les solutions du système \(3 \times 3\) $$ \begin{cases} x + y + z = 1, \\
x + t y + z = 2, \\
x + y + t z = 3 \end{cases} $$ selon la valeur de \(t\). Garder l'analyse de cas aussi petite que possible.
Appliquons deux transvections à la matrice augmentée (une par ligne de la chaîne de réduction) : $$ \begin{aligned} & \left( \begin{array}{ccc|c} 1 & 1 & 1 & 1 \\
1 & t & 1 & 2 \\
1 & 1 & t & 3 \end{array} \right) && \text{(initial)} \\
\xrightarrow[L_2 \leftarrow L_2 - L_1]{} \ & \left( \begin{array}{ccc|c} 1 & 1 & 1 & 1 \\
0 & t - 1 & 0 & 1 \\
1 & 1 & t & 3 \end{array} \right) && \text{(transvection)} \\
\xrightarrow[L_3 \leftarrow L_3 - L_1]{} \ & \left( \begin{array}{ccc|c} 1 & 1 & 1 & 1 \\
0 & t - 1 & 0 & 1 \\
0 & 0 & t - 1 & 2 \end{array} \right) && \text{(transvection).} \end{aligned} $$
- Cas \(t \ne 1\). La matrice augmentée réduite est déjà en forme échelonnée, avec pour pivots \(1\), \(t - 1\), \(t - 1\), tous non nuls. Substituons en remontant directement à partir du système : la dernière équation donne \((t-1)\, z = 2\), d'où \(z = 2/(t - 1)\) ; la deuxième donne \((t-1)\, y = 1\), d'où \(y = 1/(t - 1)\) ; la première donne \(x = 1 - y - z = 1 - 3/(t - 1) = (t - 4)/(t - 1)\). Le système admet une unique solution.
- Cas \(t = 1\). La matrice augmentée réduite devient $$ \left( \begin{array}{ccc|c} 1 & 1 & 1 & 1 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 2 \end{array} \right). $$ La seconde ligne s'écrit \(0 = 1\), ce qui est impossible. Le système est incompatible.
Compétences à pratiquer
- Résoudre par Gauss avec solution unique
- Résoudre par Gauss avec solutions paramétrées
- Identifier les systèmes incompatibles
- Résoudre un système à paramètre
VI
Systèmes carrés inversibles : systèmes de Cramer
Cette courte section finale est une application du critère d'inversibilité matricielle démontré au chapitre précédent Calcul matriciel. Lorsque la matrice du système est carrée et inversible, l'équation \(A X = B\) admet une unique solution donnée par la formule explicite \(X = A^{-1} B\). De tels systèmes sont dits de Cramer. Les formules de Cramer en termes de déterminants (exprimant \(A^{-1}\) via les déterminants) sont reportées au chapitre Déterminants.
Définition — Système de Cramer
Un système linéaire \(A X = B\) est appelé système de Cramer lorsque la matrice \(A\) est carrée et inversible, c'est-à-dire \(A \in \mathrm{GL}_n(\mathbb{K})\) pour un certain \(n \ge 1\). Par construction, cela impose \(n = p\) (système carré). Proposition — Unique solution d'un système de Cramer
Soient \(A \in \mathrm{GL}_n(\mathbb{K})\) et \(B \in M_{n,1}(\mathbb{K})\). Le système de Cramer \(A X = B\) admet une unique solution, donnée par la formule explicite $$ \textcolor{colorprop}{X = A^{-1} B.} $$
Comme \(A\) est inversible, en multipliant \(A X = B\) à gauche par \(A^{-1}\), on obtient \(A^{-1} (A X) = A^{-1} B\), soit \((A^{-1} A) X = A^{-1} B\), soit \(I_n X = A^{-1} B\), soit \(X = A^{-1} B\). Réciproquement, la colonne \(X := A^{-1} B\) vérifie \(A X = A (A^{-1} B) = (A A^{-1}) B = I_n B = B\), donc est solution. Par conséquent \(A^{-1} B\) est l'unique solution.
Rappel du chapitre Calcul matriciel
Pour \(A \in M_n(\mathbb{K})\), les trois conditions suivantes sont équivalentes :
- \(A\) est inversible (c.-à-d.\ \(A \in \mathrm{GL}_n(\mathbb{K})\)) ;
- pour tout \(B \in M_{n,1}(\mathbb{K})\), le système \(A X = B\) admet une unique solution ;
- le système homogène \(A X = 0_{n,1}\) n'admet que la solution triviale \(X = 0\).
Méthode — Résoudre un système de Cramer --- deux voies
Un système de Cramer \(A X = B\) peut être résolu de deux manières équivalentes : - Par l'inverse --- calculer \(A^{-1}\) (par Gauss-Jordan ou par la formule fermée \(2 \times 2\) de Calcul matriciel), puis \(X = A^{-1} B\). À préférer lorsque plusieurs seconds membres \(B_1, B_2, \ldots\) doivent être traités avec la même \(A\) (calculer \(A^{-1}\) une fois, le réutiliser).
- Par Gauss directement --- appliquer l'algorithme du pivot de Gauss à la matrice augmentée \((A \mid B)\) et lire \(X\) par substitution remontante. À préférer pour un unique \(B\).
Exemple
Résoudre le système de Cramer \(2 \times 2\) \(\{2x + y = 5 \;;\; 3x + 4y = 10\}\), à la fois par l'inverse de \(A\) et par Gauss sur la matrice augmentée.
Notons \(A = \begin{pmatrix} 2 & 1 \\ 3 & 4 \end{pmatrix}\), \(B = \begin{pmatrix} 5 \\ 10 \end{pmatrix}\). Par le critère d'inversibilité \(2 \times 2\) du chapitre Calcul matriciel, comme \(2 \cdot 4 - 1 \cdot 3 = 5 \ne 0\), la matrice \(A\) est inversible.
- Par l'inverse. La formule d'inversion \(2 \times 2\) de Calcul matriciel donne $$ A^{-1} = \frac{1}{5} \begin{pmatrix} 4 & -1 \\ -3 & 2 \end{pmatrix}, $$ d'où $$ X = A^{-1} B = \frac{1}{5} \begin{pmatrix} 4 & -1 \\ -3 & 2 \end{pmatrix} \begin{pmatrix} 5 \\ 10 \end{pmatrix} = \frac{1}{5} \begin{pmatrix} 4 \cdot 5 + (-1) \cdot 10 \\ -3 \cdot 5 + 2 \cdot 10 \end{pmatrix} = \frac{1}{5} \begin{pmatrix} 10 \\ 5 \end{pmatrix} = \begin{pmatrix} 2 \\ 1 \end{pmatrix}. $$
- Par Gauss. Réduisons la matrice augmentée : $$ \left( \begin{array}{cc|c} 2 & 1 & 5 \\ 3 & 4 & 10 \end{array} \right) \xrightarrow[L_2 \leftarrow 2 L_2 - 3 L_1]{} \left( \begin{array}{cc|c} 2 & 1 & 5 \\ 0 & 5 & 5 \end{array} \right). $$ La seconde ligne donne \(5 y = 5\), soit \(y = 1\) ; la première donne \(2 x + 1 = 5\), soit \(x = 2\).
Cela clôt le chapitre. La même boîte à outils côté matriciel de Calcul matriciel nous permet désormais d'écrire, de classer et de résoudre tout système linéaire rencontré dans ce cours. L'interprétation géométrique donnée plus haut sera approfondie au chapitre Sous-espaces affines ; les critères d'existence et d'unicité par le rang, volontairement non introduits ici, seront formalisés aux chapitres Espaces vectoriels de dimension finie et Changements de bases ; les formules de Cramer en termes de déterminants seront démontrées au chapitre Déterminants.
Compétences à pratiquer
- Reconnaître un système de Cramer
- Résoudre un système de Cramer
Aller à la section