\( \definecolor{colordef}{RGB}{249,49,84} \definecolor{colorprop}{RGB}{18,102,241} \)
CommeUnJeu · L1 MPSI

Fonctions de deux variables

⌚ ~147 min ▢ 18 blocs ✓ 54 exercices Prérequis : Dérivabilité, Fonctions réelles
Dans ce chapitre, une fonction de deux variables est une application \(f : \Omega \to \mathbb R\), où \(\Omega\) est un ouvert de \(\mathbb R^2\). Son graphe est une surface de \(\mathbb R^3\) ; la dériver, c'est choisir une direction dans le plan et lire la pente de la surface dans cette direction. Le point de vue est pratique : calculer des dérivées partielles, maîtriser la règle de la chaîne, bâtir une intuition géométrique du gradient.
Le chapitre comporte quatre sections. La première met en place l'espace ambiant : la norme euclidienne sur \(\mathbb R^2\), les boules ouvertes, les ouverts, et la représentation visuelle de \(f\) par une surface et ses lignes de niveau dans le plan \((x, y)\). La deuxième introduit les deux dérivées partielles \(\partial f / \partial x\) et \(\partial f / \partial y\) par « gel » d'une variable, la classe \(\mathcal C^1\) (dérivées partielles qui existent et sont continues), le développement limité à l'ordre \(1\) (DL\(_1\)) pour les fonctions \(\mathcal C^1\), le plan tangent à la surface, et le gradient \(\nabla f\). La troisième est le cœur technique du chapitre : la dérivée directionnelle \(\mathrm D_v f(a)\), la formule centrale \(\mathrm D_v f(a) = \langle \nabla f(a), v\rangle\) qui la lie au gradient, la règle de la chaîne le long d'un arc paramétré \(t \mapsto f(x(t), y(t))\), l'interprétation géométrique du gradient (direction de plus forte croissance ; orthogonal aux lignes de niveau), et la règle de la chaîne pour un changement de variables \((u, v) \mapsto f(x(u, v), y(u, v))\). La quatrième traite des extrema : maxima et minima locaux, points critiques (\(\nabla f = (0, 0)\)), la condition nécessaire « extremum \(\Rightarrow\) point critique », et la méthode standard d'analyse-synthèse, qui étudie un point critique candidat par réécriture algébrique exacte de \(f(a + h, b + k) - f(a, b)\).
Le résultat phare autour duquel le chapitre s'organise est le DL\(_1\) d'une fonction \(\mathcal C^1\) en un point \(a\) : \(f(a + v) = f(a) + \langle \nabla f(a), v\rangle + o(\|v\|)\) lorsque \(v \to (0, 0)\). De ce seul développement découlent, tour à tour, la formule de la dérivée directionnelle, les deux règles de la chaîne, l'orthogonalité de \(\nabla f\) aux lignes de niveau, et la condition nécessaire d'extremum --- cinq énoncés géométriques ou calculatoires qui se déploient depuis un unique DL\(_1\).
Trois réflexes que le lecteur doit emporter :
  1. geler une variable pour calculer une dérivée partielle ;
  2. le gradient \(\nabla f\) encapsule les deux dérivées partielles et le DL\(_1\) en un seul vecteur, si bien que tout énoncé géométrique se réécrit \(\nabla f \cdot v\) ;
  3. pour les extrema, étudier \(f(a + h, b + k) - f(a, b)\) exactement --- toujours par réécriture algébrique exacte, jamais par un développement asymptotique.
I Ouverts de \(\mathbb R^2\) et fonctions continues
I.1 Norme euclidienne et boule ouverte
Le plan \(\mathbb R^2\) hérite de sa géométrie via l'identification \((x, y) \leftrightarrow x + iy \in \mathbb C\) : toute notion déjà construite sur \(\mathbb C\) au chapitre Topologie de \(\mathbb R\) et \(\mathbb C\) --- module, boule, voisinage, ouvert --- se transporte mot pour mot. Nous donnons les définitions directement en coordonnées de \(\mathbb R^2\), puis nous décrivons un ouvert comme une partie qui contient une petite boule autour de chacun de ses points.
Définition — Norme euclidienne sur \(\mathbb R^2\)
La norme euclidienne sur \(\mathbb R^2\) est l'application $$ \| \cdot \| \ : \ \mathbb R^2 \to \mathbb R_+, \qquad \|(x, y)\| \ = \ \sqrt{x^2 + y^2}. $$ Pour \(a = (x_a, y_a)\) et \(b = (x_b, y_b)\) dans \(\mathbb R^2\), le réel \(\|b - a\| = \sqrt{(x_b - x_a)^2 + (y_b - y_a)^2}\) est la distance euclidienne de \(a\) à \(b\).
Définition — Boule ouverte
Soient \(a \in \mathbb R^2\) et \(r > 0\). La boule ouverte de centre \(a\) et de rayon \(r\) est l'ensemble $$ \mathrm B(a, r) \ = \ \bigl\{ \, p \in \mathbb R^2 \ \mid \ \|p - a\| < r \, \bigr\}. $$
Exemple — Disque ouvert unité
La boule ouverte \(\mathrm B\bigl((0, 0), 1\bigr) = \{(x, y) \in \mathbb R^2 \mid x^2 + y^2 < 1\}\) est le disque ouvert unité : l'intérieur du cercle unité, bord exclu.
Compétences à pratiquer
  • Calculer normes et boules ouvertes
I.2 Ouverts de \(\mathbb R^2\)
Le chapitre ne traite que des fonctions définies sur des parties ouvertes de \(\mathbb R^2\) : c'est l'ouverture du domaine qui autorise à regarder dans toutes les directions autour de chaque point, ce qui est précisément ce qu'exige le calcul différentiel. On rappelle la définition pour fixer les notations ; le cadre topologique complet est dans Topologie de \(\mathbb R\) et \(\mathbb C\).
Définition — Ouvert de \(\mathbb R^2\)
Une partie \(\Omega \subset \mathbb R^2\) est appelée ouvert (ou partie ouverte) si, pour tout \(a \in \Omega\), il existe \(r > 0\) tel que \(\mathrm B(a, r) \subset \Omega\).
Exemple — Une boule ouverte est ouverte
Toute boule ouverte \(\mathrm B(a, r) \subset \mathbb R^2\) est elle-même un ouvert de \(\mathbb R^2\) : pour \(p \in \mathrm B(a, r)\), le rayon \(\rho = r - \|p - a\| > 0\) convient, puisque \(\mathrm B(p, \rho) \subset \mathrm B(a, r)\) par l'inégalité triangulaire.
Exemple — Demi-plan ouvert
Le demi-plan \(\{(x, y) \in \mathbb R^2 \mid x > 0\}\) est ouvert : pour \((x_0, y_0)\) avec \(x_0 > 0\), la boule \(\mathrm B\bigl((x_0, y_0), x_0\bigr)\) est incluse dans le demi-plan (puisque tout point \((x, y)\) de cette boule vérifie \(|x - x_0| \le \|(x, y) - (x_0, y_0)\| < x_0\), donc \(x > 0\)).
Exemple — Plan privé d'un point
L'ensemble \(\mathbb R^2 \setminus \{(0, 0)\}\) est ouvert : pour \(a \ne (0, 0)\), la boule \(\mathrm B(a, \|a\|)\) ne contient pas \((0, 0)\).
Compétences à pratiquer
  • Décider si une partie de \(\mathbb R^2\) est ouverte
I.3 Représentation graphique par une surface
Une fonction \(f : \mathbb R \to \mathbb R\) se visualise par son graphe, une courbe du plan. Une fonction \(f : \Omega \to \mathbb R\) avec \(\Omega \subset \mathbb R^2\) se visualise par son graphe, une surface de \(\mathbb R^3\). Pour se représenter cette surface, on l'intersecte avec trois familles de plans : \(x = \lambda\) donne une famille de coupes verticales, \(y = \lambda\) une autre, et \(z = \lambda\) donne les lignes de niveau, qui vivent dans le plan \((x, y)\) et sont l'outil géométrique de base du chapitre.
Définition — Graphe et lignes de niveau
Soient \(\Omega \subset \mathbb R^2\) un ouvert et \(f : \Omega \to \mathbb R\) une fonction. Le graphe de \(f\) est la surface $$ \mathscr S \ = \ \bigl\{ \, (x, y, z) \in \mathbb R^3 \ \mid \ (x, y) \in \Omega \ \text{et} \ z = f(x, y) \, \bigr\} \ \subset \ \mathbb R^3. $$ Pour \(\lambda \in \mathbb R\), la ligne de niveau de \(f\) au niveau \(\lambda\) est la partie de \(\Omega\) $$ \mathscr C_\lambda \ = \ \bigl\{ \, (x, y) \in \Omega \ \mid \ f(x, y) = \lambda \, \bigr\} \ \subset \ \mathbb R^2. $$ Une ligne de niveau ne se trace pas sur la surface elle-même : elle se trace dans le plan \((x, y)\) et regroupe les points qui ont la même hauteur \(z = \lambda\).
Exemple — Paraboloïde \(z \equal x^2 + y^2\)
Prenons \(f(x, y) = x^2 + y^2\) sur \(\Omega = \mathbb R^2\). Le graphe est le paraboloïde de révolution de sommet l'origine et d'axe \(Oz\). Pour \(\lambda < 0\), la ligne de niveau \(\mathscr C_\lambda\) est vide ; pour \(\lambda = 0\), elle se réduit au seul point \((0, 0)\) ; pour \(\lambda > 0\), c'est le cercle de centre \((0, 0)\) et de rayon \(\sqrt \lambda\).
Exemple — Selle \(z \equal x^2 - y^2\) et ses lignes de niveau
Prenons \(f(x, y) = x^2 - y^2\) sur \(\Omega = \mathbb R^2\). Le graphe est une surface en selle. Les lignes de niveau sont : pour \(\lambda > 0\), l'hyperbole équilatère \(x^2 - y^2 = \lambda\) à branches le long de l'axe \(Ox\) ; pour \(\lambda < 0\), l'hyperbole équilatère à branches le long de l'axe \(Oy\) ; pour \(\lambda = 0\), les deux diagonales \(y = x\) et \(y = -x\) (ligne de niveau dégénérée).
Figure des lignes de niveau pour \(z \equal x^2 + y^2\)
Ci-dessous, les lignes de niveau de \(f(x, y) = x^2 + y^2\) aux niveaux \(\lambda = 1, 2, 3, 4\) dans le plan \((x, y)\).
Les quatre lignes de niveau sont des cercles concentriques. Notons que \((1\,;\,0)\), \((0\,;\,1)\) et \((-1/\sqrt 2\,;\, 1/\sqrt 2)\) se trouvent tous sur la ligne de niveau \(\lambda = 1\), bien que les hauteurs correspondantes sur la surface soient toutes égales à \(1\).
Compétences à pratiquer
  • Reconnaître graphes et lignes de niveau
I.4 Limite et continuité
La continuité pour une fonction de deux variables se définit par la même recette \(\varepsilon\)--\(\alpha\) qu'en dimension un, en remplaçant la valeur absolue par la distance euclidienne. L'étude de la continuité d'une fonction n'est pas un objectif de ce chapitre ; on introduit la continuité uniquement comme outil du calcul différentiel et comme cadre de la classe \(\mathcal C^1\).
Définition — Limite en un point
Soient \(E \subset \mathbb R^2\), \(f : E \to \mathbb R\) une fonction, \(a \in \overline{E \setminus \{a\}}\) un point d'accumulation de \(E\), et \(\ell \in \mathbb R\). On dit que \(f\) admet \(\ell\) pour limite en \(a\), et on écrit \(\lim_{p \to a} f(p) = \ell\), si $$ \forall \varepsilon > 0, \ \exists \alpha > 0, \ \forall p \in E, \quad 0 < \|p - a\| < \alpha \ \Rightarrow \ |f(p) - \ell| < \varepsilon. $$ L'inégalité épointée \(0 < \|p - a\|\) permet de considérer une limite en \(a\) même lorsque \(a \notin E\) : le cas typique est \(a = (0, 0)\) et \(E = \mathbb R^2 \setminus \{(0, 0)\}\). L'hypothèse \(a \in \overline{E \setminus \{a\}}\) (point d'accumulation de \(E\)) est nécessaire pour que la limite soit unique : si \(a\) était un point isolé de \(E\), la condition épointée \(0 < \|p - a\| < \alpha\) serait vide et tout \(\ell\) conviendrait.
Définition — Continuité en un point et sur un ouvert
Soient \(E \subset \mathbb R^2\), \(f : E \to \mathbb R\) et \(a \in E\). On dit que \(f\) est continue en \(a\) si \(\lim_{p \to a} f(p) = f(a)\), c'est-à-dire $$ \forall \varepsilon > 0, \ \exists \alpha > 0, \ \forall p \in E, \quad \|p - a\| < \alpha \ \Rightarrow \ |f(p) - f(a)| < \varepsilon. $$ On dit que \(f\) est continue sur \(E\) si \(f\) est continue en tout point de \(E\). L'ensemble des fonctions continues à valeurs réelles sur \(E\) est noté \(\mathcal C(E, \mathbb R)\).
Proposition — Opérations sur les fonctions continues
Soit \(\Omega \subset \mathbb R^2\) un ouvert. Les combinaisons linéaires, produits, quotients (lorsque le dénominateur ne s'annule pas) de fonctions continues \(\Omega \to \mathbb R\) sont continus sur \(\Omega\). La composition avec une fonction continue d'une variable préserve la continuité : si \(f \in \mathcal C(\Omega, \mathbb R)\) est à valeurs dans un intervalle \(I \subset \mathbb R\) et \(\varphi \in \mathcal C(I, \mathbb R)\), alors \(\varphi \circ f \in \mathcal C(\Omega, \mathbb R)\).
Démonstration admise : les recettes se transportent mot pour mot depuis le cas à une variable, en remplaçant \(|x - x_0|\) par \(\|p - a\|\) dans les énoncés \(\varepsilon\)--\(\alpha\) (cf. Topologie de \(\mathbb R\) et \(\mathbb C\)).
Exemple — Les polynômes de deux variables sont continus
Les deux projections de coordonnées \((x, y) \mapsto x\) et \((x, y) \mapsto y\) sont continues sur \(\mathbb R^2\) : pour la première, \(|x - x_0| \le \|(x, y) - (x_0, y_0)\|\), donc \(\alpha = \varepsilon\) convient. Par la Proposition d'opérations, tout polynôme en \(x\) et \(y\), par exemple \((x, y) \mapsto x^3 - 2 x y + 5 y^2 - 1\), est continu sur \(\mathbb R^2\).
Exemple — La norme est continue
La norme euclidienne \((x, y) \mapsto \|(x, y)\| = \sqrt{x^2 + y^2}\) est continue sur \(\mathbb R^2\) : elle est la composée du polynôme continu \((x, y) \mapsto x^2 + y^2\) avec la fonction continue \(t \mapsto \sqrt t\) sur \(\mathbb R_+\).
Méthode — Étudier une limite en \((0\virgule 0)\) par les coordonnées polaires
Pour étudier \(\lim_{(x, y) \to (0, 0)} f(x, y)\), on pose \((x, y) = (r \cos \theta, r \sin \theta)\) avec \(r > 0\). En coordonnées polaires, « \((x, y) \to (0, 0)\) » signifie « \(r \to 0\) » avec \(\theta\) arbitraire. Pour prouver la limite complète, la convergence doit être uniforme en \(\theta\), ou contrôlée indépendamment de \(\theta\). Deux cas :
  • S'il existe \(\ell \in \mathbb R\) tel que \(|f(r \cos \theta, r \sin \theta) - \ell| \to 0\) quand \(r \to 0\) uniformément en \(\theta\) (typiquement parce que \(|f(r \cos \theta, r \sin \theta) - \ell| \le g(r)\) pour une fonction \(g\) telle que \(g(r) \to 0\) indépendamment de \(\theta\)), alors la limite en \((0, 0)\) existe et vaut \(\ell\).
  • S'il existe deux angles fixés \(\theta_1\) et \(\theta_2\) pour lesquels les limites radiales \(\lim_{r \to 0} f(r \cos \theta_1, r \sin \theta_1)\) et \(\lim_{r \to 0} f(r \cos \theta_2, r \sin \theta_2)\) existent et sont différentes, alors \(f\) n'a pas de limite en \((0, 0)\).
Une limite radiale qui dépend de \(\theta\) mais tend vers la même valeur pour tout \(\theta\) n'empêche pas la limite d'exister (par exemple, \(f(r \cos \theta, r \sin \theta) = r \cos \theta\) tend vers \(0\) pour tout \(\theta\)). Le test décisif est : des angles différents donnent-ils des limites radiales différentes ?
Exemple — Une fonction sans limite en \((0\virgule 0)\)
Prenons \(f(x, y) = \dfrac{2 x y}{x^2 + y^2}\) sur \(\Omega = \mathbb R^2 \setminus \{(0, 0)\}\). En coordonnées polaires, \(f(r \cos \theta, r \sin \theta) = \dfrac{2 \cdot r \cos \theta \cdot r \sin \theta}{r^2} = \sin(2 \theta)\), indépendant de \(r\) mais dépendant de \(\theta\). Donc \(f\) n'a pas de limite en \((0, 0)\) : le long de la droite \(y = x\) (soit \(\theta = \pi / 4\)), \(f\) prend la valeur constante \(1\) ; le long de l'axe \(y = 0\) (\(\theta = 0\)), \(f\) prend la valeur constante \(0\).
Cadre de ce chapitre
L'étude de la continuité d'une fonction n'est pas un objectif de ce chapitre. La continuité n'apparaît ici que parce que la classe \(\mathcal C^1\) (sous-section suivante) est définie comme « les dérivées partielles existent et sont continues ». Nous ne développerons pas la continuité au-delà de ce qui est utile au calcul différentiel.
Compétences à pratiquer
  • Étudier des limites en \((0\virgule 0)\) par les coordonnées polaires
II Dérivées partielles et classe \(\mathcal C^1\)
II.1 Dérivées partielles en un point
Une fonction d'une variable possède une dérivée ; une fonction de deux variables en possède deux. L'astuce est de « geler » l'une des variables et de dériver la fonction d'une variable qui en résulte. On dispose donc de deux dérivées partielles, l'une par rapport à \(x\), l'autre par rapport à \(y\), qui dépendent toutes les deux du point d'évaluation. On les note avec des « d ronds » : \(\partial f / \partial x\) et \(\partial f / \partial y\).
Définition — Dérivées partielles en un point
Soient \(\Omega \subset \mathbb R^2\) un ouvert, \(f : \Omega \to \mathbb R\) une fonction et \(a = (x_0, y_0) \in \Omega\). La première dérivée partielle de \(f\) en \(a\), notée \(\dfrac{\partial f}{\partial x}(x_0, y_0)\) (ou \(\partial_1 f(a)\)), est la dérivée en \(0\) de la fonction d'une variable \(t \mapsto f(x_0 + t, y_0)\), lorsqu'elle existe : $$ \frac{\partial f}{\partial x}(x_0, y_0) \ = \ \lim_{t \to 0} \ \frac{f(x_0 + t, y_0) - f(x_0, y_0)}{t}. $$ De même, la deuxième dérivée partielle de \(f\) en \(a\), notée \(\dfrac{\partial f}{\partial y}(x_0, y_0)\) (ou \(\partial_2 f(a)\)), est la dérivée en \(0\) de \(t \mapsto f(x_0, y_0 + t)\) : $$ \frac{\partial f}{\partial y}(x_0, y_0) \ = \ \lim_{t \to 0} \ \frac{f(x_0, y_0 + t) - f(x_0, y_0)}{t}. $$
Méthode — Calculer une dérivée partielle en gelant une variable
Pour calculer \(\dfrac{\partial f}{\partial x}(x_0, y_0)\), traiter \(y\) comme une constante égale à \(y_0\) et dériver l'expression obtenue comme fonction de \(x\) seule, à l'aide des règles d'une variable (somme, produit, quotient, dérivée composée). Puis évaluer en \(x = x_0\). Symétriquement pour \(\dfrac{\partial f}{\partial y}\).
Exemple — Dérivées partielles de \(f(x\virgule y) \equal x^y\)
Calculer les dérivées partielles de \(f(x, y) = x^y\) sur \(\Omega = (0, +\infty) \times \mathbb R\) (domaine où \(x^y\) est à valeurs réelles).

En gelant \(y\), l'application \(x \mapsto x^y = e^{y \ln x}\) est dérivable sur \((0, +\infty)\) de dérivée \(y x^{y-1}\). En gelant \(x\), l'application \(y \mapsto x^y = e^{y \ln x}\) est dérivable sur \(\mathbb R\) de dérivée \(x^y \ln x\). Donc $$ \frac{\partial f}{\partial x}(x, y) \ = \ y \, x^{y - 1}, \qquad \frac{\partial f}{\partial y}(x, y) \ = \ x^y \ln x. $$

Exemple — Dérivées partielles de \(f(x\virgule y) \equal \mathrm{Arctan}(y/x)\)
Prenons \(f(x, y) = \mathrm{Arctan}(y / x)\) sur \(\Omega = \{(x, y) \in \mathbb R^2 \mid x \ne 0\}\). En gelant \(y\), la règle de la chaîne donne \(\partial_x f = \dfrac{1}{1 + (y/x)^2} \cdot \dfrac{-y}{x^2}\) ; en multipliant numérateur et dénominateur par \(x^2\) : $$ \frac{\partial f}{\partial x}(x, y) \ = \ \frac{-y}{x^2 + y^2}, \qquad \frac{\partial f}{\partial y}(x, y) \ = \ \frac{1}{1 + (y/x)^2} \cdot \frac{1}{x} \ = \ \frac{x}{x^2 + y^2}. $$
Exemple — Dérivées partielles de \(f(x\virgule y) \equal e^{xy^2}\)
Prenons \(f(x, y) = e^{x y^2}\) sur \(\Omega = \mathbb R^2\). En gelant \(y\), \(\partial_x f = y^2 e^{x y^2}\) (règle de la chaîne avec fonction interne \(x \mapsto x y^2\), de dérivée \(y^2\)). En gelant \(x\), \(\partial_y f = 2 x y \, e^{x y^2}\).
Exemple — Dérivées partielles de \(f(x\virgule y) \equal x^3 - 3xy^2\)
Prenons \(f(x, y) = x^3 - 3 x y^2\) sur \(\Omega = \mathbb R^2\). Les deux dérivées partielles sont $$ \frac{\partial f}{\partial x}(x, y) \ = \ 3 x^2 - 3 y^2, \qquad \frac{\partial f}{\partial y}(x, y) \ = \ - 6 x y. $$ La symétrie entre \(x\) et \(y\) dans l'expression initiale est brisée par le terme cubique : \(\partial_x f\) contient un \(-3 y^2\) mais \(\partial_y f\) n'a pas de \(x^2\). On réutilisera le gradient \(\nabla f = (3 x^2 - 3 y^2, -6 x y)\) plus loin, à propos de la géométrie des lignes de niveau.
L'existence des dérivées partielles n'implique pas la continuité
L'existence des dérivées partielles n'entraîne pas la continuité. Le contre-exemple standard est la fonction définie sur \(\mathbb R^2\) par \(f(x, y) = x y / (x^2 + y^2)\) pour \((x, y) \ne (0, 0)\) et \(f(0, 0) = 0\). En \((0, 0)\), en gelant \(y = 0\), \(f(x, 0) = 0\), donc \(\partial_x f(0, 0) = 0\) ; de même \(\partial_y f(0, 0) = 0\) ; pourtant \(f\) n'est pas continue en \((0, 0)\) (par la Méthode polaire, \(f = \sin(2\theta) / 2\) pour \(r > 0\), qui ne tend pas vers \(0\)). C'est la raison pour laquelle la classe \(\mathcal C^1\), que nous définissons à présent, demande non seulement l'existence des dérivées partielles, mais aussi qu'elles soient continues.
Compétences à pratiquer
  • Calculer des dérivées partielles
II.2 La classe \(\mathcal C^1\)
La bonne hypothèse de régularité pour tout le chapitre n'est pas « les dérivées partielles existent » (trop faible, comme l'a montré la Remarque ci-dessus), mais « les dérivées partielles existent et sont continues ». C'est la classe \(\mathcal C^1\). C'est le cadre naturel du développement limité à l'ordre \(1\) (DL\(_1\)) introduit dans la sous-section Développement limité à l'ordre \(1\) (DL\(_1\)) et plan tangent ci-après, et de tout énoncé de règle de la chaîne de la section suivante.
Définition — Fonction de classe \(\mathcal C^1\)
Soient \(\Omega \subset \mathbb R^2\) un ouvert et \(f : \Omega \to \mathbb R\) une fonction. On dit que \(f\) est de classe \(\mathcal C^1\) sur \(\Omega\) si les deux dérivées partielles \(\partial f / \partial x\) et \(\partial f / \partial y\) existent en tout point de \(\Omega\) et définissent des fonctions continues \(\Omega \to \mathbb R\). L'ensemble des fonctions \(\mathcal C^1\) de \(\Omega\) dans \(\mathbb R\) est noté \(\mathcal C^1(\Omega, \mathbb R)\).
Exemple — Les polynômes de deux variables sont \(\mathcal C^1\)
Tout polynôme en \(x\) et \(y\) est de classe \(\mathcal C^1\) sur \(\mathbb R^2\) : ses dérivées partielles sont elles-mêmes des polynômes, donc continues sur \(\mathbb R^2\). Par exemple, \(f(x, y) = x^3 - 2 x y + 5 y^2 - 1\) a \(\partial_x f = 3 x^2 - 2 y\) et \(\partial_y f = -2 x + 10 y\), continues sur \(\mathbb R^2\).
Exemple — La norme est \(\mathcal C^1\) sur le plan privé de l'origine\(\virgule\) pas en l'origine
La norme euclidienne \(f(x, y) = \sqrt{x^2 + y^2}\) est \(\mathcal C^1\) sur \(\Omega = \mathbb R^2 \setminus \{(0, 0)\}\) : ses dérivées partielles sont \(\partial_x f = x / \sqrt{x^2 + y^2}\) et \(\partial_y f = y / \sqrt{x^2 + y^2}\), toutes deux continues sur \(\Omega\). En \((0, 0)\) en revanche, en gelant \(y = 0\), \(f(x, 0) = |x|\), qui n'est pas dérivable en \(0\) ; même chose sur l'axe \(Oy\). Donc \(\partial_x f(0, 0)\) et \(\partial_y f(0, 0)\) n'existent pas, et \(f\) n'est pas \(\mathcal C^1\) en l'origine.
Compétences à pratiquer
  • Déterminer le domaine de classe \(\mathcal C^1\) d'une fonction
II.3 Opérations sur les dérivées partielles
Une fois les dérivées partielles calculées en gelant une variable, les règles d'une variable habituelles (linéarité, produit, quotient, règle de la chaîne) se transportent mot pour mot. On les énonce dans un seul Théorème pour les deux indices simultanément. La démonstration est courte --- elle se réduit à appliquer les règles d'une variable à \(t \mapsto f(x_0 + t, y_0)\) --- et n'est pas exigible à ce niveau, nous l'admettons.
Theorem — Opérations sur les dérivées partielles
Soient \(\Omega \subset \mathbb R^2\) un ouvert, \(f, g \in \mathcal C^1(\Omega, \mathbb R)\) et \(\lambda, \mu \in \mathbb R\). Alors \(\lambda f + \mu g\), \(f g\) sont de classe \(\mathcal C^1\) sur \(\Omega\), et \(1 / f\) aussi sur \(\Omega \cap \{f \ne 0\}\). Pour tout \(i \in \{1, 2\}\) : $$ \partial_i (\lambda f + \mu g) \ = \ \lambda \, \partial_i f + \mu \, \partial_i g, \qquad \partial_i (f g) \ = \ g \, \partial_i f + f \, \partial_i g, \qquad \partial_i \! \left( \frac{1}{f} \right) \ = \ - \frac{\partial_i f}{f^2}. $$ De plus, pour tout intervalle ouvert \(I \subset \mathbb R\) avec \(f(\Omega) \subset I\) et toute \(\varphi \in \mathcal C^1(I, \mathbb R)\), la composée \(\varphi \circ f\) est de classe \(\mathcal C^1\) sur \(\Omega\) avec \(\partial_i (\varphi \circ f) = \partial_i f \times (\varphi' \circ f)\).
Démonstration admise : chaque formule découle de la règle d'une variable correspondante appliquée à la fonction obtenue en gelant l'autre variable ; la continuité des dérivées partielles découle alors de la Proposition d'opérations sur les fonctions continues issue de la sous-section Limite et continuité.
Exemple — \(\partial_x e^{xy^2}\) revisité par composition
La règle de composition du Théorème d'opérations appliquée à \(f(x, y) = x y^2\) (un polynôme \(\mathcal C^1\) sur \(\mathbb R^2\)) et \(\varphi(t) = e^t\) (une fonction \(\mathcal C^1\) sur \(\mathbb R\)) donne directement : $$ \partial_x (\varphi \circ f) \ = \ (\partial_x f) \times (\varphi' \circ f) \ = \ y^2 \times e^{x y^2}, $$ retrouvant le résultat de l'Exemple \(f(x, y) = e^{x y^2}\) ci-dessus sans refaire le calcul de la règle de la chaîne depuis le départ.
Méthode — Établir la classe \(\mathcal C^1\) d'une fonction composée
Pour montrer qu'une fonction construite par opérations élémentaires est \(\mathcal C^1\) sur un domaine \(\Omega\) :
  1. identifier les blocs élémentaires (polynômes de deux variables, norme, \(\sqrt{\cdot}\) sur \((0, +\infty)\), \(\exp\), \(\ln\), \(\sin\), \(\cos\), \(\mathrm{Arctan}\), etc.) et les domaines de classe \(\mathcal C^1\) de chacun ;
  2. vérifier que la composition est bien définie sur tout \(\Omega\) (c'est-à-dire que chaque bloc reçoit son argument interne dans son domaine --- en particulier, l'argument interne d'un \(\sqrt{\cdot}\) doit être strictement positif) ;
  3. conclure par le Théorème d'opérations (linéarité, produit, quotient, composition avec une fonction \(\mathcal C^1\) d'une variable).
Compétences à pratiquer
  • Appliquer les règles d'opérations sur les dérivées partielles
II.4 Développement limité à l'ordre \(1\) (DL\(_1\)) et plan tangent
Voici le résultat central du chapitre. Pour une fonction \(\mathcal C^1\) de deux variables, la variation \(f(a + v) - f(a)\) est, à l'ordre \(1\), une fonction linéaire de l'accroissement \(v\) : la combinaison linéaire \(\partial_x f(a) \cdot h + \partial_y f(a) \cdot k\), avec un reste négligeable devant \(\|v\|\). C'est l'analogue du développement limité de Taylor à l'ordre \(1\) d'une variable, le gradient remplaçant la dérivée. La démonstration de ce Théorème est hors programme à ce niveau : on l'énonce, on commente brièvement la signification géométrique, et on l'admet. Toute règle de la chaîne de la section suivante en sera une conséquence directe.
Theorem — DL\(_1\) pour les fonctions \(\mathcal C^1\)
Soient \(\Omega \subset \mathbb R^2\) un ouvert, \(f \in \mathcal C^1(\Omega, \mathbb R)\) et \(a = (x_0, y_0) \in \Omega\). Alors \(f\) admet un développement limité à l'ordre \(1\) en \(a\) : lorsque \((h, k) \to (0, 0)\), $$ f(x_0 + h, y_0 + k) \ = \ f(x_0, y_0) + \frac{\partial f}{\partial x}(x_0, y_0) \, h + \frac{\partial f}{\partial y}(x_0, y_0) \, k + o\bigl(\|(h, k)\|\bigr). $$ De façon équivalente, en forme vectorielle : pour \(v = (h, k)\), $$ f(a + v) \ = \ f(a) + \frac{\partial f}{\partial x}(a) \, h + \frac{\partial f}{\partial y}(a) \, k + o(\|v\|) \quad \text{quand } v \to (0, 0). $$
La démonstration est hors programme\(\virgule\) la différentielle aussi
Nous admettons ce Théorème (démonstration hors programme à ce niveau). Pour une explication complémentaire, l'idée consiste à intégrer les dérivées partielles le long du chemin en deux segments \((x_0, y_0) \to (x_0 + h, y_0) \to (x_0 + h, y_0 + k)\), puis à utiliser la continuité de \(\partial_x f\) et \(\partial_y f\) en \(a\) pour majorer l'écart. La notion plus générale de fonction différentiable (et la différentielle \(df_a\) associée, qui serait une forme linéaire \(\mathbb R^2 \to \mathbb R\)) est elle aussi hors programme à ce niveau ; elle sera vue en seconde année. Nous n'utilisons que les dérivées partielles, le DL\(_1\) ci-dessus, et le gradient.
Définition — Plan tangent
Soient \(\Omega \subset \mathbb R^2\) un ouvert, \(f \in \mathcal C^1(\Omega, \mathbb R)\) et \(a = (x_0, y_0) \in \Omega\). Posons \(z_0 = f(x_0, y_0)\). Le plan tangent au graphe de \(f\) en \(a\) est le plan de \(\mathbb R^3\) d'équation $$ z - z_0 \ = \ \frac{\partial f}{\partial x}(x_0, y_0) \, (x - x_0) + \frac{\partial f}{\partial y}(x_0, y_0) \, (y - y_0). $$ Par le Théorème DL\(_1\), c'est l'unique plan de \(\mathbb R^3\) qui approche la surface \(z = f(x, y)\) à l'ordre \(1\) au voisinage de \((x_0, y_0, z_0)\).
Exemple — Plan tangent de \(f(x\virgule y) \equal \sin(x+2y)\) en \((0\virgule 0)\)
Calculer le plan tangent au graphe de \(f(x, y) = \sin(x + 2 y)\) au point \((0, 0)\).

La fonction \(f\) est \(\mathcal C^1\) sur \(\mathbb R^2\) (composée du polynôme \(\mathcal C^1\) \((x, y) \mapsto x + 2 y\) avec la fonction \(\mathcal C^1\) \(\sin\)). Ses dérivées partielles sont \(\partial_x f(x, y) = \cos(x + 2 y)\) et \(\partial_y f(x, y) = 2 \cos(x + 2 y)\). En \((0, 0)\), \(f(0, 0) = 0\), \(\partial_x f(0, 0) = 1\) et \(\partial_y f(0, 0) = 2\). Le plan tangent a pour équation $$ z - 0 \ = \ 1 \cdot (x - 0) + 2 \cdot (y - 0), \qquad \text{c'est-à-dire} \qquad z \ = \ x + 2 y. $$

Exemple — Plan tangent de \(f(x\virgule y) \equal x^2 + y^2\) en \((1\virgule 1)\)
Calculer le plan tangent au paraboloïde \(z = x^2 + y^2\) au point \((1, 1)\).

La fonction \(f(x, y) = x^2 + y^2\) est un polynôme \(\mathcal C^1\) sur \(\mathbb R^2\). En \((1, 1)\), \(f(1, 1) = 2\), \(\partial_x f(1, 1) = 2\), \(\partial_y f(1, 1) = 2\). Le plan tangent a pour équation $$ z - 2 \ = \ 2 (x - 1) + 2 (y - 1), \qquad \text{c'est-à-dire} \qquad z \ = \ 2 x + 2 y - 2. $$

Compétences à pratiquer
  • Calculer plans tangents et vecteurs normaux
II.5 Gradient
Les deux dérivées partielles sont souvent la réponse à la même question, appliquée aux deux directions de coordonnées. Il est commode de les empaqueter en un seul vecteur --- le gradient --- pour que le DL\(_1\) s'écrive de façon compacte via le produit scalaire euclidien, et pour que tout énoncé géométrique de la section suivante (plus forte croissance, orthogonalité aux lignes de niveau, règle de la chaîne) se ramène à une identité gradient en une ligne.
Définition — Gradient
Soient \(\Omega \subset \mathbb R^2\) un ouvert, \(f \in \mathcal C^1(\Omega, \mathbb R)\) et \(a \in \Omega\). Le gradient de \(f\) en \(a\) est le vecteur de \(\mathbb R^2\) $$ \nabla f(a) \ = \ \bigl( \, \partial_x f(a), \, \partial_y f(a) \, \bigr). $$ Le symbole \(\nabla\) se lit « nabla ». À l'aide de \(\nabla f\), le Théorème DL\(_1\) se réécrit $$ f(a + v) \ = \ f(a) + \langle \nabla f(a), v \rangle + o(\|v\|), \qquad v \to (0, 0), $$ où \(\langle \cdot, \cdot \rangle\) est le produit scalaire canonique sur \(\mathbb R^2\).
Exemple — Gradient de \(f(x\virgule y) \equal x^2 + y^2\)
Pour \(f(x, y) = x^2 + y^2\) sur \(\mathbb R^2\), \(\partial_x f = 2 x\) et \(\partial_y f = 2 y\), donc \(\nabla f(x, y) = (2 x, 2 y) = 2 (x, y)\). En tout point \(a \ne (0, 0)\), le gradient est le vecteur radial \(2 a\). En l'origine, \(\nabla f(0, 0) = (0, 0)\) : l'origine est un point critique (cf. la section Extrema).
Méthode — Calculer le gradient
Calculer les deux dérivées partielles en gelant chaque variable tour à tour (Méthode de la sous-section Dérivées partielles en un point), puis les assembler en le vecteur gradient \(\nabla f(a) = (\partial_x f(a), \partial_y f(a))\). L'ordre des composantes importe : la première est la partielle par rapport à \(x\), la seconde par rapport à \(y\).
Compétences à pratiquer
  • Calculer un gradient
III Composition et règle de la chaîne
III.1 Dérivée directionnelle
Une dérivée partielle mesure la pente de la surface \(z = f(x, y)\) dans l'une des deux directions de coordonnées. Mais pourquoi se limiter à ces deux directions ? Étant donné un vecteur \(v \in \mathbb R^2\), on peut se déplacer depuis \(a\) le long du segment \(a + t v\) et mesurer le taux de variation le long de ce segment. C'est la dérivée directionnelle. Pour un vecteur \(v\) quelconque, \(\mathrm D_v f(a)\) est le taux de variation le long de \(t \mapsto a + t v\) ; la pente géométrique dans la direction de \(v \ne (0, 0)\) est \(\mathrm D_{v / \|v\|} f(a)\) (sinon elle est proportionnelle à \(\|v\|\)). Pour une fonction \(\mathcal C^1\), le DL\(_1\) nous dit que cette pente est une simple combinaison linéaire des deux dérivées partielles --- en fait, le produit scalaire du gradient avec \(v\).
Définition — Dérivée directionnelle
Soient \(\Omega \subset \mathbb R^2\) un ouvert, \(f : \Omega \to \mathbb R\), \(a \in \Omega\) et un vecteur direction \(v \in \mathbb R^2\). On dit que \(f\) admet une dérivée directionnelle en \(a\) dans la direction du vecteur \(v\) si la fonction d'une variable \(t \mapsto f(a + t v)\) (définie au voisinage de \(0\) puisque \(\Omega\) est ouvert) est dérivable en \(0\). Le cas échéant, la dérivée directionnelle de \(f\) en \(a\) dans la direction du vecteur \(v\) est le réel $$ \mathrm D_v f(a) \ = \ \lim_{t \to 0} \ \frac{f(a + t v) - f(a)}{t}. $$ Aucune normalisation n'est imposée ici : \(v\) est un vecteur quelconque de \(\mathbb R^2\), pas nécessairement de norme unité. Pour \(v = e_1 = (1, 0)\), \(\mathrm D_{e_1} f(a) = \partial_x f(a)\) ; pour \(v = e_2 = (0, 1)\), \(\mathrm D_{e_2} f(a) = \partial_y f(a)\). Les dérivées partielles sont les dérivées directionnelles dans les deux directions de coordonnées.
Theorem — Formule de la dérivée directionnelle
Soient \(\Omega \subset \mathbb R^2\) un ouvert, \(f \in \mathcal C^1(\Omega, \mathbb R)\), \(a \in \Omega\) et \(v = (h, k) \in \mathbb R^2\). Alors \(f\) admet une dérivée directionnelle en \(a\) dans la direction \(v\) et $$ \mathrm D_v f(a) \ = \ \langle \nabla f(a), v \rangle \ = \ \frac{\partial f}{\partial x}(a) \, h + \frac{\partial f}{\partial y}(a) \, k. $$

  • Si \(v = (0, 0)\), alors \(f(a + t v) = f(a)\) pour tout \(t\), donc \(\bigl(f(a + tv) - f(a)\bigr) / t = 0\) pour \(t \ne 0\) et \(\mathrm D_v f(a) = 0 = \langle \nabla f(a), v\rangle\).
  • Supposons à présent \(v \ne (0, 0)\). On applique le Théorème DL\(_1\) de la sous-section Développement limité à l'ordre \(1\) (DL\(_1\)) et plan tangent en \(a\) avec accroissement \(t v\) : lorsque \(t \to 0\), \(t v \to (0, 0)\), d'où $$ f(a + t v) \ = \ f(a) + \langle \nabla f(a), t v \rangle + o(\|t v\|) \ = \ f(a) + t \, \langle \nabla f(a), v \rangle + o(|t|), $$ puisque \(\|t v\| = |t| \cdot \|v\|\) et \(\|v\| > 0\) est une constante. En soustrayant \(f(a)\) et en divisant par \(t \ne 0\), \(\bigl(f(a + t v) - f(a)\bigr) / t \to \langle \nabla f(a), v \rangle\) quand \(t \to 0\).

Méthode — Calculer une dérivée directionnelle
Pour \(f \in \mathcal C^1\), calculer le gradient \(\nabla f(a)\) (Méthode de la sous-section Gradient), puis prendre son produit scalaire avec le vecteur direction \(v = (h, k)\) : \(\mathrm D_v f(a) = \partial_x f(a) h + \partial_y f(a) k\). Aucune limite à calculer directement.
Exemple — Dérivée directionnelle de \(x^2 + y^2\) en \((1\virgule 2)\) dans la direction du vecteur \((1\virgule 1)\)
Calculer la dérivée directionnelle \(\mathrm D_{(1, 1)} f\) en \(a = (1, 2)\) pour \(f(x, y) = x^2 + y^2\), dans la direction du vecteur \((1, 1)\) (sans normalisation).

On a \(\nabla f(x, y) = (2 x, 2 y)\) ; en \(a = (1, 2)\), \(\nabla f(a) = (2, 4)\). Donc, pour le vecteur direction \((1, 1)\), $$ \mathrm D_{(1, 1)} f(a) \ = \ \langle (2, 4), (1, 1) \rangle \ = \ 2 \cdot 1 + 4 \cdot 1 \ = \ 6. $$

Compétences à pratiquer
  • Calculer une dérivée directionnelle
III.2 Règle de la chaîne le long d'un arc paramétré
Faisons à présent varier la « direction » elle-même au cours du temps. Choisissons une courbe \(\gamma(t) = (x(t), y(t))\) dans \(\Omega\), où \(x\) et \(y\) sont des fonctions \(\mathcal C^1\) de \(t\). Sa composée avec \(f\) donne une fonction d'une variable \(F(t) = f(x(t), y(t))\), et sa dérivée est donnée par la règle de la chaîne : le produit scalaire du gradient de \(f\) en \(\gamma(t)\) avec le vecteur vitesse \(\gamma'(t) = (x'(t), y'(t))\). C'est le résultat calculatoire le plus important du chapitre ; sa démonstration est exigible à ce niveau.
Theorem — Règle de la chaîne le long d'un arc paramétré
Soient \(\Omega \subset \mathbb R^2\) un ouvert, \(I \subset \mathbb R\) un intervalle ouvert, \(f \in \mathcal C^1(\Omega, \mathbb R)\), et \(x, y \in \mathcal C^1(I, \mathbb R)\) tels que \((x(t), y(t)) \in \Omega\) pour tout \(t \in I\). Alors la fonction \(F : I \to \mathbb R\) définie par \(F(t) = f(x(t), y(t))\) est de classe \(\mathcal C^1\) sur \(I\) et pour tout \(t \in I\): $$ F'(t) \ = \ x'(t) \, \frac{\partial f}{\partial x}\bigl(x(t), y(t)\bigr) + y'(t) \, \frac{\partial f}{\partial y}\bigl(x(t), y(t)\bigr) \ = \ \bigl\langle \nabla f(\gamma(t)), \gamma'(t) \bigr\rangle, $$ où \(\gamma(t) = (x(t), y(t))\) et \(\gamma'(t) = (x'(t), y'(t))\).

Fixons \(t \in I\). Par le DL\(_1\) de \(f\) en \(\gamma(t) \in \Omega\) (Théorème de la sous-section Développement limité à l'ordre \(1\) (DL\(_1\)) et plan tangent), pour tout accroissement \(w \in \mathbb R^2\) assez petit pour que \(\gamma(t) + w\) reste dans \(\Omega\) : $$ f(\gamma(t) + w) \ = \ f(\gamma(t)) + \bigl\langle \nabla f(\gamma(t)), w \bigr\rangle + o(\|w\|). $$ Choisissons \(w = \gamma(t + h) - \gamma(t)\) ; comme \(\gamma \in \mathcal C^1\), \(\gamma(t + h) = \gamma(t) + h \gamma'(t) + o(\lvert h\rvert)\) par le DL\(_1\) d'une variable appliqué composante par composante à \(x\) et \(y\). Donc \(w = h \gamma'(t) + o(\lvert h\rvert)\), et \(\|w\| = O(\lvert h\rvert)\), d'où \(o(\|w\|) = o(\lvert w\rvert) = o(\lvert h\rvert)\). En substituant : $$ F(t + h) - F(t) \ = \ f(\gamma(t + h)) - f(\gamma(t)) \ = \ \bigl\langle \nabla f(\gamma(t)), h \gamma'(t) + o(\lvert h\rvert) \bigr\rangle + o(\lvert h\rvert) \ = \ h \, \bigl\langle \nabla f(\gamma(t)), \gamma'(t) \bigr\rangle + o(\lvert h\rvert). $$ En divisant par \(h \ne 0\) et en faisant \(h \to 0\), \(F'(t) = \langle \nabla f(\gamma(t)), \gamma'(t) \rangle\), qui est la formule annoncée. Comme \(\nabla f \circ \gamma\) et \(\gamma'\) sont continues, \(F'\) est continue, donc \(F \in \mathcal C^1(I, \mathbb R)\).

Méthode — Dériver une composée \(f(x(t)\virgule y(t))\)
Identifier la fonction « externe » \(f\) de deux variables et les deux fonctions « internes » \(x\) et \(y\) d'une variable. Vérifier : \(f \in \mathcal C^1(\Omega, \mathbb R)\) et \(x, y \in \mathcal C^1(I, \mathbb R)\), avec \((x(t), y(t)) \in \Omega\) pour \(t \in I\). Puis appliquer la formule de la règle de la chaîne : \(F'(t) = x'(t) \partial_x f(x(t), y(t)) + y'(t) \partial_y f(x(t), y(t))\). Le point crucial est que les dérivées partielles de \(f\) sont évaluées au point mobile \((x(t), y(t))\), non en un point fixe.
Exemple — \(F(t) \equal f(t^2\virgule \sin t)\)
Soient \(f \in \mathcal C^1(\mathbb R^2, \mathbb R)\) et \(F : \mathbb R \to \mathbb R\) définie par \(F(t) = f(t^2, \sin t)\). Calculer \(F'(t)\).

Posons \(x(t) = t^2\) et \(y(t) = \sin t\) ; toutes deux sont \(\mathcal C^1\) sur \(\mathbb R\), avec \(x'(t) = 2 t\) et \(y'(t) = \cos t\). La composée \((x(t), y(t)) = (t^2, \sin t)\) reste dans \(\Omega = \mathbb R^2\). Par la règle de la chaîne : $$ F'(t) \ = \ 2 t \, \frac{\partial f}{\partial x}(t^2, \sin t) + \cos t \, \frac{\partial f}{\partial y}(t^2, \sin t). $$

Compétences à pratiquer
  • Dériver des composées le long d'un arc
III.3 Gradient et plus forte croissance
Parmi toutes les directions unitaires \(v \in \mathbb R^2\), dans quelle direction la pente de la surface est-elle la plus forte ? La formule de la dérivée directionnelle \(\mathrm D_v f(a) = \langle \nabla f(a), v\rangle\) combinée à Cauchy-Schwarz donne une réponse immédiate : lorsque le gradient est non nul, la direction de plus forte croissance est le gradient lui-même (normé à la longueur unité), et la pente correspondante est la norme du gradient. Lorsque le gradient s'annule, toutes les directions donnent la même pente \(0\) : il n'y a pas de direction de croissance privilégiée.
Theorem — Direction de plus forte croissance
Soient \(\Omega \subset \mathbb R^2\) un ouvert, \(f \in \mathcal C^1(\Omega, \mathbb R)\) et \(a \in \Omega\).
  • Si \(\nabla f(a) \ne (0, 0)\), alors parmi les vecteurs unitaires \(v \in \mathbb R^2\), la dérivée directionnelle \(\mathrm D_v f(a)\) atteint son maximum \(\|\nabla f(a)\|\) exactement pour \(v = \nabla f(a) / \|\nabla f(a)\|\), et son minimum \(-\|\nabla f(a)\|\) exactement pour \(v = -\nabla f(a) / \|\nabla f(a)\|\).
  • Si \(\nabla f(a) = (0, 0)\), alors \(\mathrm D_v f(a) = 0\) pour tout vecteur unitaire \(v\) : toute direction unitaire donne la même valeur \(0\) ; il n'y a donc pas de direction de plus forte croissance unique ou privilégiée.

  • Supposons \(\nabla f(a) \ne (0, 0)\). Par la formule de la dérivée directionnelle et Cauchy-Schwarz (voir Espaces préhilbertiens réels), pour tout vecteur unitaire \(v\) : $$ \mathrm D_v f(a) \ = \ \langle \nabla f(a), v \rangle \ \le \ \|\nabla f(a)\| \cdot \|v\| \ = \ \|\nabla f(a)\|. $$ Le cas d'égalité dans Cauchy-Schwarz a lieu exactement lorsque \(v\) a la même direction que \(\nabla f(a)\) ; combiné à \(\|v\| = 1\), cela donne \(v = \nabla f(a) / \|\nabla f(a)\|\). Symétriquement, le minimum \(-\|\nabla f(a)\|\) est atteint pour \(v = -\nabla f(a) / \|\nabla f(a)\|\).
  • Supposons \(\nabla f(a) = (0, 0)\). Alors pour tout \(v\), \(\mathrm D_v f(a) = \langle (0, 0), v \rangle = 0\).

Méthode — Trouver la direction de plus forte croissance
Calculer le gradient \(\nabla f(a)\). Si \(\nabla f(a) \ne (0, 0)\), le normer : la direction de plus forte croissance est \(v = \nabla f(a) / \|\nabla f(a)\|\), et la pente correspondante (maximale) est \(\|\nabla f(a)\|\). Si \(\nabla f(a) = (0, 0)\), il n'y a pas de direction de plus forte croissance privilégiée --- toute direction donne pente \(0\) ; \(a\) est un point critique (cf. la section Extrema).
Compétences à pratiquer
  • Trouver la direction de plus forte croissance
III.4 Gradient orthogonal aux lignes de niveau
En un point \(a\) sur la ligne de niveau \(\mathscr C_\lambda\), la valeur de \(f\) ne change pas lorsque l'on se déplace le long de la ligne. La règle de la chaîne dit alors : le taux de variation de \(f\) le long de la ligne est \(\langle \nabla f, \gamma'\rangle\), et ce taux est nul. Géométriquement, le gradient est donc orthogonal à la direction de la ligne de niveau. C'est la contrepartie géométrique du résultat de plus forte croissance : en un point régulier où \(\nabla f(a) \ne (0, 0)\), le gradient pointe perpendiculairement hors de la ligne de niveau, vers les valeurs plus grandes.
Theorem — Gradient orthogonal aux lignes de niveau
Soient \(\Omega \subset \mathbb R^2\) un ouvert, \(f \in \mathcal C^1(\Omega, \mathbb R)\) et \(\lambda \in \mathbb R\). Soient \(I \subset \mathbb R\) un intervalle ouvert et \(\gamma : I \to \Omega\) un arc \(\mathcal C^1\) traçant la ligne de niveau \(\mathscr C_\lambda\), c'est-à-dire \(f(\gamma(t)) = \lambda\) pour tout \(t \in I\). Alors pour tout \(t \in I\) : $$ \bigl\langle \nabla f(\gamma(t)), \gamma'(t) \bigr\rangle \ = \ 0. $$

La composée \(F(t) = f(\gamma(t))\) est constante égale à \(\lambda\) sur \(I\). Par la règle de la chaîne le long d'un arc paramétré (Théorème de la sous-section Règle de la chaîne le long d'un arc paramétré), \(F\) est de classe \(\mathcal C^1\) sur \(I\) et \(F'(t) = \langle \nabla f(\gamma(t)), \gamma'(t)\rangle\). Comme \(F\) est constante, \(F'(t) = 0\) pour tout \(t \in I\), donc \(\langle \nabla f(\gamma(t)), \gamma'(t)\rangle = 0\).

Précision de régularité : quand « direction normale » a-t-il un sens ?
Le Théorème ci-dessus est l'identité algébrique \(\langle \nabla f, \gamma'\rangle = 0\), toujours vraie indépendamment des dégénérescences. Pour la relire géométriquement comme « le gradient est normal à la ligne de niveau », il faut d'abord que l'ensemble de niveau soit localement une courbe régulière --- ce qui est garanti lorsque \(\nabla f \ne (0, 0)\) --- puis deux conditions de non-dégénérescence sont nécessaires :
  1. \(\gamma'(t) \ne (0, 0)\), pour que l'arc définisse effectivement une direction tangente en \(\gamma(t)\) ;
  2. \(\nabla f(\gamma(t)) \ne (0, 0)\), pour que le gradient soit un vecteur non nul authentique.
En un point critique (\(\nabla f = (0, 0)\)), ou là où l'arc dégénère (\(\gamma' = (0, 0)\)), l'énoncé géométrique « gradient normal à la ligne de niveau » perd son sens, bien que l'identité continue à tenir trivialement.
Méthode — Utiliser le gradient pour trouver la tangente à une ligne de niveau
En un point régulier \(a\) sur une ligne de niveau \(\mathscr C_\lambda\) (c'est-à-dire \(\nabla f(a) \ne (0, 0)\)), la direction tangente à \(\mathscr C_\lambda\) est l'orthogonal de \(\nabla f(a)\) : si \(\nabla f(a) = (A, B)\), la droite tangente à \(\mathscr C_\lambda\) en \(a = (x_0, y_0)\) a pour équation \(A (x - x_0) + B (y - y_0) = 0\). De façon équivalente, un vecteur tangent est \((-B, A)\). Le gradient pointe à travers la ligne de niveau, vers les valeurs supérieures de \(f\).
Exemple — Gradient de \(x^2 + y^2\) en \((1\virgule 1)\)\(\virgule\) normal au cercle
Vérifier que pour \(f(x, y) = x^2 + y^2\) sur \(\mathbb R^2\) et le point \(a = (1, 1)\), le gradient \(\nabla f(a)\) est normal à la ligne de niveau de \(f\) passant par \(a\).

On a \(\nabla f(x, y) = (2 x, 2 y)\). En \(a = (1, 1)\) : \(f(a) = 2\), donc \(a\) se trouve sur la ligne de niveau \(\mathscr C_2 = \{(x, y) \mid x^2 + y^2 = 2\}\), qui est le cercle de centre \((0, 0)\) et de rayon \(\sqrt 2\). Une paramétrisation de ce cercle au voisinage de \(a\) est \(\gamma(t) = (\sqrt 2 \cos t, \sqrt 2 \sin t)\) ; le point \(a = (1, 1)\) correspond à \(t = \pi / 4\). La vitesse \(\gamma'(\pi / 4) = (-\sqrt 2 \sin(\pi / 4), \sqrt 2 \cos(\pi/4)) = (-1, 1)\). Le gradient est \(\nabla f(a) = (2, 2)\). Leur produit scalaire vaut \(\langle (2, 2), (-1, 1)\rangle = -2 + 2 = 0\), confirmant l'orthogonalité. Géométriquement, \(\nabla f(a) = (2, 2)\) est le vecteur radial allant de l'origine à \(a\), multiplié par \(2\) : il est bien normal au cercle en \(a\), et pointe vers l'extérieur (vers des cercles plus grands, c'est-à-dire des valeurs plus grandes de \(f\)).
Ci-dessous, les quatre lignes de niveau \(\lambda = 1\,;\, 2\,;\, 3\,;\, 4\) avec le gradient en \((1\,;\, 1)\) (flèche radiale, pointant vers l'extérieur) et la direction tangente en \((1\,;\, 1)\) (en pointillés).

Compétences à pratiquer
  • Calculer la tangente à une ligne de niveau
III.5 Règle de la chaîne pour un changement de variables
La règle de la chaîne de la sous-section Règle de la chaîne le long d'un arc paramétré traitait la composition de \(f\) avec un arc d'une variable. Le même principe s'étend à la composition de \(f\) avec un changement de variables \((u, v) \mapsto (x(u, v), y(u, v))\) : le résultat \(F(u, v) = f(x(u, v), y(u, v))\) est alors une nouvelle fonction de deux variables, et ses dérivées partielles sont des combinaisons linéaires des dérivées partielles de \(f\) (évaluées au point image), pondérées par les dérivées partielles de \(x\) et \(y\) (évaluées en \((u, v)\)). C'est l'outil indispensable pour résoudre les équations aux dérivées partielles par une substitution astucieuse (typiquement, les coordonnées polaires).
Theorem — Règle de la chaîne pour un changement de variables
Soient \(U\) et \(\Omega\) deux ouverts de \(\mathbb R^2\), \(x, y \in \mathcal C^1(U, \mathbb R)\) tels que \((x(u, v), y(u, v)) \in \Omega\) pour tout \((u, v) \in U\), et \(f \in \mathcal C^1(\Omega, \mathbb R)\). Alors la fonction \(F : U \to \mathbb R\) définie par \(F(u, v) = f(x(u, v), y(u, v))\) est de classe \(\mathcal C^1\) sur \(U\) et pour tout \((u, v) \in U\) : $$ \frac{\partial F}{\partial u}(u, v) \ = \ \frac{\partial x}{\partial u}(u, v) \, \frac{\partial f}{\partial x}\bigl(x(u, v), y(u, v)\bigr) + \frac{\partial y}{\partial u}(u, v) \, \frac{\partial f}{\partial y}\bigl(x(u, v), y(u, v)\bigr), $$ $$ \frac{\partial F}{\partial v}(u, v) \ = \ \frac{\partial x}{\partial v}(u, v) \, \frac{\partial f}{\partial x}\bigl(x(u, v), y(u, v)\bigr) + \frac{\partial y}{\partial v}(u, v) \, \frac{\partial f}{\partial y}\bigl(x(u, v), y(u, v)\bigr). $$ Les points d'évaluation sont cruciaux : les dérivées partielles de \(f\) sont prises au point image \((x(u, v), y(u, v))\), tandis que celles de \(x\) et \(y\) sont prises en \((u, v)\).

Fixons \((u_0, v_0) \in U\). Comme \(U\) est ouvert, il existe un intervalle ouvert \(J \subset \mathbb R\) contenant \(u_0\) tel que \((u, v_0) \in U\) pour tout \(u \in J\). Considérons la fonction partielle \(\Phi_{v_0} : u \mapsto F(u, v_0) = f(x(u, v_0), y(u, v_0))\) sur \(J\). C'est la composée de \(f\) avec l'arc \(\mathcal C^1\) \(\gamma_{v_0} : J \to \Omega\) défini par \(\gamma_{v_0}(u) = (x(u, v_0), y(u, v_0))\), de vitesse \(\gamma_{v_0}'(u) = (\partial_u x(u, v_0), \partial_u y(u, v_0))\). En appliquant la règle de la chaîne le long d'un arc paramétré (Théorème de la sous-section Règle de la chaîne le long d'un arc paramétré) en \(u = u_0\) : $$ \frac{\partial F}{\partial u}(u_0, v_0) \ = \ \frac{\partial x}{\partial u}(u_0, v_0) \, \frac{\partial f}{\partial x}(\gamma_{v_0}(u_0)) + \frac{\partial y}{\partial u}(u_0, v_0) \, \frac{\partial f}{\partial y}(\gamma_{v_0}(u_0)), $$ qui est la formule annoncée évaluée en \((u_0, v_0)\). Symétriquement, en fixant \(u = u_0\) et en considérant l'arc \(v \mapsto (x(u_0, v), y(u_0, v))\) sur un intervalle ouvert contenant \(v_0\), on obtient la formule pour \(\partial F / \partial v\) en \((u_0, v_0)\). Lorsque \((u_0, v_0)\) parcourt \(U\), les formules sont valables sur tout \(U\). Comme \((x, y) : U \to \Omega\) est continue et que \(\partial_x f, \partial_y f\) sont continues sur \(\Omega\), les composées \(\partial_x f \circ (x, y)\) et \(\partial_y f \circ (x, y)\) sont continues. La continuité de \(\partial F / \partial u\) et \(\partial F / \partial v\) sur \(U\) résulte alors de la Proposition d'opérations appliquée aux composantes continues (\(\partial_u x\), \(\partial_u y\), \(\partial_x f \circ (x, y)\), \(\partial_y f \circ (x, y)\), etc.). Donc \(F \in \mathcal C^1(U, \mathbb R)\).

Méthode — Changement de variables dans une EDP
Pour résoudre une EDP sur \(\Omega\) d'inconnue \(f \in \mathcal C^1(\Omega, \mathbb R)\) par un changement de variables \((u, v) \mapsto (x, y) = (x(u, v), y(u, v))\) :
  1. introduire \(F(u, v) = f(x(u, v), y(u, v))\) ;
  2. calculer \(\partial_u F\), \(\partial_v F\) par la règle de la chaîne avec changement de variables ;
  3. réécrire l'EDP sur \(\Omega\) comme une EDP en \(F\) dans les nouvelles variables \((u, v)\) ;
  4. résoudre en \((u, v)\) ;
  5. revenir à \(f\) en exprimant les nouvelles variables en fonction des anciennes, au moins sur le domaine considéré (un inverse global n'est pas toujours disponible --- les coordonnées polaires, par exemple, ne sont que localement injectives).
Le changement de variables est bien choisi lorsque l'EDP transformée est plus simple (par exemple devient une EDO en \(u\) avec \(v\) comme paramètre, ou annule un terme).
Exemple — Substitution polaire
Soit \(\Omega_{\mathrm{pol}} = (0, +\infty) \times \mathbb R\), et considérons le changement de variables \((r, \theta) \mapsto (x, y) = (r \cos \theta, r \sin \theta)\) de \(\Omega_{\mathrm{pol}}\) vers \(\Omega_{\mathrm{cart}} = \mathbb R^2 \setminus \{(0, 0)\}\). Pour \(f \in \mathcal C^1(\Omega_{\mathrm{cart}}, \mathbb R)\), posons \(F(r, \theta) = f(r \cos \theta, r \sin \theta)\). Vérifier que $$ r \, \frac{\partial F}{\partial r}(r, \theta) \ = \ x \, \frac{\partial f}{\partial x}(x, y) + y \, \frac{\partial f}{\partial y}(x, y), \qquad \frac{\partial F}{\partial \theta}(r, \theta) \ = \ - y \, \frac{\partial f}{\partial x}(x, y) + x \, \frac{\partial f}{\partial y}(x, y), $$ où \((x, y) = (r \cos \theta, r \sin \theta)\).

Le changement de variables envoie \((r, \theta) \in \Omega_{\mathrm{pol}}\) sur \((x, y) = (r \cos \theta, r \sin \theta)\), qui est dans \(\Omega_{\mathrm{cart}}\) puisque \(r > 0\). Les fonctions \(x\) et \(y\) sont \(\mathcal C^1\) sur \(\Omega_{\mathrm{pol}}\) avec \(\partial_r x = \cos \theta\), \(\partial_\theta x = -r \sin \theta\), \(\partial_r y = \sin \theta\), \(\partial_\theta y = r \cos \theta\). Par la règle de la chaîne avec changement de variables : $$ \begin{aligned} \frac{\partial F}{\partial r}(r, \theta) &= \cos \theta \cdot \frac{\partial f}{\partial x}(x, y) + \sin \theta \cdot \frac{\partial f}{\partial y}(x, y) \\ \frac{\partial F}{\partial \theta}(r, \theta) &= - r \sin \theta \cdot \frac{\partial f}{\partial x}(x, y) + r \cos \theta \cdot \frac{\partial f}{\partial y}(x, y). \end{aligned} $$ En multipliant la première égalité par \(r\) et en utilisant \(r \cos \theta = x\), \(r \sin \theta = y\) : \(r \partial_r F = x \partial_x f + y \partial_y f\). La seconde égalité se lit directement \(\partial_\theta F = -y \partial_x f + x \partial_y f\). Les deux formules sont valables pour \((x, y) = (r \cos \theta, r \sin \theta)\).

Compétences à pratiquer
  • Dériver des composées avec fonctions internes à deux variables
  • Résoudre une EDP par passage en coordonnées polaires
IV Extrema
IV.1 Extrema locaux : définitions
Les notions de maximum local et de minimum local se transportent d'une variable à deux sans changement conceptuel : en un maximum local, la valeur de \(f\) en \(a\) est supérieure (ou égale) à toute valeur proche ; symétriquement pour un minimum. Le seul ajustement est que « proche » signifie maintenant « dans une certaine boule ouverte autour de \(a\) », et non plus « dans un certain intervalle ».
Définition — Extremum local
Soient \(E \subset \mathbb R^2\), \(f : E \to \mathbb R\) et \(a \in E\). On dit que \(f\) admet un maximum local en \(a\) s'il existe \(r > 0\) tel que \(f(p) \le f(a)\) pour tout \(p \in E \cap \mathrm B(a, r)\). On dit que \(f\) admet un minimum local en \(a\) si \(f(p) \ge f(a)\) sur une telle boule. Un extremum local en \(a\) est soit un maximum local, soit un minimum local.
Exemple — \(x^2 + y^2\) admet un minimum global en l'origine
La fonction \(f(x, y) = x^2 + y^2\) sur \(\mathbb R^2\) admet un minimum global en \((0, 0)\) : pour tout \((x, y) \in \mathbb R^2\), \(f(x, y) \ge 0 = f(0, 0)\). En particulier, \((0, 0)\) est aussi un minimum local. La fonction n'a aucun maximum local : à partir de n'importe quel point \(a \in \mathbb R^2\), se déplacer légèrement plus loin de l'origine augmente strictement \(x^2 + y^2\), donc aucune valeur \(f(a)\) ne domine son voisinage.
Compétences à pratiquer
  • Vérifier un extremum local par la définition
IV.2 Condition nécessaire : points critiques
Le théorème de Fermat à une dimension dit : en un extremum local intérieur, la dérivée s'annule. En deux dimensions, la même idée s'applique dans toutes les directions. Par la formule de la dérivée directionnelle, ceci force le gradient à s'annuler. Un point où le gradient s'annule s'appelle un point critique. La condition « extremum \(\Rightarrow\) point critique » est nécessaire mais non suffisante (la Remarque suivante en donne un contre-exemple).
Définition — Point critique
Soient \(\Omega \subset \mathbb R^2\) un ouvert et \(f \in \mathcal C^1(\Omega, \mathbb R)\). Un point \(a \in \Omega\) est dit point critique de \(f\) si \(\nabla f(a) = (0, 0)\), c'est-à-dire \(\partial_x f(a) = \partial_y f(a) = 0\).
Theorem — Extremum implique point critique
Soient \(\Omega \subset \mathbb R^2\) un ouvert, \(f \in \mathcal C^1(\Omega, \mathbb R)\) et \(a \in \Omega\). Si \(f\) admet un extremum local en \(a\), alors \(a\) est un point critique de \(f\) : \(\nabla f(a) = (0, 0)\).

Fixons un \(v \in \mathbb R^2 \setminus \{(0, 0)\}\) arbitraire. Comme \(\Omega\) est ouvert, la fonction d'une variable \(g_v(t) = f(a + t v)\) est définie au voisinage de \(0\). La fonction \(g_v\) est de classe \(\mathcal C^1\) en \(0\) (composée de l'arc affine \(t \mapsto a + tv\) avec \(f \in \mathcal C^1\)), avec \(g_v'(0) = \mathrm D_v f(a) = \langle \nabla f(a), v\rangle\) par la formule de la dérivée directionnelle (sous-section Dérivée directionnelle). Si \(f\) admet un extremum local en \(a\), alors \(g_v\) admet un extremum local en \(0\), donc par le théorème de Fermat à une variable \(g_v'(0) = 0\). Donc \(\langle \nabla f(a), v\rangle = 0\) pour tout \(v \ne (0, 0)\) ; en prenant \(v = e_1\), \(\partial_x f(a) = 0\), et \(v = e_2\) donne \(\partial_y f(a) = 0\). Donc \(\nabla f(a) = (0, 0)\).

Méthode — Trouver les candidats à un extremum
Le Théorème réduit la recherche des extrema locaux à la résolution du système \(\partial_x f(a) = 0\) et \(\partial_y f(a) = 0\) simultanément. Les solutions sont les candidats aux extrema --- les points critiques. Pour déterminer lesquels parmi les candidats sont effectivement des extrema (et de quel type), on effectue ensuite l'étude par analyse-synthèse de la sous-section Étude des points critiques par analyse-synthèse.
La réciproque est fausse
Un point critique n'est pas toujours un extremum. Contre-exemple : \(f(x, y) = x^3\) sur \(\mathbb R^2\). Les dérivées partielles sont \(\partial_x f = 3 x^2\) et \(\partial_y f = 0\), toutes deux nulles en \((0, 0)\). Donc \((0, 0)\) est un point critique. Pourtant \(f\) prend des valeurs positives à droite de l'axe \(Oy\) (\(x > 0 \Rightarrow f > 0\)) et négatives à gauche (\(x < 0 \Rightarrow f < 0\)), donc \(f(0, 0) = 0\) n'est ni un maximum local, ni un minimum local. Le phénomène existe déjà à une variable (\(x \mapsto x^3\) en \(0\)).
Compétences à pratiquer
  • Déterminer les points critiques
IV.3 Étude des points critiques par analyse-synthèse
La méthode standard pour étudier un point critique est l'analyse-synthèse : (analyse) trouver les points critiques en résolvant \(\nabla f = 0\) ; (synthèse) pour chaque point critique \((a, b)\), étudier l'expression exacte \(f(a + h, b + k) - f(a, b)\) par réécriture algébrique --- complétion du carré, factorisation, ou étude du signe le long de chemins bien choisis \(k = c h\). Le test de la dérivée seconde fondé sur la hessienne est hors programme.
Méthode — Trouver et classer les extrema par analyse-synthèse
Deux étapes :
  • Analyse. Résoudre simultanément le système \(\partial_x f = 0\) et \(\partial_y f = 0\) pour trouver les points critiques \((a, b)\) de \(f\). Par le Théorème de la sous-section Condition nécessaire : points critiques, tout extremum local figure parmi eux.
  • Synthèse. Pour chaque point critique \((a, b)\), écrire l'expression exacte \(\Delta(h, k) = f(a + h, b + k) - f(a, b)\) (sans reste en \(o\) ; si \(f\) est polynomial, c'est exact). Étudier le signe de \(\Delta(h, k)\) au voisinage de \((0, 0)\) par réécriture algébrique :
    • si \(\Delta \ge 0\) au voisinage de \((0, 0)\), alors \((a, b)\) est un minimum local ; si \(\Delta \le 0\) au voisinage de \((0, 0)\), c'est un maximum local. Si l'égalité \(\Delta = 0\) n'a lieu qu'en \((0, 0)\), l'extremum est strict ;
    • si \(\Delta(h, k)\) change de signe sur tout voisinage de \((0, 0)\) (par exemple testé le long de deux directions \(k = c_1 h\) et \(k = c_2 h\) donnant des signes opposés), \((a, b)\) n'est pas un extremum.
La méthode marche parce que l'expression exacte \(\Delta(h, k)\) pour un polynôme \(f\) est elle-même polynomiale, et l'étude du signe est faite à la main --- jamais via un théorème général de Taylor à l'ordre \(2\). Pour \(f\) non polynomial, un développement exact (ou une factorisation) suffisant est en général disponible pour les exemples du chapitre.
Exemple — Minimum local d'une quadratique en deux variables
Trouver et classer les extrema locaux de \(f(x, y) = x^2 - 3 x + x y + y^2\) sur \(\mathbb R^2\).

Prenons \(f(x, y) = x^2 - 3 x + x y + y^2\) sur \(\mathbb R^2\) ; \(f\) est polynomial, donc \(\mathcal C^1\) sur \(\mathbb R^2\).
  • Analyse. \(\partial_x f = 2 x - 3 + y\) et \(\partial_y f = x + 2 y\). Le système \(\nabla f = (0, 0)\) s'écrit $$ 2 x + y = 3, \qquad x + 2 y = 0. $$ En calculant \(2 \times (2 x + y) - (x + 2 y)\), on obtient \(3 x = 6\), donc \(x = 2\). La seconde équation donne alors \(y = -x / 2 = -1\). Le point critique unique est \((2, -1)\), avec \(f(2, -1) = 4 - 6 - 2 + 1 = -3\).
  • Synthèse. Calculons la différence exacte \(\Delta(h, k) = f(2 + h, -1 + k) - f(2, -1)\) pour \((h, k) \in \mathbb R^2\). Développons d'abord chacun des quatre morceaux de \(f(2 + h, -1 + k)\) : $$ \begin{aligned} (2 + h)^2 &= 4 + 4 h + h^2 && \text{(développement d'un carré)}, \\ -3 (2 + h) &= -6 - 3 h && \text{(distribution de \(-3\))}, \\ (2 + h)(-1 + k) &= -2 + 2 k - h + h k && \text{(développement du produit)}, \\ (-1 + k)^2 &= 1 - 2 k + k^2 && \text{(développement d'un carré)}. \end{aligned} $$ En additionnant les quatre lignes et en groupant par degré : $$ \begin{aligned} \text{constantes :} &\quad 4 - 6 - 2 + 1 = -3 = f(2, -1) && \text{(les constantes donnent \(f(2, -1)\))}, \\ \text{termes en \(h\) :} &\quad 4 h - 3 h - h = 0 && \text{(les termes linéaires en \(h\) s'annulent : point critique)}, \\ \text{termes en \(k\) :} &\quad 2 k - 2 k = 0 && \text{(les termes linéaires en \(k\) s'annulent : point critique)}, \\ \text{degré \(2\) :} &\quad h^2 + h k + k^2 && \text{(partie quadratique collectée)}. \end{aligned} $$ En soustrayant \(f(2, -1) = -3\), on obtient \(\Delta(h, k) = h^2 + h k + k^2\). La forme quadratique se met sous forme canonique : $$ h^2 + h k + k^2 \ = \ \left( h + \frac{k}{2} \right)^2 + \frac{3 k^2}{4} \ \ge \ 0, $$ avec égalité ssi \(h = 0\) et \(k = 0\). Donc \(\Delta(h, k) \ge 0\) avec inégalité stricte hors de \((0, 0)\) : \((2, -1)\) est un minimum local (strict) de \(f\). Comme \(h^2 + h k + k^2 \ge 0\) pour tout \((h, k) \in \mathbb R^2\), l'inégalité \(\Delta(h, k) \ge 0\) vaut sur le plan entier, donc le minimum est en fait global.

Exemple — Point critique sans extremum
Montrer que \(g(x, y) = x^2 - x - x y - y^2 / 2 + 2 y\) sur \(\mathbb R^2\) admet un unique point critique, mais que ce point n'est pas un extremum local.

Prenons \(g(x, y) = x^2 - x - x y - y^2 / 2 + 2 y\) sur \(\mathbb R^2\) ; \(g\) est polynomial, donc \(\mathcal C^1\) sur \(\mathbb R^2\).
  • Analyse. \(\partial_x g = 2 x - 1 - y\) et \(\partial_y g = - x - y + 2\). Le système \(\nabla g = (0, 0)\) s'écrit $$ 2 x - y = 1, \qquad x + y = 2. $$ En additionnant les deux équations, on obtient \(3 x = 3\), donc \(x = 1\) ; en reportant, \(y = 1\). Le point critique unique est \((1, 1)\), avec \(g(1, 1) = 1 - 1 - 1 - 1/2 + 2 = 1/2\).
  • Synthèse. Calculons \(\Delta(h, k) = g(1 + h, 1 + k) - g(1, 1)\) exactement : après développement (les termes linéaires en \(h\) et \(k\) se compensent puisque \((1, 1)\) est un point critique), $$ \Delta(h, k) \ = \ h^2 - h k - \frac{k^2}{2}. $$ Deux tests de signe sur cette forme quadratique :
    • Le long du chemin \(k = 0\) : \(\Delta(h, 0) = h^2 > 0\) pour tout \(h \ne 0\), donc \(g(1 + h, 1) > g(1, 1)\).
    • Le long du chemin \(h = 0\) : \(\Delta(0, k) = - k^2 / 2 < 0\) pour tout \(k \ne 0\), donc \(g(1, 1 + k) < g(1, 1)\).
    Sur toute boule ouverte autour de \((1, 1)\), \(\Delta\) prend des valeurs à la fois strictement positives et strictement négatives. Donc \((1, 1)\) n'est pas un extremum local.

Compétences à pratiquer
  • Déterminer les extrema locaux par analyse-synthèse
Aller à la section