CommeUnJeu · L2 MP

Espérance, variance et fonctions génératrices

⌚ ~123 min ▢ 15 blocs ✓ 30 exercices ➣ Prérequis : Variables aléatoires discrètes, Familles sommables, Espérance, variance, covariance, Séries entières

Ex 1

La dérivabilité s'étend aux fonctions $f : I \to \mathbb{C}$ par dérivabilité composante par composante. La boîte à outils algébrique passe quasi à l'identique. Obstruction cruciale : Rolle et TAF égalité sont faux sur $\mathbb{C}$. En revanche l'IAF pour fonctions $C^1$ subsiste --- admise ici, preuve reportée à Intégration sur un segment.

I Espérance d'une variable aléatoire discrète

Définition — Dérivabilité complexe

$f : I \to \mathbb{C}$, $a \in I$. On dit que $f$ est dérivable en $a$ si le taux d'accroissement $$ \tau_a(h) = \frac{f(a + h) - f(a)}{h} $$ admet une limite finie dans $\mathbb{C}$ quand $h \to 0$ avec $a + h \in I$. On note la limite $\textcolor{colordef}{f'(a)}$.

I.1 Définition ; existence

Proposition — Caractérisation par composantes

$f : I \to \mathbb{C}$ est dérivable en $a$ si et seulement si $\mathrm{Re}\,f$ et $\mathrm{Im}\,f$ sont dérivables en $a$. Dans ce cas, $$ \textcolor{colorprop}{f'(a) = (\mathrm{Re}\,f)'(a) + i \, (\mathrm{Im}\,f)'(a)}. $$

Preuve

Pour $h \ne 0$ avec $a + h \in I$, $$ \tau_a^f(h) = \tau_a^{\mathrm{Re}\,f}(h) + i \, \tau_a^{\mathrm{Im}\,f}(h) $$ par $\mathbb{R}$-linéarité de $\mathrm{Re}$ et $\mathrm{Im}$. Par la caractérisation par composantes des limites de fonctions à valeurs complexes (Limites et continuité, section fonctions à valeurs complexes), $\tau_a^f(h)$ admet une limite finie dans $\mathbb{C}$ quand $h \to 0$ ssi $\tau_a^{\mathrm{Re}\,f}$ et $\tau_a^{\mathrm{Im}\,f}$ admettent des limites finies dans $\mathbb{R}$, avec décomposition $(\mathrm{Re}\,f)'(a) + i (\mathrm{Im}\,f)'(a)$.

Exemple

Calculer la dérivée de $f : \mathbb{R} \to \mathbb{C}$, $f(t) = \exp(i t)$.

Correction

$\mathrm{Re}\,f(t) = \cos t$, $\mathrm{Im}\,f(t) = \sin t$, dérivables sur $\mathbb{R}$ avec $(\cos)' = -\sin$ et $(\sin)' = \cos$ (admises depuis Fonctions réelles). Par P7.1, $$ f'(t) = -\sin t + i \cos t = i \exp(i t). $$

Proposition — Ce qui ne change pas

Soient $f, g : I \to \mathbb{C}$ dérivables sur $I$, $\lambda, \mu \in \mathbb{C}$. Alors :

$\lambda f + \mu g$ dérivable sur $I$ avec $\textcolor{colorprop}{(\lambda f + \mu g)' = \lambda f' + \mu g'}$ ;
$f g$ dérivable sur $I$ avec $\textcolor{colorprop}{(f g)' = f' g + f g'}$ ;
si $g$ ne s'annule pas, $f/g$ dérivable avec $\textcolor{colorprop}{(f/g)' = (f' g - f g')/g^2}$ ;
si $\varphi : J \to I$ est dérivable à valeurs réelles, $f \circ \varphi$ dérivable avec $\textcolor{colorprop}{(f \circ \varphi)' = (f' \circ \varphi) \cdot \varphi'}$.

Chaque énoncé se déduit du cas réel par décomposition composante par composante via P7.1.

Proposition — Ce qui change

Le théorème de Rolle et le théorème des accroissements finis (égalité) sont faux pour les fonctions à valeurs complexes.

Contre-exemple

La fonction $f : [0 \,;\, 2 \pi] \to \mathbb{C}$, $f(t) = \exp(i t)$, vérifie $f(0) = f(2 \pi) = 1$, est $C^\infty$ sur $[0 \,;\, 2 \pi]$ avec $f'(t) = i \exp(i t)$. Mais $|f'(t)| = 1$ partout, donc $f'$ ne s'annule jamais --- Rolle est en défaut. Par suite, aucun $c$ ne vérifie $f(2\pi) - f(0) = f'(c) \cdot 2 \pi$ (membre gauche $0$, membre droit de module $2 \pi$), donc TAF égalité est en défaut.

Theorem — IAF complexe pour les fonctions $C^1$

Soit $f : I \to \mathbb{C}$ de classe $C^1$ sur $I$ avec $|f'(x)| \le K$ pour tout $x \in I$. Alors pour tout $(x, y) \in I^2$, $$ \textcolor{colorprop}{|f(y) - f(x)| \le K |y - x|}. $$

Remarque --- admis ici

T7.1 est admise dans ce chapitre. L'inégalité résulte d'une simple majoration d'intégrale, justifiée ultérieurement dans la section Intégration. La preuve complète sera donnée dans Intégration sur un segment. D'ici là, T7.1 s'utilise comme boîte noire.

Exemple

Utiliser T7.1 pour montrer $|\exp(i t) - 1| \le |t|$ pour tout $t \in \mathbb{R}$.

Correction

Posons $f(t) = \exp(i t)$ sur $\mathbb{R}$. Alors $f$ est $C^1$ avec $f'(t) = i \exp(i t)$, donc $|f'(t)| = 1$. Par T7.1 avec $K = 1$, $|f(t) - f(0)| \le |t|$, soit $|\exp(i t) - 1| \le |t|$.

Ex 2

Compétences à pratiquer

Déterminer si $X$ admet une espérance finie

I.2 La formule de transfert

Ex 3 Ex 4 Ex 5

La convexité capture, en une seule inégalité, l'idée géométrique d'une courbe située en-dessous de toutes ses cordes. De cette unique définition découle une boîte à outils : caractérisation par croissance des pentes, inégalité de Jensen, test par la dérivée ($f'$ croissante ou $f'' \ge 0$), et énoncé dual « graphe au-dessus de ses tangentes » qui produit des inégalités classiques comme $e^x \ge 1 + x$, $\ln(1+x) \le x$ et $\sin x \ge 2x/\pi$ sur $[0 \,;\, \pi/2]$. Le chapitre se clôt sur un traitement bref et balisé des points d'inflexion.
On note $I$ un intervalle de $\mathbb{R}$ (éventuellement non borné, ouvert ou fermé). La dualité « concave $\Leftrightarrow$ $-f$ convexe » est énoncée une fois au début et utilisée implicitement ensuite ; les inégalités concaves sont inversées. L'inégalité de Jensen est énoncée et démontrée pour les combinaisons convexes finies ; les inégalités de Hölder et Minkowski relèvent de l'intégration et des espaces normés ultérieurs. Les points d'inflexion sont introduits dans la section finale comme critère suffisant pratique.

L'idée géométrique : une fonction est convexe si son graphe reste en-dessous de toute corde tracée entre deux de ses points. On traduit cela par l'inégalité de la corde, puis on démontre deux caractérisations : monotonie des pentes et inégalité de Jensen pour les combinaisons convexes finies.

Compétences à pratiquer

Calculer une espérance par transfert

I.3 Linéarité$\virgule$ positivité$\virgule$ croissance

Définition — Fonction convexe et concave

Soit $f : I \to \mathbb{R}$. On dit que $f$ est convexe sur $I$ si $$ \textcolor{colordef}{\forall x, y \in I, \ \forall \lambda \in [0 \,;\, 1], \quad f((1 - \lambda) x + \lambda y) \le (1 - \lambda) f(x) + \lambda f(y)}. $$ On dit que $f$ est concave sur $I$ si $-f$ est convexe sur $I$, ce qui équivaut à $$ \forall x, y \in I, \ \forall \lambda \in [0 \,;\, 1], \quad f((1 - \lambda) x + \lambda y) \ge (1 - \lambda) f(x) + \lambda f(y). $$

Définition — Corde et sécante

Pour $x, y \in I$ avec $x < y$, la corde de $f$ sur $[x \,;\, y]$ est le segment joignant $(x \,;\, f(x))$ et $(y \,;\, f(y))$ dans le plan. La sécante passant par ces deux points est la droite (complète) contenant cette corde.

Figure --- graphes convexe et concave

Côte à côte : une parabole $y = \tfrac{1}{2} x^2$ (convexe, graphe sous la corde entre deux de ses points) et un logarithme translaté $y = \ln x + 0{,}3$ (concave, graphe au-dessus de la corde). Le facteur d'échelle et le décalage sont cosmétiques --- la convexité/concavité est préservée.

Le graphe convexe est sous la corde $AB$ ; le graphe concave est au-dessus de la corde $AB$.

Proposition — Position du graphe par rapport à une sécante

Soit $f : I \to \mathbb{R}$ convexe sur $I$, et soient $x, y \in I$ avec $x < y$. Alors :

le graphe de $f$ est \textcolor{colorprop}{en-dessous} de la sécante passant par $(x \,;\, f(x))$ et $(y \,;\, f(y))$ sur le segment $[x \,;\, y]$ ;
le graphe de $f$ est \textcolor{colorprop}{au-dessus} de cette même sécante sur $I \setminus [x \,;\, y]$.

Preuve

La sécante a pour équation $L(t) = f(x) + \frac{f(y) - f(x)}{y - x} (t - x)$.

En-dessous sur $[x \,;\, y]$. Pour $t \in [x \,;\, y]$, écrivons $t = (1 - \lambda) x + \lambda y$ avec $\lambda = (t - x)/(y - x) \in [0 \,;\, 1]$. Par convexité (Définition D1.1) : $$ f(t) \le (1 - \lambda) f(x) + \lambda f(y) = L(t). $$
Au-dessus sur $I \setminus [x \,;\, y]$. Soit $t \in I$ avec $t > y$ (le cas $t < x$ est analogue). Posons $\theta = (y - x)/(t - x) \in \,]0 \,;\, 1[$. Alors $$ y = (1 - \theta) x + \theta t, $$ combinaison convexe de $x$ et $t$. Par convexité de $f$, $$ f(y) \le (1 - \theta) f(x) + \theta f(t). $$ D'où $$ f(t) \ge \frac{f(y) - (1 - \theta) f(x)}{\theta}. $$ En substituant $\theta = (y - x)/(t - x)$ et $1 - \theta = (t - y)/(t - x)$ puis en réorganisant : \begin{align*} f(t) &\ge \frac{(t - x) f(y) - (t - y) f(x)}{y - x} && \text{(substitution de $\theta$, $1-\theta$)}
&= f(x) + \frac{f(y) - f(x)}{y - x} (t - x) && \text{(réécriture en forme sécante)}
&= L(t). \end{align*}

Figure --- graphe sous/au-dessus de sa sécante

Le graphe d'une fonction convexe est sous sa sécante sur $[x \,;\, y]$ et au-dessus de la sécante en dehors de $[x \,;\, y]$.

Proposition — Caractérisation par la croissance des pentes

Soit $f : I \to \mathbb{R}$. Les propriétés suivantes sont équivalentes :

(i) $f$ est convexe sur $I$ ;
(ii) pour tout $a \in I$ et tous $u, v \in I \setminus \{a\}$ avec $u < v$, $$ \textcolor{colorprop}{\frac{f(u) - f(a)}{u - a} \le \frac{f(v) - f(a)}{v - a}}. $$

En particulier dans (ii), $t \mapsto (f(t) - f(a))/(t - a)$ est croissante (au sens large) sur $I \setminus \{a\}$ pour tout $a \in I$.

Preuve

$(i) \Rightarrow (ii)$. Soit $a \in I$ et $u < v$ dans $I \setminus \{a\}$.
- Cas $a < u < v$. Écrivons $u = (1 - \lambda) a + \lambda v$ avec $\lambda = (u - a)/(v - a) \in \,]0 \,;\, 1[$. La convexité donne $$ f(u) \le (1 - \lambda) f(a) + \lambda f(v), $$ soit $f(u) - f(a) \le \lambda (f(v) - f(a))$. En divisant par $u - a = \lambda (v - a) > 0$, on obtient l'inégalité voulue.
- Cas $u < v < a$. Symétrique : écrivons $v = (1 - \mu) u + \mu a$ avec $\mu = (v - u)/(a - u) \in \,]0 \,;\, 1[$. La convexité donne $f(v) \le (1 - \mu) f(u) + \mu f(a)$, équivalent à $f(v) - f(a) \le (1 - \mu)(f(u) - f(a))$. En divisant par $v - a = -(1 - \mu)(a - u) < 0$, l'inégalité s'inverse et donne le résultat.
- Cas $u < a < v$. Écrivons $$ a = (1 - \theta) u + \theta v, \qquad \theta = \frac{a - u}{v - u} \in \,]0 \,;\, 1[. $$ Par convexité, $$ f(a) \le (1 - \theta) f(u) + \theta f(v). $$ Comme $1 - \theta = (v - a)/(v - u)$ et $\theta = (a - u)/(v - u)$, en multipliant par $v - u > 0$ : $$ (v - u) f(a) \le (v - a) f(u) + (a - u) f(v). $$ En réarrangeant, $$ (v - a) (f(a) - f(u)) \le (a - u) (f(v) - f(a)). $$ En divisant par le réel strictement positif $(a - u)(v - a) > 0$ : $$ \frac{f(a) - f(u)}{a - u} \le \frac{f(v) - f(a)}{v - a}. $$ Comme $(f(a) - f(u))/(a - u) = (f(u) - f(a))/(u - a)$, on conclut : $$ \frac{f(u) - f(a)}{u - a} \le \frac{f(v) - f(a)}{v - a}. $$
$(ii) \Rightarrow (i)$. Soient $x < y$ dans $I$ et $\lambda \in \,]0 \,;\, 1[$ ; posons $t = (1 - \lambda) x + \lambda y$, donc $x < t < y$. Appliquons (ii) au point d'ancrage $a = x$ sur la paire $(t, y)$ (tous deux dans $I \setminus \{x\}$, $t < y$) : $$ \frac{f(t) - f(x)}{t - x} \le \frac{f(y) - f(x)}{y - x}. $$ Comme $t - x = \lambda (y - x) > 0$, en multipliant par $t - x$ : $$ f(t) - f(x) \le \lambda (f(y) - f(x)), $$ soit $f(t) \le (1 - \lambda) f(x) + \lambda f(y)$. Les cas $\lambda \in \{0 \,;\, 1\}$ sont immédiats. Donc $f$ est convexe.

Compétences à pratiquer

Calculer une espérance par linéarité

I.4 Indépendance et formule du produit

L'inégalité de Jensen est la version « plusieurs points » de la convexité : elle étend l'inégalité de la corde de D1.1 à toute combinaison convexe finie. On reste strictement dans le cas de combinaisons finies --- tout développement général sur les barycentres est hors programme.

Theorem — Inégalité de Jensen (cas fini)

Soit $f : I \to \mathbb{R}$ convexe. Pour tout entier $n \ge 1$, tous $x_1, \dots, x_n \in I$, et tous $\lambda_1, \dots, \lambda_n \in [0 \,;\, 1]$ avec $\lambda_1 + \dots + \lambda_n = 1$, $$ \textcolor{colorprop}{f\!\left( \sum_{k=1}^n \lambda_k x_k \right) \le \sum_{k=1}^n \lambda_k f(x_k)}. $$

Preuve

Par récurrence sur $n$.

Base $n = 1$. La somme se réduit à $f(x_1) \le f(x_1)$, trivial.
Base $n = 2$. L'inégalité est exactement la Définition D1.1.
Hérédité. Supposons l'inégalité au rang $n \ge 2$ et démontrons-la au rang $n + 1$. Fixons $x_1, \dots, x_{n+1} \in I$ et $\lambda_1, \dots, \lambda_{n+1} \in [0 \,;\, 1]$ avec $\lambda_1 + \dots + \lambda_{n+1} = 1$.
- Si $\lambda_{n+1} = 1$, alors $\lambda_1 = \dots = \lambda_n = 0$ et les deux membres valent $f(x_{n+1})$.
- Sinon $\mu := 1 - \lambda_{n+1} = \lambda_1 + \dots + \lambda_n > 0$. Posons $$ z := \frac{1}{\mu} \sum_{k=1}^n \lambda_k x_k. $$ Les coefficients $\lambda_k / \mu$ ($k = 1, \dots, n$) sont positifs ou nuls et de somme $1$, donc $z$ est une combinaison convexe de $x_1, \dots, x_n \in I$. Comme $I$ est un intervalle (et donc convexe dans $\mathbb{R}$), $z \in I$. Maintenant $\sum_{k=1}^{n+1} \lambda_k x_k = \mu z + \lambda_{n+1} x_{n+1}$, avec $\mu + \lambda_{n+1} = 1$, $\mu, \lambda_{n+1} \in [0 \,;\, 1]$. En appliquant D1.1 (cas à deux points) à $z, x_{n+1}$ avec poids $\mu, \lambda_{n+1}$ : $$ f\!\left( \sum_{k=1}^{n+1} \lambda_k x_k \right) = f(\mu z + \lambda_{n+1} x_{n+1}) \le \mu f(z) + \lambda_{n+1} f(x_{n+1}). $$ Par l'hypothèse de récurrence appliquée à $z = \sum (\lambda_k/\mu) x_k$, $$ f(z) \le \sum_{k=1}^n \frac{\lambda_k}{\mu} f(x_k). $$ D'où $$ \mu f(z) \le \sum_{k=1}^n \lambda_k f(x_k), $$ et en ajoutant $\lambda_{n+1} f(x_{n+1})$ : $$ f\!\left( \sum_{k=1}^{n+1} \lambda_k x_k \right) \le \sum_{k=1}^{n+1} \lambda_k f(x_k). $$

Remarque --- continuité sur un intervalle ouvert

Une fonction convexe sur un intervalle ouvert est continue. Ce théorème utile est admis ici.
(La preuve s'appuie sur la caractérisation par les pentes P1.2 et le théorème de la limite monotone de Limites et continuité.)

Ex 6 Ex 7

Compétences à pratiquer

Appliquer l'indépendance pour calculer $\mathbb{E}(XY)$

I.5 Espérances des lois usuelles

Ex 8 Ex 9 Ex 10

Compétences à pratiquer

Calculer l'espérance d'une loi non standard

II Variance$\virgule$ covariance$\virgule$ inégalités et loi faible

Ex 11

II.1 Moment d'ordre 2$\virgule$ Cauchy-Schwarz

Ex 12

Lorsque $f$ est (deux fois) dérivable, la convexité admet des caractérisations « au niveau de la dérivée » : $f$ convexe $\Leftrightarrow$ $f'$ croissante (au sens large) $\Leftrightarrow$ graphe au-dessus de ses tangentes. La version $C^2$ --- $f$ convexe $\Leftrightarrow$ $f'' \ge 0$ --- donne le test opérationnel utilisé partout. L'inégalité de la tangente est le moteur des bornes classiques $e^x \ge 1 + x$, $\ln(1+x) \le x$, $\sin x \le x$ et $\sqrt{x} \le (x+1)/2$.
Convention de dérivation. Dans les énoncés faisant intervenir les dérivées ci-dessous, soit $I$ est ouvert, soit les assertions contenant $f'(a)$ sont lues pour les points intérieurs $a \in \mathring{I}$. Lorsqu'un point de bord est utilisé dans un exemple, la fonction est vue comme la restriction d'une fonction dérivable sur un intervalle ouvert plus grand.

Theorem — Caractérisation des fonctions convexes dérivables

Soit $f : I \to \mathbb{R}$ dérivable sur $I$. Les propriétés suivantes sont équivalentes :

(i) $f$ est convexe sur $I$ ;
(ii) $f'$ est croissante (au sens large) sur $I$ ;
(iii) pour tout $a \in I$ et tout $x \in I$, $\textcolor{colorprop}{f(x) \ge f(a) + f'(a)(x - a)}$ (le graphe de $f$ est au-dessus de toutes ses tangentes).

Preuve

Démonstration cyclique $(i) \Rightarrow (ii) \Rightarrow (iii) \Rightarrow (i)$.

$(i) \Rightarrow (ii)$. Soient $u < v$ dans $I$. Pour tout $w \in \,]u \,;\, v[$, l'inégalité des pentes P1.3 appliquée à $u < w < v$ donne $$ \frac{f(w) - f(u)}{w - u} \le \frac{f(v) - f(u)}{v - u} \le \frac{f(v) - f(w)}{v - w}. $$ Quand $w \to u^+$, l'inégalité de gauche donne $$ f'(u) \le \frac{f(v) - f(u)}{v - u}. $$ Quand $w \to v^-$, l'inégalité de droite donne $$ \frac{f(v) - f(u)}{v - u} \le f'(v). $$ En chaînant : $f'(u) \le f'(v)$. Donc $f'$ est croissante au sens large.
$(ii) \Rightarrow (iii)$. Soit $a \in I$ et $x \in I$. Posons $\varphi(t) := f(t) - f(a) - f'(a)(t - a)$ pour $t \in I$. Alors $\varphi$ est dérivable sur $I$ avec $\varphi'(t) = f'(t) - f'(a)$. Comme $f'$ est croissante (hypothèse ii), $\varphi'(t) \le 0$ pour $t \le a$ et $\varphi'(t) \ge 0$ pour $t \ge a$. Par le théorème signe de $f'$ $\Leftrightarrow$ monotonie de Dérivabilité P5.1, $\varphi$ est décroissante sur $I \cap \,]-\infty \,;\, a]$ et croissante sur $I \cap [a \,;\, +\infty[$. Avec $\varphi(a) = 0$, on obtient $\varphi(t) \ge 0$ pour tout $t \in I$, soit $f(t) \ge f(a) + f'(a)(t - a)$.
$(iii) \Rightarrow (i)$. Soient $x, y \in I$ et $\lambda \in [0 \,;\, 1]$ ; posons $a := (1 - \lambda) x + \lambda y \in I$. Par (iii) appliquée en $a$ aux points $t = x$ et $t = y$ : $$ f(x) \ge f(a) + f'(a)(x - a), \qquad f(y) \ge f(a) + f'(a)(y - a). $$ Multiplions la première par $1 - \lambda \ge 0$, la seconde par $\lambda \ge 0$, et sommons. Les coefficients de $f'(a)$ donnent $$ (1 - \lambda)(x - a) + \lambda (y - a) = (1 - \lambda) x + \lambda y - a = 0, $$ donc $f'(a)$ disparaît. On obtient $$ (1 - \lambda) f(x) + \lambda f(y) \ge f(a) = f((1 - \lambda) x + \lambda y), $$ qui est l'inégalité de convexité D1.1. Donc $f$ est convexe.

Remarque --- énoncé dual pour les concaves

Pour $f$ concave dérivable, les inégalités s'inversent. En particulier, le graphe de $f$ est sous chacune de ses tangentes : $$ \forall a, x \in I, \qquad f(x) \le f(a) + f'(a)(x - a). $$ C'est le moteur des bornes $\ln(1+x) \le x$, $\sqrt{x} \le (x+1)/2$ et $\sin x \le x$ démontrées plus bas.

Méthode — Montrer que $f$ est convexe (ou concave) à partir de $f''$

Soit $f$ de classe au moins $C^2$ sur $I$ :

Calculer $f''$ explicitement.
Étudier le signe de $f''$ sur $I$ (factorisation, signes connus, monotonie).
Conclure par P2.1 : $f''(x) \ge 0$ sur $I$ $\Rightarrow$ $f$ convexe ; $f''(x) \le 0$ sur $I$ $\Rightarrow$ $f$ concave.

Attention. La conclusion exige un signe qui tient sur tout l'intervalle $I$. Si $f''$ change de signe, $f$ est convexe sur le sous-intervalle où $f'' \ge 0$ et concave sur le sous-intervalle où $f'' \le 0$ --- elle n'est ni l'une ni l'autre sur $I$ tout entier.

Exemple

$\ln$ est concave sur $\mathbb{R}_+^*$. En déduire $\ln(1 + x) \le x$ pour $x > -1$, et $\ln x \le x - 1$ pour $x > 0$.

Correction

$\ln$ est $C^2$ sur $\mathbb{R}_+^*$ avec $(\ln)''(x) = -1/x^2 < 0$, donc par P2.1 (cas concave), $\ln$ est concave sur $\mathbb{R}_+^*$. Appliquons l'inégalité de la tangente côté concave :

En $a = 1$ : $(\ln)(1) = 0$, $(\ln)'(1) = 1$, donc la tangente est $y = x - 1$. D'où $\ln x \le x - 1$ pour $x > 0$.
En posant $u = 1 + x$ (donc $u > 0$ ssi $x > -1$) dans le précédent : $\ln(1 + x) \le (1 + x) - 1 = x$ pour $x > -1$.

Exemple

$\sin$ est concave sur $[0 \,;\, \pi/2]$. En déduire les deux inégalités $\sin x \ge \dfrac{2 x}{\pi}$ et $\sin x \le x$, valides pour $x \in [0 \,;\, \pi/2]$.

Correction

$\sin$ est $C^2$ sur $[0 \,;\, \pi/2]$ avec $(\sin)''(x) = -\sin x \le 0$ sur cet intervalle, donc par P2.1 (cas concave), $\sin$ est concave sur $[0 \,;\, \pi/2]$. Les deux inégalités proviennent de deux faits géométriques distincts :

Règle au-dessus de la corde (version concave de P1.1). Sur $[0 \,;\, \pi/2]$, le graphe de $\sin$ est au-dessus de sa corde entre $(0 \,;\, 0)$ et $(\pi/2 \,;\, 1)$. Cette corde a pour équation $y = (2/\pi) x$, d'où $$ \sin x \ge \frac{2 x}{\pi} \qquad (x \in [0 \,;\, \pi/2]). $$
Règle sous la tangente (dual concave de T2.1(iii)). La tangente en $a = 0$ est $y = (\sin)(0) + (\sin)'(0) (x - 0) = x$. Donc $$ \sin x \le x \qquad (x \in [0 \,;\, \pi/2]). $$

L'inégalité $\sin x \le x$ vaut en fait pour tout $x \ge 0$ : la fonction $h(x) = x - \sin x$ vérifie $h(0) = 0$ et $h'(x) = 1 - \cos x \ge 0$ sur $\mathbb{R}$, donc $h$ est croissante (au sens large) sur $\mathbb{R}_+$, d'où $h(x) \ge h(0) = 0$ pour tout $x \ge 0$.

Compétences à pratiquer

Appliquer Cauchy-Schwarz

II.2 Variance et formule de König-Huygens

Méthode — Borner une expression numérique par une inégalité de convexité

Pour démontrer une borne de la forme $f(x) \ge L(x)$ (ou $\le$, dans le cas concave) où $L$ est affine :

Identifier une fonction $f$ pour laquelle la borne est l'inégalité de la tangente (ou de la corde) en un point précis $a$.
Vérifier que $f$ est convexe (ou concave) sur l'intervalle pertinent par le signe de $f''$ via P2.1.
Calculer $f(a)$ et $f'(a)$ ; vérifier que $L(x) = f(a) + f'(a)(x - a)$ est bien la borne affine cible.
Conclure par T2.1(iii) pour le cas tangente, ou par P1.1 / règle de la corde pour le cas corde.

Reconnaître l'ancrage. Le point d'ancrage $a$ est celui où la borne est exacte (égalité). Pour $e^x \ge 1 + x$ : $a = 0$ ; pour $\ln x \le x - 1$ : $a = 1$ ; pour $\sqrt{x} \le (x+1)/2$ : $a = 1$.

Exemple

Montrer que $\sqrt{x} \le \dfrac{x + 1}{2}$ pour tout $x \ge 0$.

Correction

La fonction $g(x) = \sqrt{x}$ est $C^2$ sur $\mathbb{R}_+^*$ avec $g''(x) = -\frac{1}{4} x^{-3/2} < 0$. Par P2.1 (cas concave), $g$ est concave sur $\mathbb{R}_+^*$. Appliquons l'inégalité de la tangente côté concave en $a = 1$ : $g(1) = 1$, $g'(1) = 1/2$, donc la tangente est $y = 1 + \frac{1}{2}(x - 1) = (x + 1)/2$. D'où $$ \sqrt{x} \le \frac{x + 1}{2} \qquad (x > 0). $$ En $x = 0$, l'inégalité devient $0 \le 1/2$, vraie. Par continuité de $g$ en $0$ (ou par calcul direct), l'inégalité s'étend à $x \ge 0$.

Remarque --- convexité stricte

Une fonction $f : I \to \mathbb{R}$ est strictement convexe sur $I$ si, pour tout $x \ne y$ dans $I$ et tout $\lambda \in \,]0 \,;\, 1[$, $f((1 - \lambda) x + \lambda y) < (1 - \lambda) f(x) + \lambda f(y)$ (inégalité stricte). Pour les fonctions dérivables, $f'$ strictement croissante sur $I$ entraîne $f$ strictement convexe. Pour $f \in C^2$, la condition $f'' > 0$ sur $I$ est suffisante mais non nécessaire --- la fonction $x \mapsto x^4$ est strictement convexe sur $\mathbb{R}$ mais $f''(0) = 0$.

Ex 13 Ex 14

Compétences à pratiquer

Calculer une variance

II.3 Covariance$\virgule$ bilinéarité$\virgule$ identité de Bienaymé

Ex 15 Ex 16 Ex 17 Ex 18

Définition — Point d'inflexion

Soient $f : I \to \mathbb{R}$ et $a$ un point intérieur de $I$. On dit que $f$ admet un point d'inflexion en $a$ s'il existe $\eta > 0$ tel que $[a - \eta \,;\, a + \eta] \subset I$, $f$ n'est affine sur aucun voisinage de $a$, et l'une des deux situations suivantes a lieu :

$f$ est convexe sur $[a - \eta \,;\, a]$ et concave sur $[a \,;\, a + \eta]$, ou
$f$ est concave sur $[a - \eta \,;\, a]$ et convexe sur $[a \,;\, a + \eta]$.

La condition de non-affinité force le caractère convexe/concave de $f$ à changer effectivement en $a$ : sans elle, tout point d'une fonction affine serait qualifié (une fonction affine étant à la fois convexe et concave sur tout intervalle).

Piège --- $f''(a) \equal 0$ ne suffit pas

Pour une fonction $C^2$ vérifiant la définition par transition convexe/concave ci-dessus, $f''(a) = 0$ est nécessaire mais non suffisante. Le contre-exemple standard est $f(x) = x^4$ en $a = 0$ : $f''(x) = 12 x^2$ s'annule en $0$ mais reste positif partout, donc $f$ est convexe sur $\mathbb{R}$ tout entier --- pas de transition convexe/concave, donc pas de point d'inflexion. La fiche d'exercices reprend ce piège explicitement.

Méthode — Trouver les points d'inflexion d'une fonction

Soit $f$ de classe au moins $C^2$ sur $I$ :

Calculer $f''$ explicitement sur $I$.
Résoudre $f''(x) = 0$ pour obtenir l'ensemble des candidats $\{a_1, a_2, \dots\}$.
Pour chaque candidat $a_i$, étudier le signe de $f''$ au voisinage de $a_i$ et vérifier s'il change de signe en $a_i$.
Conclure par P3.1 : tout candidat où $f''$ change de signe donne un point d'inflexion ; les candidats où le signe ne change pas sont éliminés dans le cadre usuel $C^2$.

Éliminer les candidats sans changement de signe. Un zéro de $f''$ où le signe ne change pas (par exemple un zéro double de $f''$) n'est pas un point d'inflexion. L'exemple $x^4$ ci-dessus en est l'illustration canonique.

Figure --- cubique et son point d'inflexion

La cubique $f(x) = x^3 - 3 x$ vérifie $f''(x) = 6 x$, donc l'unique point d'inflexion est en $x = 0$. Le graphe est concave sur $]-\infty \,;\, 0]$ et convexe sur $[0 \,;\, +\infty[$.

Ex 19

Compétences à pratiquer

Appliquer l'identité de Bienaymé

II.4 Inégalités de Markov et de Bienaymé-Tchebychev

Ex 20 Ex 21 Ex 22 Ex 23 Ex 24 Ex 25

Compétences à pratiquer

Majorer une probabilité par Markov ou Bienaymé-Tchebychev

II.5 Loi faible des grands nombres

Les entiers relatifs $\mathbb{Z}$ forment, sous leurs addition et multiplication usuelles, un monde clos suffisamment riche pour accueillir une théorie complète de la divisibilité. Ce chapitre la développe en cinq étapes. On part de la relation de divisibilité $b \mid a$ et du théorème de la division euclidienne $a = bq + r$, le seul outil algorithmique qui transforme la question « $b$ divise-t-il $a$ ? » en la question « le reste est-il nul ? ». On construit ensuite, sur la division euclidienne, le plus grand commun diviseur $a \wedge b$, à la fois via l'algorithme itératif d'Euclide et via l'identité de Bézout $a \wedge b = a u + b v$. On isole le cas particulier $a \wedge b = 1$ (entiers premiers entre eux) et on démontre le théorème de Bézout et le lemme de Gauss --- les deux moteurs de tous les raisonnements de divisibilité qui suivent. On introduit les nombres premiers, on démontre leur infinitude (Euclide) et l'existence/unicité de la décomposition en facteurs premiers $n = \prod_p p^{v_p(n)}$, et on utilise la valuation $p$-adique $v_p$ pour donner des formules explicites de $a \wedge b$ et $a \vee b$. On revient enfin sur la divisibilité sous une autre forme --- les congruences modulo $n$ --- et on utilise la machinerie précédente pour caractériser l'inversibilité modulo $n$ ($a \wedge n = 1$) et démontrer le petit théorème de Fermat $a^p \equiv a \pmod p$ pour $p$ premier.
L'approche est tout du long élémentaire : par convention dans ce chapitre, on ne fait pas appel au langage des structures algébriques. On évite donc, délibérément, toute référence aux groupes, anneaux, idéaux et morphismes ; l'ensemble $\mathbb{Z}/n\mathbb{Z}$ apparaît dans la section sur les congruences seulement comme ensemble de $n$ classes, avec un rappel explicite que sa structure d'anneau est hors programme et sera revue dans le chapitre Structures algébriques. Deux autres chapitres prolongent ce travail : Arithmétique des polynômes rejoue toute l'histoire pour $\mathbb{K}[X]$ à la place de $\mathbb{Z}$ (division euclidienne, PGCD, Bézout, Gauss, irréductibilité), et Structures algébriques reformule la divisibilité, les idéaux et l'arithmétique modulaire dans le cadre abstrait.
Convention permanente. Tout au long de ce chapitre, un diviseur est toujours un entier non nul. Chaque fois qu'on écrit « $d \mid a$ », on suppose tacitement $d \in \mathbb{Z}^*$. En particulier $\operatorname{div}(0) = \mathbb{Z}^*$ (tout entier non nul divise $0$). On utilise $\mathbb{N} = \{0, 1, 2, \dots\}$ et $\mathbb{N}^* = \mathbb{N} \setminus \{0\}$. Les notations $a \wedge b$ (plus grand commun diviseur) et $a \vee b$ (plus petit commun multiple) sont standard.

Deux définitions, un théorème. La définition de la divisibilité est le point d'entrée du chapitre ; la division euclidienne est l'outil algorithmique qui convertit « $b \mid a$ ? » en « le reste est-il nul ? ». La spécialité de Terminale couvre déjà les deux --- on les rappelle brièvement, on les énonce et démontre rigoureusement, et on étend l'énoncé de la division euclidienne aux dividendes négatifs.

Définition — Divisibilité

Soient $a \in \mathbb{Z}$ et $b \in \mathbb{Z}^*$. On dit que $b$ divise $a$, et on note $b \mid a$, s'il existe $k \in \mathbb{Z}$ tel que $a = b k$. On dit aussi que $a$ est un multiple de $b$, ou que $b$ est un diviseur de $a$.
Notations :

$a \mathbb{Z} = \{a k : k \in \mathbb{Z}\}$ est l'ensemble des multiples de $a$ ;
$\operatorname{div}(a) = \{d \in \mathbb{Z}^* : d \mid a\}$ est l'ensemble des diviseurs de $a$ (une partie de $\mathbb{Z}^*$ par la convention permanente).

Exemple

Pour tout $a \in \mathbb{Z}^*$, $1 \mid a$, $-1 \mid a$, $a \mid a$, et $-a \mid a$. Donc $\{\pm 1, \pm a\} \subset \operatorname{div}(a)$ toujours ; pour $a \in \mathbb{N}$ avec $a \geq 2$, l'égalité $\operatorname{div}(a) = \{\pm 1, \pm a\}$ caractérise les nombres premiers (voir la section sur les nombres premiers plus bas).

Proposition — Propriétés de la divisibilité

Soient $a, b, c, d \in \mathbb{Z}$ et $u, v \in \mathbb{Z}$.

Réflexivité et transitivité. Pour tout $a \in \mathbb{Z}^*$, $a \mid a$. Si $a \mid b$ et $b \mid c$ (avec $a, b \in \mathbb{Z}^*$), alors $a \mid c$.
Entiers associés. Pour $a, b \in \mathbb{Z}^*$, $a \mid b \text{ et } b \mid a \iff |a| = |b|$. De tels entiers sont dits associés. En particulier, restreint à $\mathbb{N}^*$ ceci redonne l'antisymétrie de $\mid$ : $a \mid b$ et $b \mid a \iff a = b$.
Combinaisons linéaires. Si $d \mid a$ et $d \mid b$, alors $d \mid (a u + b v)$ pour tout $u, v \in \mathbb{Z}$.
Produit. Si $a \mid b$ et $c \mid d$ (avec $a, c \in \mathbb{Z}^*$), alors $a c \mid b d$. En particulier $a^k \mid b^k$ pour tout $k \in \mathbb{N}^*$ lorsque $a \mid b$.

Conséquence : la divisibilité $\mid$ est une relation d'ordre sur $\mathbb{N}^*$ (réflexive, transitive, antisymétrique), mais seulement réflexive et transitive sur $\mathbb{Z}^*$.

Preuve

Réflexivité / transitivité. $a = a \cdot 1$ donne $a \mid a$. Si $b = a k$ et $c = b k'$, alors $c = a (k k')$ avec $k k' \in \mathbb{Z}$, donc $a \mid c$.
Antisymétrie sur $\mathbb{N}^*$. Si $a \mid b$ et $b \mid a$, écrire $b = a k$ et $a = b k'$. Alors $a = a (k k')$, donc $k k' = 1$ (car $a \neq 0$). Avec $k, k' \in \mathbb{Z}$, cela force $k = k' = \pm 1$, donc $|a| = |b|$. Réciproquement si $|a| = |b|$ alors $a = \pm b$, donc chacun divise l'autre.
Combinaisons linéaires. De $a = d k$ et $b = d k'$, $a u + b v = d (k u + k' v) \in d \mathbb{Z}$.
Produit. De $b = a k$ et $d = c k'$, $b d = (a c)(k k')$, donc $a c \mid b d$.

Exemple

$5 \mid 15$ et $5 \mid 25$, donc par la propriété de combinaison linéaire $5 \mid (15 \cdot 3 - 25 \cdot 2) = 45 - 50 = -5$, en accord avec $5 \mid (-5)$.

Compétences à pratiquer

Appliquer la loi faible des grands nombres

II.6 Synthèse : espérances et variances des lois usuelles

Méthode — Décider si $b \mid a$

Deux tests équivalents pour $b \in \mathbb{Z}^*$, $a \in \mathbb{Z}$ :

Test direct du quotient. Calculer $a / b$ dans $\mathbb{Q}$ ; vérifier si le résultat est entier.
Test du reste (préféré pour $a, b$ grands). Calculer la division euclidienne $a = b q + r$ avec $0 \leq r < |b|$ ; alors $b \mid a \iff r = 0$ (sous-section suivante).

Pour $|a|$ très grand, on peut aussi recourir à une réduction par congruence : réduire $a$ modulo $b$ en passant par des étapes intermédiaires plus simples (par exemple, pour $b = 9$, $a$ est congru modulo $9$ à la somme de ses chiffres décimaux --- voir la section sur les congruences plus bas).

Ex 26

Compétences à pratiquer

Reconnaître une loi usuelle à partir de ses moments

III Fonctions génératrices d'une variable aléatoire à valeurs dans $\mathbb{N}$

Ex 27

III.1 Définition ; rayon de convergence

Ex 28

La division euclidienne convertit la question de divisibilité en question algorithmique. L'énoncé de Terminale couvre $a \in \mathbb{N}$, $b \in \mathbb{N}^*$ ; on étend à $a \in \mathbb{Z}$, avec le même diviseur $b \in \mathbb{N}^*$ et la même contrainte sur le reste $0 \leq r < b$. Le cas négatif est le piège classique : les étudiants doivent se souvenir que $r$ est toujours positif ou nul.

Theorem — Division euclidienne

Pour tout $a \in \mathbb{Z}$ et tout $b \in \mathbb{N}^*$, il existe un unique couple $(q, r) \in \mathbb{Z} \times \mathbb{N}$ tel que $$ \textcolor{colorprop}{a = b q + r \quad \text{et} \quad 0 \leq r < b.} $$ L'entier $a$ est le dividende, $b$ le diviseur, $q$ le quotient et $r$ le reste de la division euclidienne de $a$ par $b$. De plus $q = \lfloor a / b \rfloor$ (où $\lfloor \cdot \rfloor$ est la partie entière, de $\mathbb{R}$ dans $\mathbb{Z}$).

Preuve

Existence. Posons $R = \{a - b k : k \in \mathbb{Z}\} \cap \mathbb{N}$. L'ensemble $R$ est non vide : si $a \geq 0$, alors $a = a - b \cdot 0 \in R$ ; si $a < 0$, alors $k = a$ donne $a - b a = a (1 - b) \geq 0$ car $1 - b \leq 0$ et $a < 0$, donc $a - b a \in R$. Comme partie non vide de $\mathbb{N}$, $R$ admet un plus petit élément ; notons-le $r$, et écrivons $r = a - b q$ pour un certain $q \in \mathbb{Z}$, soit $a = b q + r$ avec $r \geq 0$. Il reste à montrer $r < b$. Supposons par l'absurde $r \geq b$. Alors $r - b \in \mathbb{N}$ et $r - b = a - b (q + 1) \in R$, ce qui contredit la minimalité de $r$. Donc $r < b$.
Unicité. Supposons $a = b q + r = b q' + r'$ avec $0 \leq r, r' < b$. Alors $b (q - q') = r' - r$, donc $|b (q - q')| = |r' - r| < b$, ce qui force $|q - q'| < 1$. Comme $q - q' \in \mathbb{Z}$, $q = q'$, et donc $r = a - b q = a - b q' = r'$.
Formule pour $q$. De $a = b q + r$ avec $0 \leq r < b$, on divise par $b > 0$ : $a / b = q + r / b$ avec $0 \leq r/b < 1$, donc $q = \lfloor a / b \rfloor$.

Exemple — Dividende négatif --- piège classique

Pour $a = -23$, $b = 5$ : non $-23 = 5 \cdot (-4) - 3$, car le reste vaudrait alors $-3 < 0$. La division euclidienne correcte est $$ \textcolor{colorprop}{-23 = 5 \cdot (-5) + 2,} $$ donc $q = -5$ et $r = 2$. Vérification : $\lfloor -23 / 5 \rfloor = \lfloor -4{,}6 \rfloor = -5$ (la partie entière de $-4{,}6$ est $-5$, pas $-4$). Le reste est toujours dans $\{0, 1, \dots, b - 1\}$.

Ex 29 Ex 30

Compétences à pratiquer

Calculer une fonction génératrice

III.2 Indépendance et formule du produit

Ex 31

Le plus grand commun diviseur (PGCD) de deux entiers $a$ et $b$ est, intuitivement, le plus grand entier qui les divise tous les deux. Deux subtilités sont à signaler : (i) « plus grand » doit être précisé --- plus grand au sens de l'ordre naturel $\leq$ sur $\mathbb{N}^*$ ou plus grand au sens de l'ordre de divisibilité $\mid$ ---, et le PGCD se trouve être le plus grand dans les deux sens ; (ii) le PGCD se calcule effectivement par l'algorithme d'Euclide, une suite itérée de divisions euclidiennes. On démontre ensuite l'identité centrale du chapitre : l'identité de Bézout $a \wedge b = a u + b v$ pour certains $u, v \in \mathbb{Z}$. De là la caractérisation « les diviseurs communs divisent le PGCD » tombe comme corollaire, et le PPCM $a \vee b$ (ainsi que la formule $(a \wedge b)(a \vee b) = |a b|$) suivent naturellement.

Définition — Plus grand commun diviseur (PGCD)

Soient $a, b \in \mathbb{N}$ non tous deux nuls. Le plus grand commun diviseur de $a$ et $b$, noté $a \wedge b$, est le plus grand élément de $\{d \in \mathbb{N}^* : d \mid a \text{ et } d \mid b\}$ pour l'ordre naturel $\leq$ sur $\mathbb{N}^*$. Par convention, $0 \wedge 0 = 0$.
Extension à $\mathbb{Z}$. Pour $a, b \in \mathbb{Z}$ non tous deux nuls, on pose $a \wedge b := |a| \wedge |b|$.
L'ensemble $\{d \in \mathbb{N}^* : d \mid a \text{ et } d \mid b\}$ est non vide (il contient $1$). Il est aussi fini : si $a$ et $b$ sont tous deux non nuls, tout diviseur commun est majoré par $\min(|a|, |b|)$ ; si par exemple $a = 0$ et $b \neq 0$, les diviseurs communs positifs sont exactement les diviseurs positifs de $|b|$, donc sont majorés par $|b|$. Donc le maximum existe.

Le calcul algorithmique du PGCD repose sur une seule observation : quand un entier est réduit modulo l'autre, le PGCD ne change pas. Itérée, cette règle donne l'algorithme d'Euclide, et le PGCD se lit comme le dernier reste non nul.

Theorem — Existence du PGCD par l'algorithme d'Euclide

Soient $a, b \in \mathbb{N}$ avec $0 < b \leq a$. Définir une suite de restes par $$ r_0 = a, \quad r_1 = b, \quad r_{k+2} = \text{reste de la division euclidienne de } r_k \text{ par } r_{k+1} \quad \text{tant que } r_{k+1} > 0. $$ La suite s'arrête : il existe $N \geq 1$ tel que $r_N = 0$, et le PGCD est le dernier reste non nul : $$ \textcolor{colorprop}{a \wedge b = r_{N - 1}.} $$

Preuve

Terminaison. Tant que $r_{k+1} > 0$, la construction donne $0 \leq r_{k+2} < r_{k+1}$, donc la suite des restes strictement positifs $r_1, r_2, \dots$ est strictement décroissante dans $\mathbb{N}^*$. Une suite strictement décroissante dans $\mathbb{N}$ est finie ; il existe $N$ tel que $r_N = 0$.
Correction. Par l'« idée fondamentale » appliquée à chaque étape (division euclidienne de $r_k$ par $r_{k+1}$ donne quotient $q_k$ et reste $r_{k+2}$, avec $r_k = r_{k+1} q_k + r_{k+2}$), $r_k \wedge r_{k+1} = r_{k+1} \wedge r_{k+2}$ pour tout $k \in \{0, \dots, N-2\}$. En enchaînant, $$ a \wedge b = r_0 \wedge r_1 = r_1 \wedge r_2 = \cdots = r_{N-1} \wedge r_N = r_{N-1} \wedge 0 = r_{N-1}. $$

Compétences à pratiquer

Déterminer la loi de $X + Y$ par $G_X G_Y$

III.3 Moments à partir de la fonction génératrice

Méthode — Calculer $a \wedge b$ par l'algorithme d'Euclide

Supposer $0 < b \leq a$. Tabuler les divisions euclidiennes successives :

Étape 1 : $a = b \, q_1 + r_2$ avec $0 \leq r_2 < b$.
Étape 2 : $b = r_2 \, q_2 + r_3$ avec $0 \leq r_3 < r_2$.
Étape $k$ : $r_k = r_{k+1} \, q_{k+1} + r_{k+2}$ avec $0 \leq r_{k+2} < r_{k+1}$.
S'arrêter dès qu'un reste est nul. Le dernier reste non nul est $a \wedge b$.

Pour $a, b \in \mathbb{Z}$ généraux, remplacer $a, b$ par $|a|, |b|$.

Exemple

Calculer $1542 \wedge 58$.

Correction

On applique l'algorithme d'Euclide : $$ \begin{aligned} 1542 &= 26 \cdot 58 + 34, \\ 58 &= 1 \cdot 34 + 24, \\ 34 &= 1 \cdot 24 + 10, \\ 24 &= 2 \cdot 10 + 4, \\ 10 &= 2 \cdot 4 + 2, \\ 4 &= 2 \cdot 2 + 0. \end{aligned} $$ Le dernier reste non nul est $2$, donc $1542 \wedge 58 = 2$.

Ex 32

L'identité de Bézout est la face « combinaison linéaire » du PGCD : $a \wedge b$ s'écrit $a u + b v$ pour certains $u, v \in \mathbb{Z}$. La démonstration réutilise la suite d'Euclide : chaque reste $r_k$ s'écrit comme combinaison $\mathbb{Z}$-linéaire de $a$ et $b$, par récurrence. En pratique, on déroule l'algorithme d'Euclide vers l'avant puis on remonte par substitution pour extraire un couple $(u, v)$.

Exemple — Non-unicité des coefficients de Bézout

$4 \wedge 6 = 2$, et on peut vérifier à la fois $$ 2 = (-1) \cdot 4 + 1 \cdot 6 = 2 \cdot 4 + (-1) \cdot 6, $$ donc $(u, v) = (-1, 1)$ et $(u, v) = (2, -1)$ sont deux couples distincts de coefficients de Bézout.

Méthode — Algorithme d'Euclide étendu

Pour calculer un couple de coefficients de Bézout, dérouler l'algorithme d'Euclide vers l'avant, puis remonter par substitution depuis le dernier reste non nul jusqu'aux entiers de départ.
Étape 1 (descente). Tabuler $r_0 = a$, $r_1 = b$, $r_{k+2} = r_k - q_k r_{k+1}$ jusqu'à ce qu'un $r_N = 0$. Le PGCD est $r_{N-1}$.
Cas particulier $b \mid a$. Si le premier reste est nul (c'est-à-dire $a = b q_0$), alors $a \wedge b = b$ et une identité de Bézout est immédiate : $b = 0 \cdot a + 1 \cdot b$. Pas de remontée à effectuer.
Étape 2 (remontée). Sinon (l'algorithme comporte au moins deux divisions non triviales), en partant de $r_{N-1} = r_{N-3} - q_{N-3} r_{N-2}$, substituer à plusieurs reprises l'équation précédente $r_{N-2} = r_{N-4} - q_{N-4} r_{N-3}$ pour exprimer $r_{N-1}$ comme combinaison $\mathbb{Z}$-linéaire de $r_{N-3}$ et $r_{N-4}$, puis de $r_{N-5}$ et $r_{N-4}$, \ldots, jusqu'à atteindre une combinaison de $r_0 = a$ et $r_1 = b$.

Exemple

Calculer des coefficients de Bézout de $3080$ et $525$.

Correction

Étape 1 (descente Euclide). $$ \begin{aligned} 3080 &= 5 \cdot 525 + 455, \\ 525 &= 1 \cdot 455 + 70, \\ 455 &= 6 \cdot 70 + 35, \\ 70 &= 2 \cdot 35 + 0. \end{aligned} $$ Dernier reste non nul : $35$, donc $3080 \wedge 525 = 35$.
Étape 2 (remontée). $$ \begin{aligned} 35 &= 455 - 6 \cdot 70 \\ &= 455 - 6 \cdot (525 - 1 \cdot 455) = 7 \cdot 455 - 6 \cdot 525 \\ &= 7 \cdot (3080 - 5 \cdot 525) - 6 \cdot 525 = 7 \cdot 3080 - 41 \cdot 525. \end{aligned} $$ Donc $(u, v) = (7, -41)$ est un couple de coefficients de Bézout : $35 = 7 \cdot 3080 - 41 \cdot 525$. Vérification : $7 \cdot 3080 = 21560$, $41 \cdot 525 = 21525$, $21560 - 21525 = 35$. $\checkmark$

Compétences à pratiquer

Calculer $\mathbb{E}$ et $\mathrm{V}$ via $G_X$

III.4 Fonctions génératrices des lois usuelles

Ex 33 Ex 34

Munis de l'identité de Bézout, la caractérisation du PGCD par son ensemble de diviseurs tombe comme un corollaire immédiat.

Proposition — Les diviseurs communs sont les diviseurs du PGCD

Pour tout $a, b \in \mathbb{Z}$ non tous deux nuls, $$ \textcolor{colorprop}{\operatorname{div}(a) \cap \operatorname{div}(b) = \operatorname{div}(a \wedge b).} $$ De manière équivalente : un entier non nul divise à la fois $a$ et $b$ si et seulement s'il divise $a \wedge b$. En conséquence, $a \wedge b$ est aussi le plus grand diviseur commun au sens de la divisibilité $\mid$ : tout diviseur commun de $a$ et $b$ divise $a \wedge b$.

Preuve

Posons $d = a \wedge b$. On montre $\operatorname{div}(a) \cap \operatorname{div}(b) = \operatorname{div}(d)$ par double inclusion.

$(\supset)$ Comme $d = a \wedge b$ divise à la fois $a$ et $b$ (par définition), tout diviseur de $d$ divise aussi $a$ et $b$ par transitivité, donc appartient à $\operatorname{div}(a) \cap \operatorname{div}(b)$.
$(\subset)$ Soit $\delta \in \operatorname{div}(a) \cap \operatorname{div}(b)$. Par l'identité de Bézout, $d = a u + b v$ pour certains $u, v \in \mathbb{Z}$. Comme $\delta \mid a$ et $\delta \mid b$, la propriété des combinaisons linéaires donne $\delta \mid (a u + b v) = d$, donc $\delta \in \operatorname{div}(d)$.

Compétences à pratiquer

Reconnaître une loi à partir de sa fonction génératrice

Aller à la section