CommeUnJeu · L2 MP
Espérance, variance et fonctions génératrices
Ex 1
La dérivabilité s'étend aux fonctions \(f : I \to \mathbb{C}\) par dérivabilité composante par composante. La boîte à outils algébrique passe quasi à l'identique. Obstruction cruciale : Rolle et TAF égalité sont faux sur \(\mathbb{C}\). En revanche l'IAF pour fonctions \(C^1\) subsiste --- admise ici, preuve reportée à Intégration sur un segment.
I
Espérance d'une variable aléatoire discrète
Définition — Dérivabilité complexe
\(f : I \to \mathbb{C}\), \(a \in I\). On dit que \(f\) est dérivable en \(a\) si le taux d'accroissement $$ \tau_a(h) = \frac{f(a + h) - f(a)}{h} $$ admet une limite finie dans \(\mathbb{C}\) quand \(h \to 0\) avec \(a + h \in I\). On note la limite \(\textcolor{colordef}{f'(a)}\).
I.1
Définition ; existence
Proposition — Caractérisation par composantes
\(f : I \to \mathbb{C}\) est dérivable en \(a\) si et seulement si \(\mathrm{Re}\,f\) et \(\mathrm{Im}\,f\) sont dérivables en \(a\). Dans ce cas, $$ \textcolor{colorprop}{f'(a) = (\mathrm{Re}\,f)'(a) + i \, (\mathrm{Im}\,f)'(a)}. $$
Pour \(h \ne 0\) avec \(a + h \in I\), $$ \tau_a^f(h) = \tau_a^{\mathrm{Re}\,f}(h) + i \, \tau_a^{\mathrm{Im}\,f}(h) $$ par \(\mathbb{R}\)-linéarité de \(\mathrm{Re}\) et \(\mathrm{Im}\). Par la caractérisation par composantes des limites de fonctions à valeurs complexes (Limites et continuité, section fonctions à valeurs complexes), \(\tau_a^f(h)\) admet une limite finie dans \(\mathbb{C}\) quand \(h \to 0\) ssi \(\tau_a^{\mathrm{Re}\,f}\) et \(\tau_a^{\mathrm{Im}\,f}\) admettent des limites finies dans \(\mathbb{R}\), avec décomposition \((\mathrm{Re}\,f)'(a) + i (\mathrm{Im}\,f)'(a)\).
Exemple
Calculer la dérivée de \(f : \mathbb{R} \to \mathbb{C}\), \(f(t) = \exp(i t)\).
\(\mathrm{Re}\,f(t) = \cos t\), \(\mathrm{Im}\,f(t) = \sin t\), dérivables sur \(\mathbb{R}\) avec \((\cos)' = -\sin\) et \((\sin)' = \cos\) (admises depuis Fonctions réelles). Par P7.1, $$ f'(t) = -\sin t + i \cos t = i \exp(i t). $$
Proposition — Ce qui ne change pas
Soient \(f, g : I \to \mathbb{C}\) dérivables sur \(I\), \(\lambda, \mu \in \mathbb{C}\). Alors : - \(\lambda f + \mu g\) dérivable sur \(I\) avec \(\textcolor{colorprop}{(\lambda f + \mu g)' = \lambda f' + \mu g'}\) ;
- \(f g\) dérivable sur \(I\) avec \(\textcolor{colorprop}{(f g)' = f' g + f g'}\) ;
- si \(g\) ne s'annule pas, \(f/g\) dérivable avec \(\textcolor{colorprop}{(f/g)' = (f' g - f g')/g^2}\) ;
- si \(\varphi : J \to I\) est dérivable à valeurs réelles, \(f \circ \varphi\) dérivable avec \(\textcolor{colorprop}{(f \circ \varphi)' = (f' \circ \varphi) \cdot \varphi'}\).
Proposition — Ce qui change
Le théorème de Rolle et le théorème des accroissements finis (égalité) sont faux pour les fonctions à valeurs complexes.
Contre-exemple
La fonction \(f : [0 \,;\, 2 \pi] \to \mathbb{C}\), \(f(t) = \exp(i t)\), vérifie \(f(0) = f(2 \pi) = 1\), est \(C^\infty\) sur \([0 \,;\, 2 \pi]\) avec \(f'(t) = i \exp(i t)\). Mais \(|f'(t)| = 1\) partout, donc \(f'\) ne s'annule jamais --- Rolle est en défaut. Par suite, aucun \(c\) ne vérifie \(f(2\pi) - f(0) = f'(c) \cdot 2 \pi\) (membre gauche \(0\), membre droit de module \(2 \pi\)), donc TAF égalité est en défaut.
Theorem — IAF complexe pour les fonctions \(C^1\)
Soit \(f : I \to \mathbb{C}\) de classe \(C^1\) sur \(I\) avec \(|f'(x)| \le K\) pour tout \(x \in I\). Alors pour tout \((x, y) \in I^2\), $$ \textcolor{colorprop}{|f(y) - f(x)| \le K |y - x|}. $$
Remarque --- admis ici
T7.1 est admise dans ce chapitre. L'inégalité résulte d'une simple majoration d'intégrale, justifiée ultérieurement dans la section Intégration. La preuve complète sera donnée dans Intégration sur un segment. D'ici là, T7.1 s'utilise comme boîte noire.
Exemple
Utiliser T7.1 pour montrer \(|\exp(i t) - 1| \le |t|\) pour tout \(t \in \mathbb{R}\).
Posons \(f(t) = \exp(i t)\) sur \(\mathbb{R}\). Alors \(f\) est \(C^1\) avec \(f'(t) = i \exp(i t)\), donc \(|f'(t)| = 1\). Par T7.1 avec \(K = 1\), \(|f(t) - f(0)| \le |t|\), soit \(|\exp(i t) - 1| \le |t|\).
Compétences à pratiquer
- Déterminer si \(X\) admet une espérance finie
I.2
La formule de transfert
Ex 3
Ex 4
Ex 5
La convexité capture, en une seule inégalité, l'idée géométrique d'une courbe située en-dessous de toutes ses cordes. De cette unique définition découle une boîte à outils : caractérisation par croissance des pentes, inégalité de Jensen, test par la dérivée (\(f'\) croissante ou \(f'' \ge 0\)), et énoncé dual « graphe au-dessus de ses tangentes » qui produit des inégalités classiques comme \(e^x \ge 1 + x\), \(\ln(1+x) \le x\) et \(\sin x \ge 2x/\pi\) sur \([0 \,;\, \pi/2]\). Le chapitre se clôt sur un traitement bref et balisé des points d'inflexion.
On note \(I\) un intervalle de \(\mathbb{R}\) (éventuellement non borné, ouvert ou fermé). La dualité « concave \(\Leftrightarrow\) \(-f\) convexe » est énoncée une fois au début et utilisée implicitement ensuite ; les inégalités concaves sont inversées. L'inégalité de Jensen est énoncée et démontrée pour les combinaisons convexes finies ; les inégalités de Hölder et Minkowski relèvent de l'intégration et des espaces normés ultérieurs. Les points d'inflexion sont introduits dans la section finale comme critère suffisant pratique.
On note \(I\) un intervalle de \(\mathbb{R}\) (éventuellement non borné, ouvert ou fermé). La dualité « concave \(\Leftrightarrow\) \(-f\) convexe » est énoncée une fois au début et utilisée implicitement ensuite ; les inégalités concaves sont inversées. L'inégalité de Jensen est énoncée et démontrée pour les combinaisons convexes finies ; les inégalités de Hölder et Minkowski relèvent de l'intégration et des espaces normés ultérieurs. Les points d'inflexion sont introduits dans la section finale comme critère suffisant pratique.
L'idée géométrique : une fonction est convexe si son graphe reste en-dessous de toute corde tracée entre deux de ses points. On traduit cela par l'inégalité de la corde, puis on démontre deux caractérisations : monotonie des pentes et inégalité de Jensen pour les combinaisons convexes finies.
Compétences à pratiquer
- Calculer une espérance par transfert
I.3
Linéarité\(\virgule\) positivité\(\virgule\) croissance
Définition — Fonction convexe et concave
Soit \(f : I \to \mathbb{R}\). On dit que \(f\) est convexe sur \(I\) si $$ \textcolor{colordef}{\forall x, y \in I, \ \forall \lambda \in [0 \,;\, 1], \quad f((1 - \lambda) x + \lambda y) \le (1 - \lambda) f(x) + \lambda f(y)}. $$ On dit que \(f\) est concave sur \(I\) si \(-f\) est convexe sur \(I\), ce qui équivaut à $$ \forall x, y \in I, \ \forall \lambda \in [0 \,;\, 1], \quad f((1 - \lambda) x + \lambda y) \ge (1 - \lambda) f(x) + \lambda f(y). $$ Définition — Corde et sécante
Pour \(x, y \in I\) avec \(x < y\), la corde de \(f\) sur \([x \,;\, y]\) est le segment joignant \((x \,;\, f(x))\) et \((y \,;\, f(y))\) dans le plan. La sécante passant par ces deux points est la droite (complète) contenant cette corde.
Figure --- graphes convexe et concave
Côte à côte : une parabole \(y = \tfrac{1}{2} x^2\) (convexe, graphe sous la corde entre deux de ses points) et un logarithme translaté \(y = \ln x + 0{,}3\) (concave, graphe au-dessus de la corde). Le facteur d'échelle et le décalage sont cosmétiques --- la convexité/concavité est préservée.
Le graphe convexe est sous la corde \(AB\) ; le graphe concave est au-dessus de la corde \(AB\).
Proposition — Position du graphe par rapport à une sécante
Soit \(f : I \to \mathbb{R}\) convexe sur \(I\), et soient \(x, y \in I\) avec \(x < y\). Alors : - le graphe de \(f\) est \textcolor{colorprop}{en-dessous} de la sécante passant par \((x \,;\, f(x))\) et \((y \,;\, f(y))\) sur le segment \([x \,;\, y]\) ;
- le graphe de \(f\) est \textcolor{colorprop}{au-dessus} de cette même sécante sur \(I \setminus [x \,;\, y]\).
La sécante a pour équation \(L(t) = f(x) + \frac{f(y) - f(x)}{y - x} (t - x)\).
- En-dessous sur \([x \,;\, y]\). Pour \(t \in [x \,;\, y]\), écrivons \(t = (1 - \lambda) x + \lambda y\) avec \(\lambda = (t - x)/(y - x) \in [0 \,;\, 1]\). Par convexité (Définition D1.1) : $$ f(t) \le (1 - \lambda) f(x) + \lambda f(y) = L(t). $$
- Au-dessus sur \(I \setminus [x \,;\, y]\). Soit \(t \in I\) avec \(t > y\) (le cas \(t < x\) est analogue). Posons \(\theta = (y - x)/(t - x) \in \,]0 \,;\, 1[\). Alors $$ y = (1 - \theta) x + \theta t, $$ combinaison convexe de \(x\) et \(t\). Par convexité de \(f\), $$ f(y) \le (1 - \theta) f(x) + \theta f(t). $$ D'où $$ f(t) \ge \frac{f(y) - (1 - \theta) f(x)}{\theta}. $$ En substituant \(\theta = (y - x)/(t - x)\) et \(1 - \theta = (t - y)/(t - x)\) puis en réorganisant : \begin{align*} f(t) &\ge \frac{(t - x) f(y) - (t - y) f(x)}{y - x} && \text{(substitution de \(\theta\), \(1-\theta\))}
&= f(x) + \frac{f(y) - f(x)}{y - x} (t - x) && \text{(réécriture en forme sécante)}
&= L(t). \end{align*}
Figure --- graphe sous/au-dessus de sa sécante
Le graphe d'une fonction convexe est sous sa sécante sur \([x \,;\, y]\) et au-dessus de la sécante en dehors de \([x \,;\, y]\).
Proposition — Caractérisation par la croissance des pentes
Soit \(f : I \to \mathbb{R}\). Les propriétés suivantes sont équivalentes : - (i) \(f\) est convexe sur \(I\) ;
- (ii) pour tout \(a \in I\) et tous \(u, v \in I \setminus \{a\}\) avec \(u < v\), $$ \textcolor{colorprop}{\frac{f(u) - f(a)}{u - a} \le \frac{f(v) - f(a)}{v - a}}. $$
- \((i) \Rightarrow (ii)\). Soit \(a \in I\) et \(u < v\) dans \(I \setminus \{a\}\).
- Cas \(a < u < v\). Écrivons \(u = (1 - \lambda) a + \lambda v\) avec \(\lambda = (u - a)/(v - a) \in \,]0 \,;\, 1[\). La convexité donne $$ f(u) \le (1 - \lambda) f(a) + \lambda f(v), $$ soit \(f(u) - f(a) \le \lambda (f(v) - f(a))\). En divisant par \(u - a = \lambda (v - a) > 0\), on obtient l'inégalité voulue.
- Cas \(u < v < a\). Symétrique : écrivons \(v = (1 - \mu) u + \mu a\) avec \(\mu = (v - u)/(a - u) \in \,]0 \,;\, 1[\). La convexité donne \(f(v) \le (1 - \mu) f(u) + \mu f(a)\), équivalent à \(f(v) - f(a) \le (1 - \mu)(f(u) - f(a))\). En divisant par \(v - a = -(1 - \mu)(a - u) < 0\), l'inégalité s'inverse et donne le résultat.
- Cas \(u < a < v\). Écrivons $$ a = (1 - \theta) u + \theta v, \qquad \theta = \frac{a - u}{v - u} \in \,]0 \,;\, 1[. $$ Par convexité, $$ f(a) \le (1 - \theta) f(u) + \theta f(v). $$ Comme \(1 - \theta = (v - a)/(v - u)\) et \(\theta = (a - u)/(v - u)\), en multipliant par \(v - u > 0\) : $$ (v - u) f(a) \le (v - a) f(u) + (a - u) f(v). $$ En réarrangeant, $$ (v - a) (f(a) - f(u)) \le (a - u) (f(v) - f(a)). $$ En divisant par le réel strictement positif \((a - u)(v - a) > 0\) : $$ \frac{f(a) - f(u)}{a - u} \le \frac{f(v) - f(a)}{v - a}. $$ Comme \((f(a) - f(u))/(a - u) = (f(u) - f(a))/(u - a)\), on conclut : $$ \frac{f(u) - f(a)}{u - a} \le \frac{f(v) - f(a)}{v - a}. $$
- \((ii) \Rightarrow (i)\). Soient \(x < y\) dans \(I\) et \(\lambda \in \,]0 \,;\, 1[\) ; posons \(t = (1 - \lambda) x + \lambda y\), donc \(x < t < y\). Appliquons (ii) au point d'ancrage \(a = x\) sur la paire \((t, y)\) (tous deux dans \(I \setminus \{x\}\), \(t < y\)) : $$ \frac{f(t) - f(x)}{t - x} \le \frac{f(y) - f(x)}{y - x}. $$ Comme \(t - x = \lambda (y - x) > 0\), en multipliant par \(t - x\) : $$ f(t) - f(x) \le \lambda (f(y) - f(x)), $$ soit \(f(t) \le (1 - \lambda) f(x) + \lambda f(y)\). Les cas \(\lambda \in \{0 \,;\, 1\}\) sont immédiats. Donc \(f\) est convexe.
Compétences à pratiquer
- Calculer une espérance par linéarité
I.4
Indépendance et formule du produit
L'inégalité de Jensen est la version « plusieurs points » de la convexité : elle étend l'inégalité de la corde de D1.1 à toute combinaison convexe finie. On reste strictement dans le cas de combinaisons finies --- tout développement général sur les barycentres est hors programme.
Theorem — Inégalité de Jensen (cas fini)
Soit \(f : I \to \mathbb{R}\) convexe. Pour tout entier \(n \ge 1\), tous \(x_1, \dots, x_n \in I\), et tous \(\lambda_1, \dots, \lambda_n \in [0 \,;\, 1]\) avec \(\lambda_1 + \dots + \lambda_n = 1\), $$ \textcolor{colorprop}{f\!\left( \sum_{k=1}^n \lambda_k x_k \right) \le \sum_{k=1}^n \lambda_k f(x_k)}. $$
Par récurrence sur \(n\).
- Base \(n = 1\). La somme se réduit à \(f(x_1) \le f(x_1)\), trivial.
- Base \(n = 2\). L'inégalité est exactement la Définition D1.1.
- Hérédité. Supposons l'inégalité au rang \(n \ge 2\) et démontrons-la au rang \(n + 1\). Fixons \(x_1, \dots, x_{n+1} \in I\) et \(\lambda_1, \dots, \lambda_{n+1} \in [0 \,;\, 1]\) avec \(\lambda_1 + \dots + \lambda_{n+1} = 1\).
- Si \(\lambda_{n+1} = 1\), alors \(\lambda_1 = \dots = \lambda_n = 0\) et les deux membres valent \(f(x_{n+1})\).
- Sinon \(\mu := 1 - \lambda_{n+1} = \lambda_1 + \dots + \lambda_n > 0\). Posons $$ z := \frac{1}{\mu} \sum_{k=1}^n \lambda_k x_k. $$ Les coefficients \(\lambda_k / \mu\) (\(k = 1, \dots, n\)) sont positifs ou nuls et de somme \(1\), donc \(z\) est une combinaison convexe de \(x_1, \dots, x_n \in I\). Comme \(I\) est un intervalle (et donc convexe dans \(\mathbb{R}\)), \(z \in I\). Maintenant \(\sum_{k=1}^{n+1} \lambda_k x_k = \mu z + \lambda_{n+1} x_{n+1}\), avec \(\mu + \lambda_{n+1} = 1\), \(\mu, \lambda_{n+1} \in [0 \,;\, 1]\). En appliquant D1.1 (cas à deux points) à \(z, x_{n+1}\) avec poids \(\mu, \lambda_{n+1}\) : $$ f\!\left( \sum_{k=1}^{n+1} \lambda_k x_k \right) = f(\mu z + \lambda_{n+1} x_{n+1}) \le \mu f(z) + \lambda_{n+1} f(x_{n+1}). $$ Par l'hypothèse de récurrence appliquée à \(z = \sum (\lambda_k/\mu) x_k\), $$ f(z) \le \sum_{k=1}^n \frac{\lambda_k}{\mu} f(x_k). $$ D'où $$ \mu f(z) \le \sum_{k=1}^n \lambda_k f(x_k), $$ et en ajoutant \(\lambda_{n+1} f(x_{n+1})\) : $$ f\!\left( \sum_{k=1}^{n+1} \lambda_k x_k \right) \le \sum_{k=1}^{n+1} \lambda_k f(x_k). $$
Remarque --- continuité sur un intervalle ouvert
Une fonction convexe sur un intervalle ouvert est continue. Ce théorème utile est admis ici.
(La preuve s'appuie sur la caractérisation par les pentes P1.2 et le théorème de la limite monotone de Limites et continuité.)
(La preuve s'appuie sur la caractérisation par les pentes P1.2 et le théorème de la limite monotone de Limites et continuité.)
Compétences à pratiquer
- Appliquer l'indépendance pour calculer \(\mathbb{E}(XY)\)
I.5
Espérances des lois usuelles
Ex 8
Ex 9
Ex 10
Compétences à pratiquer
- Calculer l'espérance d'une loi non standard
II
Variance\(\virgule\) covariance\(\virgule\) inégalités et loi faible
II.1
Moment d'ordre 2\(\virgule\) Cauchy-Schwarz
Ex 12
Lorsque \(f\) est (deux fois) dérivable, la convexité admet des caractérisations « au niveau de la dérivée » : \(f\) convexe \(\Leftrightarrow\) \(f'\) croissante (au sens large) \(\Leftrightarrow\) graphe au-dessus de ses tangentes. La version \(C^2\) --- \(f\) convexe \(\Leftrightarrow\) \(f'' \ge 0\) --- donne le test opérationnel utilisé partout. L'inégalité de la tangente est le moteur des bornes classiques \(e^x \ge 1 + x\), \(\ln(1+x) \le x\), \(\sin x \le x\) et \(\sqrt{x} \le (x+1)/2\).
Convention de dérivation. Dans les énoncés faisant intervenir les dérivées ci-dessous, soit \(I\) est ouvert, soit les assertions contenant \(f'(a)\) sont lues pour les points intérieurs \(a \in \mathring{I}\). Lorsqu'un point de bord est utilisé dans un exemple, la fonction est vue comme la restriction d'une fonction dérivable sur un intervalle ouvert plus grand.
Convention de dérivation. Dans les énoncés faisant intervenir les dérivées ci-dessous, soit \(I\) est ouvert, soit les assertions contenant \(f'(a)\) sont lues pour les points intérieurs \(a \in \mathring{I}\). Lorsqu'un point de bord est utilisé dans un exemple, la fonction est vue comme la restriction d'une fonction dérivable sur un intervalle ouvert plus grand.
Theorem — Caractérisation des fonctions convexes dérivables
Soit \(f : I \to \mathbb{R}\) dérivable sur \(I\). Les propriétés suivantes sont équivalentes : - (i) \(f\) est convexe sur \(I\) ;
- (ii) \(f'\) est croissante (au sens large) sur \(I\) ;
- (iii) pour tout \(a \in I\) et tout \(x \in I\), \(\textcolor{colorprop}{f(x) \ge f(a) + f'(a)(x - a)}\) (le graphe de \(f\) est au-dessus de toutes ses tangentes).
Démonstration cyclique \((i) \Rightarrow (ii) \Rightarrow (iii) \Rightarrow (i)\).
- \((i) \Rightarrow (ii)\). Soient \(u < v\) dans \(I\). Pour tout \(w \in \,]u \,;\, v[\), l'inégalité des pentes P1.3 appliquée à \(u < w < v\) donne $$ \frac{f(w) - f(u)}{w - u} \le \frac{f(v) - f(u)}{v - u} \le \frac{f(v) - f(w)}{v - w}. $$ Quand \(w \to u^+\), l'inégalité de gauche donne $$ f'(u) \le \frac{f(v) - f(u)}{v - u}. $$ Quand \(w \to v^-\), l'inégalité de droite donne $$ \frac{f(v) - f(u)}{v - u} \le f'(v). $$ En chaînant : \(f'(u) \le f'(v)\). Donc \(f'\) est croissante au sens large.
- \((ii) \Rightarrow (iii)\). Soit \(a \in I\) et \(x \in I\). Posons \(\varphi(t) := f(t) - f(a) - f'(a)(t - a)\) pour \(t \in I\). Alors \(\varphi\) est dérivable sur \(I\) avec \(\varphi'(t) = f'(t) - f'(a)\). Comme \(f'\) est croissante (hypothèse ii), \(\varphi'(t) \le 0\) pour \(t \le a\) et \(\varphi'(t) \ge 0\) pour \(t \ge a\). Par le théorème signe de \(f'\) \(\Leftrightarrow\) monotonie de Dérivabilité P5.1, \(\varphi\) est décroissante sur \(I \cap \,]-\infty \,;\, a]\) et croissante sur \(I \cap [a \,;\, +\infty[\). Avec \(\varphi(a) = 0\), on obtient \(\varphi(t) \ge 0\) pour tout \(t \in I\), soit \(f(t) \ge f(a) + f'(a)(t - a)\).
- \((iii) \Rightarrow (i)\). Soient \(x, y \in I\) et \(\lambda \in [0 \,;\, 1]\) ; posons \(a := (1 - \lambda) x + \lambda y \in I\). Par (iii) appliquée en \(a\) aux points \(t = x\) et \(t = y\) : $$ f(x) \ge f(a) + f'(a)(x - a), \qquad f(y) \ge f(a) + f'(a)(y - a). $$ Multiplions la première par \(1 - \lambda \ge 0\), la seconde par \(\lambda \ge 0\), et sommons. Les coefficients de \(f'(a)\) donnent $$ (1 - \lambda)(x - a) + \lambda (y - a) = (1 - \lambda) x + \lambda y - a = 0, $$ donc \(f'(a)\) disparaît. On obtient $$ (1 - \lambda) f(x) + \lambda f(y) \ge f(a) = f((1 - \lambda) x + \lambda y), $$ qui est l'inégalité de convexité D1.1. Donc \(f\) est convexe.
Remarque --- énoncé dual pour les concaves
Pour \(f\) concave dérivable, les inégalités s'inversent. En particulier, le graphe de \(f\) est sous chacune de ses tangentes : $$ \forall a, x \in I, \qquad f(x) \le f(a) + f'(a)(x - a). $$ C'est le moteur des bornes \(\ln(1+x) \le x\), \(\sqrt{x} \le (x+1)/2\) et \(\sin x \le x\) démontrées plus bas.
Méthode — Montrer que \(f\) est convexe (ou concave) à partir de \(f''\)
Soit \(f\) de classe au moins \(C^2\) sur \(I\) : - Calculer \(f''\) explicitement.
- Étudier le signe de \(f''\) sur \(I\) (factorisation, signes connus, monotonie).
- Conclure par P2.1 : \(f''(x) \ge 0\) sur \(I\) \(\Rightarrow\) \(f\) convexe ; \(f''(x) \le 0\) sur \(I\) \(\Rightarrow\) \(f\) concave.
Exemple
\(\ln\) est concave sur \(\mathbb{R}_+^*\). En déduire \(\ln(1 + x) \le x\) pour \(x > -1\), et \(\ln x \le x - 1\) pour \(x > 0\).
\(\ln\) est \(C^2\) sur \(\mathbb{R}_+^*\) avec \((\ln)''(x) = -1/x^2 < 0\), donc par P2.1 (cas concave), \(\ln\) est concave sur \(\mathbb{R}_+^*\). Appliquons l'inégalité de la tangente côté concave :
- En \(a = 1\) : \((\ln)(1) = 0\), \((\ln)'(1) = 1\), donc la tangente est \(y = x - 1\). D'où \(\ln x \le x - 1\) pour \(x > 0\).
- En posant \(u = 1 + x\) (donc \(u > 0\) ssi \(x > -1\)) dans le précédent : \(\ln(1 + x) \le (1 + x) - 1 = x\) pour \(x > -1\).
Exemple
\(\sin\) est concave sur \([0 \,;\, \pi/2]\). En déduire les deux inégalités \(\sin x \ge \dfrac{2 x}{\pi}\) et \(\sin x \le x\), valides pour \(x \in [0 \,;\, \pi/2]\).
\(\sin\) est \(C^2\) sur \([0 \,;\, \pi/2]\) avec \((\sin)''(x) = -\sin x \le 0\) sur cet intervalle, donc par P2.1 (cas concave), \(\sin\) est concave sur \([0 \,;\, \pi/2]\). Les deux inégalités proviennent de deux faits géométriques distincts :
- Règle au-dessus de la corde (version concave de P1.1). Sur \([0 \,;\, \pi/2]\), le graphe de \(\sin\) est au-dessus de sa corde entre \((0 \,;\, 0)\) et \((\pi/2 \,;\, 1)\). Cette corde a pour équation \(y = (2/\pi) x\), d'où $$ \sin x \ge \frac{2 x}{\pi} \qquad (x \in [0 \,;\, \pi/2]). $$
- Règle sous la tangente (dual concave de T2.1(iii)). La tangente en \(a = 0\) est \(y = (\sin)(0) + (\sin)'(0) (x - 0) = x\). Donc $$ \sin x \le x \qquad (x \in [0 \,;\, \pi/2]). $$
Compétences à pratiquer
- Appliquer Cauchy-Schwarz
II.2
Variance et formule de König-Huygens
Méthode — Borner une expression numérique par une inégalité de convexité
Pour démontrer une borne de la forme \(f(x) \ge L(x)\) (ou \(\le\), dans le cas concave) où \(L\) est affine : - Identifier une fonction \(f\) pour laquelle la borne est l'inégalité de la tangente (ou de la corde) en un point précis \(a\).
- Vérifier que \(f\) est convexe (ou concave) sur l'intervalle pertinent par le signe de \(f''\) via P2.1.
- Calculer \(f(a)\) et \(f'(a)\) ; vérifier que \(L(x) = f(a) + f'(a)(x - a)\) est bien la borne affine cible.
- Conclure par T2.1(iii) pour le cas tangente, ou par P1.1 / règle de la corde pour le cas corde.
Exemple
Montrer que \(\sqrt{x} \le \dfrac{x + 1}{2}\) pour tout \(x \ge 0\).
La fonction \(g(x) = \sqrt{x}\) est \(C^2\) sur \(\mathbb{R}_+^*\) avec \(g''(x) = -\frac{1}{4} x^{-3/2} < 0\). Par P2.1 (cas concave), \(g\) est concave sur \(\mathbb{R}_+^*\). Appliquons l'inégalité de la tangente côté concave en \(a = 1\) : \(g(1) = 1\), \(g'(1) = 1/2\), donc la tangente est \(y = 1 + \frac{1}{2}(x - 1) = (x + 1)/2\). D'où $$ \sqrt{x} \le \frac{x + 1}{2} \qquad (x > 0). $$ En \(x = 0\), l'inégalité devient \(0 \le 1/2\), vraie. Par continuité de \(g\) en \(0\) (ou par calcul direct), l'inégalité s'étend à \(x \ge 0\).
Remarque --- convexité stricte
Une fonction \(f : I \to \mathbb{R}\) est strictement convexe sur \(I\) si, pour tout \(x \ne y\) dans \(I\) et tout \(\lambda \in \,]0 \,;\, 1[\), \(f((1 - \lambda) x + \lambda y) < (1 - \lambda) f(x) + \lambda f(y)\) (inégalité stricte). Pour les fonctions dérivables, \(f'\) strictement croissante sur \(I\) entraîne \(f\) strictement convexe. Pour \(f \in C^2\), la condition \(f'' > 0\) sur \(I\) est suffisante mais non nécessaire --- la fonction \(x \mapsto x^4\) est strictement convexe sur \(\mathbb{R}\) mais \(f''(0) = 0\).
Compétences à pratiquer
- Calculer une variance
II.3
Covariance\(\virgule\) bilinéarité\(\virgule\) identité de Bienaymé
Ex 15
Ex 16
Ex 17
Ex 18
Définition — Point d'inflexion
Soient \(f : I \to \mathbb{R}\) et \(a\) un point intérieur de \(I\). On dit que \(f\) admet un point d'inflexion en \(a\) s'il existe \(\eta > 0\) tel que \([a - \eta \,;\, a + \eta] \subset I\), \(f\) n'est affine sur aucun voisinage de \(a\), et l'une des deux situations suivantes a lieu : - \(f\) est convexe sur \([a - \eta \,;\, a]\) et concave sur \([a \,;\, a + \eta]\), ou
- \(f\) est concave sur \([a - \eta \,;\, a]\) et convexe sur \([a \,;\, a + \eta]\).
Piège --- \(f''(a) \equal 0\) ne suffit pas
Pour une fonction \(C^2\) vérifiant la définition par transition convexe/concave ci-dessus, \(f''(a) = 0\) est nécessaire mais non suffisante. Le contre-exemple standard est \(f(x) = x^4\) en \(a = 0\) : \(f''(x) = 12 x^2\) s'annule en \(0\) mais reste positif partout, donc \(f\) est convexe sur \(\mathbb{R}\) tout entier --- pas de transition convexe/concave, donc pas de point d'inflexion. La fiche d'exercices reprend ce piège explicitement.
Méthode — Trouver les points d'inflexion d'une fonction
Soit \(f\) de classe au moins \(C^2\) sur \(I\) : - Calculer \(f''\) explicitement sur \(I\).
- Résoudre \(f''(x) = 0\) pour obtenir l'ensemble des candidats \(\{a_1, a_2, \dots\}\).
- Pour chaque candidat \(a_i\), étudier le signe de \(f''\) au voisinage de \(a_i\) et vérifier s'il change de signe en \(a_i\).
- Conclure par P3.1 : tout candidat où \(f''\) change de signe donne un point d'inflexion ; les candidats où le signe ne change pas sont éliminés dans le cadre usuel \(C^2\).
Figure --- cubique et son point d'inflexion
La cubique \(f(x) = x^3 - 3 x\) vérifie \(f''(x) = 6 x\), donc l'unique point d'inflexion est en \(x = 0\). Le graphe est concave sur \(]-\infty \,;\, 0]\) et convexe sur \([0 \,;\, +\infty[\).
Compétences à pratiquer
- Appliquer l'identité de Bienaymé
II.4
Inégalités de Markov et de Bienaymé-Tchebychev
Ex 20
Ex 21
Ex 22
Ex 23
Ex 24
Ex 25
Compétences à pratiquer
- Majorer une probabilité par Markov ou Bienaymé-Tchebychev
II.5
Loi faible des grands nombres
Les entiers relatifs \(\mathbb{Z}\) forment, sous leurs addition et multiplication usuelles, un monde clos suffisamment riche pour accueillir une théorie complète de la divisibilité. Ce chapitre la développe en cinq étapes. On part de la relation de divisibilité \(b \mid a\) et du théorème de la division euclidienne \(a = bq + r\), le seul outil algorithmique qui transforme la question « \(b\) divise-t-il \(a\) ? » en la question « le reste est-il nul ? ». On construit ensuite, sur la division euclidienne, le plus grand commun diviseur \(a \wedge b\), à la fois via l'algorithme itératif d'Euclide et via l'identité de Bézout \(a \wedge b = a u + b v\). On isole le cas particulier \(a \wedge b = 1\) (entiers premiers entre eux) et on démontre le théorème de Bézout et le lemme de Gauss --- les deux moteurs de tous les raisonnements de divisibilité qui suivent. On introduit les nombres premiers, on démontre leur infinitude (Euclide) et l'existence/unicité de la décomposition en facteurs premiers \(n = \prod_p p^{v_p(n)}\), et on utilise la valuation \(p\)-adique \(v_p\) pour donner des formules explicites de \(a \wedge b\) et \(a \vee b\). On revient enfin sur la divisibilité sous une autre forme --- les congruences modulo \(n\) --- et on utilise la machinerie précédente pour caractériser l'inversibilité modulo \(n\) (\(a \wedge n = 1\)) et démontrer le petit théorème de Fermat \(a^p \equiv a \pmod p\) pour \(p\) premier.
L'approche est tout du long élémentaire : par convention dans ce chapitre, on ne fait pas appel au langage des structures algébriques. On évite donc, délibérément, toute référence aux groupes, anneaux, idéaux et morphismes ; l'ensemble \(\mathbb{Z}/n\mathbb{Z}\) apparaît dans la section sur les congruences seulement comme ensemble de \(n\) classes, avec un rappel explicite que sa structure d'anneau est hors programme et sera revue dans le chapitre Structures algébriques. Deux autres chapitres prolongent ce travail : Arithmétique des polynômes rejoue toute l'histoire pour \(\mathbb{K}[X]\) à la place de \(\mathbb{Z}\) (division euclidienne, PGCD, Bézout, Gauss, irréductibilité), et Structures algébriques reformule la divisibilité, les idéaux et l'arithmétique modulaire dans le cadre abstrait.
Convention permanente. Tout au long de ce chapitre, un diviseur est toujours un entier non nul. Chaque fois qu'on écrit « \(d \mid a\) », on suppose tacitement \(d \in \mathbb{Z}^*\). En particulier \(\operatorname{div}(0) = \mathbb{Z}^*\) (tout entier non nul divise \(0\)). On utilise \(\mathbb{N} = \{0, 1, 2, \dots\}\) et \(\mathbb{N}^* = \mathbb{N} \setminus \{0\}\). Les notations \(a \wedge b\) (plus grand commun diviseur) et \(a \vee b\) (plus petit commun multiple) sont standard.
L'approche est tout du long élémentaire : par convention dans ce chapitre, on ne fait pas appel au langage des structures algébriques. On évite donc, délibérément, toute référence aux groupes, anneaux, idéaux et morphismes ; l'ensemble \(\mathbb{Z}/n\mathbb{Z}\) apparaît dans la section sur les congruences seulement comme ensemble de \(n\) classes, avec un rappel explicite que sa structure d'anneau est hors programme et sera revue dans le chapitre Structures algébriques. Deux autres chapitres prolongent ce travail : Arithmétique des polynômes rejoue toute l'histoire pour \(\mathbb{K}[X]\) à la place de \(\mathbb{Z}\) (division euclidienne, PGCD, Bézout, Gauss, irréductibilité), et Structures algébriques reformule la divisibilité, les idéaux et l'arithmétique modulaire dans le cadre abstrait.
Convention permanente. Tout au long de ce chapitre, un diviseur est toujours un entier non nul. Chaque fois qu'on écrit « \(d \mid a\) », on suppose tacitement \(d \in \mathbb{Z}^*\). En particulier \(\operatorname{div}(0) = \mathbb{Z}^*\) (tout entier non nul divise \(0\)). On utilise \(\mathbb{N} = \{0, 1, 2, \dots\}\) et \(\mathbb{N}^* = \mathbb{N} \setminus \{0\}\). Les notations \(a \wedge b\) (plus grand commun diviseur) et \(a \vee b\) (plus petit commun multiple) sont standard.
Deux définitions, un théorème. La définition de la divisibilité est le point d'entrée du chapitre ; la division euclidienne est l'outil algorithmique qui convertit « \(b \mid a\) ? » en « le reste est-il nul ? ». La spécialité de Terminale couvre déjà les deux --- on les rappelle brièvement, on les énonce et démontre rigoureusement, et on étend l'énoncé de la division euclidienne aux dividendes négatifs.
Définition — Divisibilité
Soient \(a \in \mathbb{Z}\) et \(b \in \mathbb{Z}^*\). On dit que \(b\) divise \(a\), et on note \(b \mid a\), s'il existe \(k \in \mathbb{Z}\) tel que \(a = b k\). On dit aussi que \(a\) est un multiple de \(b\), ou que \(b\) est un diviseur de \(a\).Notations :
- \(a \mathbb{Z} = \{a k : k \in \mathbb{Z}\}\) est l'ensemble des multiples de \(a\) ;
- \(\operatorname{div}(a) = \{d \in \mathbb{Z}^* : d \mid a\}\) est l'ensemble des diviseurs de \(a\) (une partie de \(\mathbb{Z}^*\) par la convention permanente).
Exemple
Pour tout \(a \in \mathbb{Z}^*\), \(1 \mid a\), \(-1 \mid a\), \(a \mid a\), et \(-a \mid a\). Donc \(\{\pm 1, \pm a\} \subset \operatorname{div}(a)\) toujours ; pour \(a \in \mathbb{N}\) avec \(a \geq 2\), l'égalité \(\operatorname{div}(a) = \{\pm 1, \pm a\}\) caractérise les nombres premiers (voir la section sur les nombres premiers plus bas). Proposition — Propriétés de la divisibilité
Soient \(a, b, c, d \in \mathbb{Z}\) et \(u, v \in \mathbb{Z}\). - Réflexivité et transitivité. Pour tout \(a \in \mathbb{Z}^*\), \(a \mid a\). Si \(a \mid b\) et \(b \mid c\) (avec \(a, b \in \mathbb{Z}^*\)), alors \(a \mid c\).
- Entiers associés. Pour \(a, b \in \mathbb{Z}^*\), \(a \mid b \text{ et } b \mid a \iff |a| = |b|\). De tels entiers sont dits associés. En particulier, restreint à \(\mathbb{N}^*\) ceci redonne l'antisymétrie de \(\mid\) : \(a \mid b\) et \(b \mid a \iff a = b\).
- Combinaisons linéaires. Si \(d \mid a\) et \(d \mid b\), alors \(d \mid (a u + b v)\) pour tout \(u, v \in \mathbb{Z}\).
- Produit. Si \(a \mid b\) et \(c \mid d\) (avec \(a, c \in \mathbb{Z}^*\)), alors \(a c \mid b d\). En particulier \(a^k \mid b^k\) pour tout \(k \in \mathbb{N}^*\) lorsque \(a \mid b\).
Réflexivité / transitivité. \(a = a \cdot 1\) donne \(a \mid a\). Si \(b = a k\) et \(c = b k'\), alors \(c = a (k k')\) avec \(k k' \in \mathbb{Z}\), donc \(a \mid c\).
Antisymétrie sur \(\mathbb{N}^*\). Si \(a \mid b\) et \(b \mid a\), écrire \(b = a k\) et \(a = b k'\). Alors \(a = a (k k')\), donc \(k k' = 1\) (car \(a \neq 0\)). Avec \(k, k' \in \mathbb{Z}\), cela force \(k = k' = \pm 1\), donc \(|a| = |b|\). Réciproquement si \(|a| = |b|\) alors \(a = \pm b\), donc chacun divise l'autre.
Combinaisons linéaires. De \(a = d k\) et \(b = d k'\), \(a u + b v = d (k u + k' v) \in d \mathbb{Z}\).
Produit. De \(b = a k\) et \(d = c k'\), \(b d = (a c)(k k')\), donc \(a c \mid b d\).
Antisymétrie sur \(\mathbb{N}^*\). Si \(a \mid b\) et \(b \mid a\), écrire \(b = a k\) et \(a = b k'\). Alors \(a = a (k k')\), donc \(k k' = 1\) (car \(a \neq 0\)). Avec \(k, k' \in \mathbb{Z}\), cela force \(k = k' = \pm 1\), donc \(|a| = |b|\). Réciproquement si \(|a| = |b|\) alors \(a = \pm b\), donc chacun divise l'autre.
Combinaisons linéaires. De \(a = d k\) et \(b = d k'\), \(a u + b v = d (k u + k' v) \in d \mathbb{Z}\).
Produit. De \(b = a k\) et \(d = c k'\), \(b d = (a c)(k k')\), donc \(a c \mid b d\).
Exemple
\(5 \mid 15\) et \(5 \mid 25\), donc par la propriété de combinaison linéaire \(5 \mid (15 \cdot 3 - 25 \cdot 2) = 45 - 50 = -5\), en accord avec \(5 \mid (-5)\). Compétences à pratiquer
- Appliquer la loi faible des grands nombres
II.6
Synthèse : espérances et variances des lois usuelles
Méthode — Décider si \(b \mid a\)
Deux tests équivalents pour \(b \in \mathbb{Z}^*\), \(a \in \mathbb{Z}\) : - Test direct du quotient. Calculer \(a / b\) dans \(\mathbb{Q}\) ; vérifier si le résultat est entier.
- Test du reste (préféré pour \(a, b\) grands). Calculer la division euclidienne \(a = b q + r\) avec \(0 \leq r < |b|\) ; alors \(b \mid a \iff r = 0\) (sous-section suivante).
Compétences à pratiquer
- Reconnaître une loi usuelle à partir de ses moments
III
Fonctions génératrices d'une variable aléatoire à valeurs dans \(\mathbb{N}\)
III.1
Définition ; rayon de convergence
Ex 28
La division euclidienne convertit la question de divisibilité en question algorithmique. L'énoncé de Terminale couvre \(a \in \mathbb{N}\), \(b \in \mathbb{N}^*\) ; on étend à \(a \in \mathbb{Z}\), avec le même diviseur \(b \in \mathbb{N}^*\) et la même contrainte sur le reste \(0 \leq r < b\). Le cas négatif est le piège classique : les étudiants doivent se souvenir que \(r\) est toujours positif ou nul.
Theorem — Division euclidienne
Pour tout \(a \in \mathbb{Z}\) et tout \(b \in \mathbb{N}^*\), il existe un unique couple \((q, r) \in \mathbb{Z} \times \mathbb{N}\) tel que $$ \textcolor{colorprop}{a = b q + r \quad \text{et} \quad 0 \leq r < b.} $$ L'entier \(a\) est le dividende, \(b\) le diviseur, \(q\) le quotient et \(r\) le reste de la division euclidienne de \(a\) par \(b\). De plus \(q = \lfloor a / b \rfloor\) (où \(\lfloor \cdot \rfloor\) est la partie entière, de \(\mathbb{R}\) dans \(\mathbb{Z}\)).
Existence. Posons \(R = \{a - b k : k \in \mathbb{Z}\} \cap \mathbb{N}\). L'ensemble \(R\) est non vide : si \(a \geq 0\), alors \(a = a - b \cdot 0 \in R\) ; si \(a < 0\), alors \(k = a\) donne \(a - b a = a (1 - b) \geq 0\) car \(1 - b \leq 0\) et \(a < 0\), donc \(a - b a \in R\). Comme partie non vide de \(\mathbb{N}\), \(R\) admet un plus petit élément ; notons-le \(r\), et écrivons \(r = a - b q\) pour un certain \(q \in \mathbb{Z}\), soit \(a = b q + r\) avec \(r \geq 0\). Il reste à montrer \(r < b\). Supposons par l'absurde \(r \geq b\). Alors \(r - b \in \mathbb{N}\) et \(r - b = a - b (q + 1) \in R\), ce qui contredit la minimalité de \(r\). Donc \(r < b\).
Unicité. Supposons \(a = b q + r = b q' + r'\) avec \(0 \leq r, r' < b\). Alors \(b (q - q') = r' - r\), donc \(|b (q - q')| = |r' - r| < b\), ce qui force \(|q - q'| < 1\). Comme \(q - q' \in \mathbb{Z}\), \(q = q'\), et donc \(r = a - b q = a - b q' = r'\).
Formule pour \(q\). De \(a = b q + r\) avec \(0 \leq r < b\), on divise par \(b > 0\) : \(a / b = q + r / b\) avec \(0 \leq r/b < 1\), donc \(q = \lfloor a / b \rfloor\).
Unicité. Supposons \(a = b q + r = b q' + r'\) avec \(0 \leq r, r' < b\). Alors \(b (q - q') = r' - r\), donc \(|b (q - q')| = |r' - r| < b\), ce qui force \(|q - q'| < 1\). Comme \(q - q' \in \mathbb{Z}\), \(q = q'\), et donc \(r = a - b q = a - b q' = r'\).
Formule pour \(q\). De \(a = b q + r\) avec \(0 \leq r < b\), on divise par \(b > 0\) : \(a / b = q + r / b\) avec \(0 \leq r/b < 1\), donc \(q = \lfloor a / b \rfloor\).
Exemple — Dividende négatif --- piège classique
Pour \(a = -23\), \(b = 5\) : non \(-23 = 5 \cdot (-4) - 3\), car le reste vaudrait alors \(-3 < 0\). La division euclidienne correcte est $$ \textcolor{colorprop}{-23 = 5 \cdot (-5) + 2,} $$ donc \(q = -5\) et \(r = 2\). Vérification : \(\lfloor -23 / 5 \rfloor = \lfloor -4{,}6 \rfloor = -5\) (la partie entière de \(-4{,}6\) est \(-5\), pas \(-4\)). Le reste est toujours dans \(\{0, 1, \dots, b - 1\}\). Compétences à pratiquer
- Calculer une fonction génératrice
III.2
Indépendance et formule du produit
Ex 31
Le plus grand commun diviseur (PGCD) de deux entiers \(a\) et \(b\) est, intuitivement, le plus grand entier qui les divise tous les deux. Deux subtilités sont à signaler : (i) « plus grand » doit être précisé --- plus grand au sens de l'ordre naturel \(\leq\) sur \(\mathbb{N}^*\) ou plus grand au sens de l'ordre de divisibilité \(\mid\) ---, et le PGCD se trouve être le plus grand dans les deux sens ; (ii) le PGCD se calcule effectivement par l'algorithme d'Euclide, une suite itérée de divisions euclidiennes. On démontre ensuite l'identité centrale du chapitre : l'identité de Bézout \(a \wedge b = a u + b v\) pour certains \(u, v \in \mathbb{Z}\). De là la caractérisation « les diviseurs communs divisent le PGCD » tombe comme corollaire, et le PPCM \(a \vee b\) (ainsi que la formule \((a \wedge b)(a \vee b) = |a b|\)) suivent naturellement.
Définition — Plus grand commun diviseur (PGCD)
Soient \(a, b \in \mathbb{N}\) non tous deux nuls. Le plus grand commun diviseur de \(a\) et \(b\), noté \(a \wedge b\), est le plus grand élément de \(\{d \in \mathbb{N}^* : d \mid a \text{ et } d \mid b\}\) pour l'ordre naturel \(\leq\) sur \(\mathbb{N}^*\). Par convention, \(0 \wedge 0 = 0\).Extension à \(\mathbb{Z}\). Pour \(a, b \in \mathbb{Z}\) non tous deux nuls, on pose \(a \wedge b := |a| \wedge |b|\).
L'ensemble \(\{d \in \mathbb{N}^* : d \mid a \text{ et } d \mid b\}\) est non vide (il contient \(1\)). Il est aussi fini : si \(a\) et \(b\) sont tous deux non nuls, tout diviseur commun est majoré par \(\min(|a|, |b|)\) ; si par exemple \(a = 0\) et \(b \neq 0\), les diviseurs communs positifs sont exactement les diviseurs positifs de \(|b|\), donc sont majorés par \(|b|\). Donc le maximum existe.
Le calcul algorithmique du PGCD repose sur une seule observation : quand un entier est réduit modulo l'autre, le PGCD ne change pas. Itérée, cette règle donne l'algorithme d'Euclide, et le PGCD se lit comme le dernier reste non nul.
Theorem — Existence du PGCD par l'algorithme d'Euclide
Soient \(a, b \in \mathbb{N}\) avec \(0 < b \leq a\). Définir une suite de restes par $$ r_0 = a, \quad r_1 = b, \quad r_{k+2} = \text{reste de la division euclidienne de } r_k \text{ par } r_{k+1} \quad \text{tant que } r_{k+1} > 0. $$ La suite s'arrête : il existe \(N \geq 1\) tel que \(r_N = 0\), et le PGCD est le dernier reste non nul : $$ \textcolor{colorprop}{a \wedge b = r_{N - 1}.} $$
Terminaison. Tant que \(r_{k+1} > 0\), la construction donne \(0 \leq r_{k+2} < r_{k+1}\), donc la suite des restes strictement positifs \(r_1, r_2, \dots\) est strictement décroissante dans \(\mathbb{N}^*\). Une suite strictement décroissante dans \(\mathbb{N}\) est finie ; il existe \(N\) tel que \(r_N = 0\).
Correction. Par l'« idée fondamentale » appliquée à chaque étape (division euclidienne de \(r_k\) par \(r_{k+1}\) donne quotient \(q_k\) et reste \(r_{k+2}\), avec \(r_k = r_{k+1} q_k + r_{k+2}\)), \(r_k \wedge r_{k+1} = r_{k+1} \wedge r_{k+2}\) pour tout \(k \in \{0, \dots, N-2\}\). En enchaînant, $$ a \wedge b = r_0 \wedge r_1 = r_1 \wedge r_2 = \cdots = r_{N-1} \wedge r_N = r_{N-1} \wedge 0 = r_{N-1}. $$
Correction. Par l'« idée fondamentale » appliquée à chaque étape (division euclidienne de \(r_k\) par \(r_{k+1}\) donne quotient \(q_k\) et reste \(r_{k+2}\), avec \(r_k = r_{k+1} q_k + r_{k+2}\)), \(r_k \wedge r_{k+1} = r_{k+1} \wedge r_{k+2}\) pour tout \(k \in \{0, \dots, N-2\}\). En enchaînant, $$ a \wedge b = r_0 \wedge r_1 = r_1 \wedge r_2 = \cdots = r_{N-1} \wedge r_N = r_{N-1} \wedge 0 = r_{N-1}. $$
Compétences à pratiquer
- Déterminer la loi de \(X + Y\) par \(G_X G_Y\)
III.3
Moments à partir de la fonction génératrice
Méthode — Calculer \(a \wedge b\) par l'algorithme d'Euclide
Supposer \(0 < b \leq a\). Tabuler les divisions euclidiennes successives : - Étape 1 : \(a = b \, q_1 + r_2\) avec \(0 \leq r_2 < b\).
- Étape 2 : \(b = r_2 \, q_2 + r_3\) avec \(0 \leq r_3 < r_2\).
- Étape \(k\) : \(r_k = r_{k+1} \, q_{k+1} + r_{k+2}\) avec \(0 \leq r_{k+2} < r_{k+1}\).
- S'arrêter dès qu'un reste est nul. Le dernier reste non nul est \(a \wedge b\).
Exemple
Calculer \(1542 \wedge 58\).
On applique l'algorithme d'Euclide : $$ \begin{aligned} 1542 &= 26 \cdot 58 + 34, \\
58 &= 1 \cdot 34 + 24, \\
34 &= 1 \cdot 24 + 10, \\
24 &= 2 \cdot 10 + 4, \\
10 &= 2 \cdot 4 + 2, \\
4 &= 2 \cdot 2 + 0. \end{aligned} $$ Le dernier reste non nul est \(2\), donc \(1542 \wedge 58 = 2\).
L'identité de Bézout est la face « combinaison linéaire » du PGCD : \(a \wedge b\) s'écrit \(a u + b v\) pour certains \(u, v \in \mathbb{Z}\). La démonstration réutilise la suite d'Euclide : chaque reste \(r_k\) s'écrit comme combinaison \(\mathbb{Z}\)-linéaire de \(a\) et \(b\), par récurrence. En pratique, on déroule l'algorithme d'Euclide vers l'avant puis on remonte par substitution pour extraire un couple \((u, v)\).
Exemple — Non-unicité des coefficients de Bézout
\(4 \wedge 6 = 2\), et on peut vérifier à la fois $$ 2 = (-1) \cdot 4 + 1 \cdot 6 = 2 \cdot 4 + (-1) \cdot 6, $$ donc \((u, v) = (-1, 1)\) et \((u, v) = (2, -1)\) sont deux couples distincts de coefficients de Bézout. Méthode — Algorithme d'Euclide étendu
Pour calculer un couple de coefficients de Bézout, dérouler l'algorithme d'Euclide vers l'avant, puis remonter par substitution depuis le dernier reste non nul jusqu'aux entiers de départ.Étape 1 (descente). Tabuler \(r_0 = a\), \(r_1 = b\), \(r_{k+2} = r_k - q_k r_{k+1}\) jusqu'à ce qu'un \(r_N = 0\). Le PGCD est \(r_{N-1}\).
Cas particulier \(b \mid a\). Si le premier reste est nul (c'est-à-dire \(a = b q_0\)), alors \(a \wedge b = b\) et une identité de Bézout est immédiate : \(b = 0 \cdot a + 1 \cdot b\). Pas de remontée à effectuer.
Étape 2 (remontée). Sinon (l'algorithme comporte au moins deux divisions non triviales), en partant de \(r_{N-1} = r_{N-3} - q_{N-3} r_{N-2}\), substituer à plusieurs reprises l'équation précédente \(r_{N-2} = r_{N-4} - q_{N-4} r_{N-3}\) pour exprimer \(r_{N-1}\) comme combinaison \(\mathbb{Z}\)-linéaire de \(r_{N-3}\) et \(r_{N-4}\), puis de \(r_{N-5}\) et \(r_{N-4}\), \ldots, jusqu'à atteindre une combinaison de \(r_0 = a\) et \(r_1 = b\).
Exemple
Calculer des coefficients de Bézout de \(3080\) et \(525\).
Étape 1 (descente Euclide). $$ \begin{aligned} 3080 &= 5 \cdot 525 + 455, \\
525 &= 1 \cdot 455 + 70, \\
455 &= 6 \cdot 70 + 35, \\
70 &= 2 \cdot 35 + 0. \end{aligned} $$ Dernier reste non nul : \(35\), donc \(3080 \wedge 525 = 35\).
Étape 2 (remontée). $$ \begin{aligned} 35 &= 455 - 6 \cdot 70 \\ &= 455 - 6 \cdot (525 - 1 \cdot 455) = 7 \cdot 455 - 6 \cdot 525 \\ &= 7 \cdot (3080 - 5 \cdot 525) - 6 \cdot 525 = 7 \cdot 3080 - 41 \cdot 525. \end{aligned} $$ Donc \((u, v) = (7, -41)\) est un couple de coefficients de Bézout : \(35 = 7 \cdot 3080 - 41 \cdot 525\). Vérification : \(7 \cdot 3080 = 21560\), \(41 \cdot 525 = 21525\), \(21560 - 21525 = 35\). \(\checkmark\)
Étape 2 (remontée). $$ \begin{aligned} 35 &= 455 - 6 \cdot 70 \\ &= 455 - 6 \cdot (525 - 1 \cdot 455) = 7 \cdot 455 - 6 \cdot 525 \\ &= 7 \cdot (3080 - 5 \cdot 525) - 6 \cdot 525 = 7 \cdot 3080 - 41 \cdot 525. \end{aligned} $$ Donc \((u, v) = (7, -41)\) est un couple de coefficients de Bézout : \(35 = 7 \cdot 3080 - 41 \cdot 525\). Vérification : \(7 \cdot 3080 = 21560\), \(41 \cdot 525 = 21525\), \(21560 - 21525 = 35\). \(\checkmark\)
Compétences à pratiquer
- Calculer \(\mathbb{E}\) et \(\mathrm{V}\) via \(G_X\)
III.4
Fonctions génératrices des lois usuelles
Ex 33
Ex 34
Munis de l'identité de Bézout, la caractérisation du PGCD par son ensemble de diviseurs tombe comme un corollaire immédiat.
Proposition — Les diviseurs communs sont les diviseurs du PGCD
Pour tout \(a, b \in \mathbb{Z}\) non tous deux nuls, $$ \textcolor{colorprop}{\operatorname{div}(a) \cap \operatorname{div}(b) = \operatorname{div}(a \wedge b).} $$ De manière équivalente : un entier non nul divise à la fois \(a\) et \(b\) si et seulement s'il divise \(a \wedge b\). En conséquence, \(a \wedge b\) est aussi le plus grand diviseur commun au sens de la divisibilité \(\mid\) : tout diviseur commun de \(a\) et \(b\) divise \(a \wedge b\).
Posons \(d = a \wedge b\). On montre \(\operatorname{div}(a) \cap \operatorname{div}(b) = \operatorname{div}(d)\) par double inclusion.
- \((\supset)\) Comme \(d = a \wedge b\) divise à la fois \(a\) et \(b\) (par définition), tout diviseur de \(d\) divise aussi \(a\) et \(b\) par transitivité, donc appartient à \(\operatorname{div}(a) \cap \operatorname{div}(b)\).
- \((\subset)\) Soit \(\delta \in \operatorname{div}(a) \cap \operatorname{div}(b)\). Par l'identité de Bézout, \(d = a u + b v\) pour certains \(u, v \in \mathbb{Z}\). Comme \(\delta \mid a\) et \(\delta \mid b\), la propriété des combinaisons linéaires donne \(\delta \mid (a u + b v) = d\), donc \(\delta \in \operatorname{div}(d)\).
Compétences à pratiquer
- Reconnaître une loi à partir de sa fonction génératrice
Aller à la section