\( \definecolor{colordef}{RGB}{249,49,84} \definecolor{colorprop}{RGB}{18,102,241} \)

Échantillonnage

L'échantillonnage est un domaine à la croisée des statistiques et des probabilités. Ce domaine intervient dans les situations où l'on veut étudier certaines propriétés d'une population de trop grand effectif pour être observée de façon exhaustive. On prélève alors un échantillon de cette population pour obtenir des informations sur la population totale avec un certain degré de précision.

Notion d'échantillon

Définition Échantillon aléatoire
Un échantillon aléatoire de taille \(n\) est constitué des résultats de \(n\) répétitions indépendantes de la même expérience aléatoire.
Exemple
Un sac opaque contient des boules bleus ou rouges. On tire au hasard un jeton du sac, on note sa couleur, puis on le replace dans le sac. En répétant ce procédé \(n\) fois, on constitue un échantillon de boules du sac.

Fluctuation d'échantillonnage

Définition Fluctuation d'échantillonnage
Dans une population, on note \(p\) la proportion d'individus présentant un certain caractère. Lorsqu'on prélève un échantillon et qu'on observe la fréquence \(f\) d'apparition de ce caractère, on constate que \(f\) varie d'un échantillon à l'autre. Ce phénomène est appelé fluctuation d'échantillonnage.
Exemple
Dans un lycée, il y a \(63\,\pourcent\) de filles (\(p=0,63\)). Dans 10 échantillons de taille 50, les fréquences observées de filles fluctuent autour de la proportion réelle :
Échantillon 1 2 3 4 5 6 7 8 9 10
Pourcentage de filles \(62\,\pourcent\) \(68\,\pourcent\) \(60\,\pourcent\) \(68\,\pourcent\) \(66\,\pourcent\) \(68\,\pourcent\) \(68\,\pourcent\) \(54\,\pourcent\) \(66\,\pourcent\) \(70\,\pourcent\)
On constate que les fréquences fluctuent autour de la proportion réelle de la population de 0,63.

La loi des grands nombres

Proposition Loi des grands nombres
Lorsque la taille \(n\) de l'échantillon devient grande, la fréquence observée \(f\) d'un caractère a tendance à se rapprocher de la probabilité réelle \(p\).
Exemple
Lors du lancer d'une pièce équilibrée, la probabilité d'obtenir Pile est \(p = 0{,}5\). Une simulation informatique de différentes tailles d'échantillon donne :
Taille \(n\) 100 1 000 10 000 100 000
Nombre de Faces 54 490 5 010 49 942
Fréquence \(f\) 0,54 0,49 0,501 0,49942
À mesure que \(n\) augmente, la fréquence \(f\) se rapproche de \(0{,}5\).

Estimation

Définition Estimation
Lorsque la proportion réelle \(p\) d'un caractère est inconnue, on utilise la fréquence \(f\) observée dans un échantillon aléatoire comme une estimation de \(p\).
Exemple
Avant un référendum, un sondage est réalisé auprès de 1 200 personnes. Si 636 personnes répondent « Oui », la fréquence observée est :$$ f = \frac{636}{1200} = 0{,}53 $$Ainsi, une estimation de la proportion de votants « Oui » dans l'ensemble du pays est \(0{,}53\) (soit \(53\pourcent\)).