\( \definecolor{colordef}{RGB}{249,49,84} \definecolor{colorprop}{RGB}{18,102,241} \)

Statistiques

Processus d'enquête statistique

Les statistiques sont partout autour de nous, des moyennes sportives aux bulletins d'information sur la météo.
  • Un joueur de basket-ball marque en moyenne 14,6 points par match.
  • L'année dernière a été l'année la plus chaude jamais enregistrée depuis 1897.
Définition Statistiques
Les statistiques sont la science qui consiste à concevoir des enquêtes, puis à collecter, organiser, analyser et interpréter des données pour répondre à une question spécifique.
Méthode Processus d'enquête statistique
Une enquête statistique suit ces cinq étapes clés :
  1. Poser la question : Définir clairement ce que l'on veut étudier.
  2. Collecter les données : Rassembler les informations pertinentes pour la question.
  3. Analyser les données : Calculer des statistiques descriptives, comme des effectifs, des moyennes ou des modes.
  4. Représenter les données : Afficher les données organisées de manière visuelle avec des graphiques.
  5. Interpréter les données : Tirer des conclusions pour répondre à la question.

Étape 1 : Poser la question

Définition Problème statistique
Un problème statistique est une question claire et précise à laquelle on peut répondre en collectant et en analysant des données.
Exemple
Étudions le problème : « Quelle est la matière scolaire préférée des élèves de notre école ? »
Définition Population
Une population est l'ensemble des personnes ou des objets que tu veux étudier.
Exemple
Pour notre problème, la population est l'ensemble des élèves de notre école.
Définition Données
Les données sont l’ensemble des informations qu’on collecte, comme des chiffres, des mots, des mesures ou des observations.
Exemple
Les données que nous collectons seront la liste des réponses de chaque élève, comme « Maths », « Arts », « Sciences », « Arts », « Sport », etc.
Définition Types de variables
Les données peuvent être décrites par différents types de variables :
  • Variable qualitative (catégorielle) : décrit une qualité ou une catégorie. Les réponses possibles sont des mots ou des étiquettes. Pense à : « Quel type ? » (par ex. : couleur des yeux, plat préféré).
  • Variable quantitative (numérique) : décrit une quantité ou un nombre que l'on peut compter ou mesurer. Pense à : « Combien ? » ou « Combien de ? » (par ex. : taille, nombre de frères et sœurs).
Exemple
Pour notre enquête :
  • La variable « Matière préférée » est qualitative car les réponses sont des catégories (Maths, Arts, etc.).
  • La variable « Combien d'heures consacres-tu à tes devoirs par semaine ? » est quantitative car la réponse sera un nombre qui peut être mesuré (par ex., 2 heures, 5 heures).

Étape 2 : Collecter les données

Lorsque nous menons une enquête, nous devons décider auprès de qui collecter les données. Devons-nous interroger toute la population, ou seulement un groupe plus restreint ?
Définition Recensement ou Sondage
  • Un recensement collecte des données auprès de chaque membre de la population. C'est précis mais peut être très lent et coûteux pour de grandes populations.
  • Un sondage (ou échantillonnage) collecte des données auprès d'un groupe plus petit et gérable issu de la population, appelé un échantillon. C'est beaucoup plus rapide, mais l'échantillon doit être choisi avec soin pour être représentatif de l'ensemble de la population.
Exemple
Une enquête pose la question : « Quelle est la matière préférée des élèves de cette école ? »
Si tu interroges chaque élève de l'école, est-ce un recensement ou un sondage ?

C’est un recensement car tu collectes des données auprès de toute la population (tous les élèves de l'école).

Exemple
Une enquête pose la question : « Quelle est la matière préférée des élèves de cette école ? »
Si tu n'interroges que les élèves de ta classe de maths, est-ce un recensement ou un sondage ?

C’est un sondage car tu ne collectes des données que d'un petit échantillon (ta classe de maths) de la population totale (toute l'école).

Méthode Collecter et enregistrer les données d'une enquête
Une fois que tu as ta question et que tu as identifié ta population, tu as besoin d'une méthode systématique pour collecter et enregistrer les réponses. Pour un recensement d'un petit groupe (comme ta classe), un tableau de comptage est un outil efficace.
  1. Préparer un tableau de comptage : Avant de commencer, crée un tableau avec une colonne pour chaque catégorie de réponse possible et une colonne pour les bâtons.
  2. Mener l'enquête : Pose la question de l'enquête à chaque personne de ta population, une par une.
  3. Enregistrer chaque réponse : Pour chaque réponse que tu reçois, place un bâton dans la ligne de la catégorie correspondante. N'oublie pas de faire du cinquième bâton une ligne diagonale qui barre les quatre premiers pour faciliter le comptage.
Exemple
Collecter des données pour la question « Quelle est ta matière préférée ? »
Au fur et à mesure que tu interroges chacun des 25 élèves, tu remplis la colonne des bâtons. Après avoir interrogé les 25 élèves, ton tableau de comptage ressemblerait à ceci :
Matière Bâtons
Maths
Sciences
Sport
Arts

Étape 3 : Analyser les données (Fréquence)

Définition Effectif et fréquence
L’effectif est le nombre de fois que chaque catégorie apparaît dans nos données.
La fréquence (ou fréquence relative) est la proportion des données qui correspond à une catégorie. On peut l'écrire sous forme de fraction, de nombre décimal ou de pourcentage.$$ \text{Fréquence (en }\pourcent\text{)} = \frac{\text{Effectif}}{\text{Effectif total}} \times 100\pourcent $$
Exemple
On calcule les fréquences relatives pour notre enquête sur la « Matière préférée » auprès de 25 élèves :
Matière Effectif Fréquence
Maths 8 \(8/25\times 100\pourcent = 32\pourcent\)
Sciences 5 \(5/25\times 100\pourcent = 20\pourcent\)
Sport 7 \(7/25\times 100\pourcent = 28\pourcent\)
Arts 5 \(5/25\times 100\pourcent = 20\pourcent\)
Total 25 100\(\pourcent\)

Étape 3 : Analyser les données (Tendance centrale)

Définition Mesures de tendance centrale
Une mesure de tendance centrale est une valeur unique qui tente de décrire un ensemble de données en identifiant la position centrale au sein de cet ensemble. Les principales mesures sont la moyenne, la médiane et le mode.
Définition Mode
Le mode est la valeur ou la catégorie qui apparaît le plus souvent. Un ensemble de données peut avoir plus d'un mode.
Exemple
Les résultats de l'enquête « Matière préférée » sont présentés dans le tableau d'effectifs ci-dessous.
Matière Effectif
Maths 8
Sciences 5
Sport 7
Arts 5
Quel est le mode de cet ensemble de données ?

Le mode est la catégorie qui a l'effectif le plus élevé. En regardant le tableau, l'effectif le plus élevé est 8.
La matière correspondant à cet effectif est les Maths. Par conséquent, le mode est Maths. C'est la matière préférée.

Définition Moyenne
La moyenne est la somme de toutes les valeurs numériques divisée par le nombre de valeurs.$$ \bar{x} = \frac{\text{somme de toutes les valeurs}}{\text{nombre de valeurs}} $$
Exemple
Pour l'ensemble de données \(1, 4, 2, 3, 5, 4, 5, 4, 4\), quelle est la moyenne ?

$$ \text{Moyenne} = \frac{1 + 4 + 2 + 3 + 5 + 4 + 5 + 4 + 4}{9} = \frac{32}{9} \approx 3,56 $$

Définition Médiane
La médiane est la valeur centrale d'un ensemble de données qui a été ordonné du plus petit au plus grand.
  • S’il y a un nombre impair de valeurs, la médiane est l'unique valeur du milieu.
  • S’il y a un nombre pair de valeurs, il y a deux valeurs centrales et la médiane est la moyenne de ces deux valeurs.
Exemple
Pour l'ensemble de données \(1, 4, 2, 3, 5, 4, 5, 4, 4\), quelle est la médiane ?

  1. Ordonner les données : \(1, 2, 3, 4, 4, 4, 4, 5, 5\).
  2. Trouver la valeur centrale : Il y a 9 valeurs (un nombre impair), donc la valeur du milieu est la 5ième. $$1, 2, 3, 4, \underline{4}, 4, 4, 5, 5$$
La médiane est 4.

Étape 3 : Analyser les données (Dispersion)

Définition Mesures de dispersion
Une mesure de dispersion décrit à quel point les valeurs d'un ensemble de données sont variées ou « étalées ». Connaître la dispersion nous donne une image plus complète que la seule tendance centrale.
Exemple
Considérons les notes de deux élèves :
  • Notes de l'élève A : 10, 50, 90
  • Notes de l'élève B : 45, 50, 55
Les deux élèves ont la même note moyenne (50), mais les notes de l'élève A sont très dispersées (grande dispersion), tandis que celles de l'élève B sont très constantes (faible dispersion).
Définition Étendue
L'étendue est la différence entre la valeur maximale et la valeur minimale d’un ensemble de données. Elle donne une mesure rapide de la dispersion totale.$$ \text{Étendue} = \text{Valeur maximale} - \text{Valeur minimale} $$
Exemple
Détermine l’étendue pour les données : \(1, 19, 10, 2, 18, 10, 5, 15, 10\).

La valeur minimale est 1 et la valeur maximale est 19.
L’étendue est \(19 - 1 = 18\).

Définition Quartiles et Écart Interquartile
Les quartiles sont les valeurs qui divisent un ensemble de données ordonné en quatre parties égales.
  • Le premier quartile (Q1) est la médiane de la moitié inférieure des données.
  • La médiane (Q2) est la médiane de l'ensemble des données.
  • Le troisième quartile (Q3) est la médiane de la moitié supérieure des données.
Lorsqu'il y a un nombre impair de valeurs, on ne compte pas la médiane (Q2) dans la moitié inférieure ni dans la moitié supérieure pour calculer Q1 et Q3.
L'écart interquartile (EIQ) est l'étendue des 50\(\pourcent\) du milieu des données. Il est moins affecté par les valeurs extrêmes que l'étendue.$$ \text{EIQ} = Q_3 - Q_1 $$
Exemple
Trouve les quartiles et l’écart interquartile pour les données : \(1, 19, 10, 2, 18, 10, 5, 15, 10\).

  1. Ordonner les données : \(1, 2, 5, 10, 10, 10, 15, 18, 19\).
  2. Trouver la médiane (Q2) : La valeur du milieu est la 5ième, donc \(Q_2 = 10\). $$ 1, 2, 5, 10, \underline{10}, 10, 15, 18, 19 $$
  3. Partager les données en deux moitiés (sans Q2) : Moitié inférieure : \(1, 2, 5, 10\) \(\quad\) Moitié supérieure : \(10, 15, 18, 19\).
  4. Trouver le premier quartile (Q1) : Trouver la médiane de la moitié inférieure. $$ 1, \underline{2, 5}, 10 \rightarrow Q_1 = \frac{2+5}{2} = 3,5 $$
  5. Trouver le troisième quartile (Q3) : Trouver la médiane de la moitié supérieure. $$ 10, \underline{15, 18}, 19 \rightarrow Q_3 = \frac{15+18}{2} = 16,5 $$
  6. Calculer l'EIQ : $$ \text{EIQ} = Q_3 - Q_1 = 16,5 - 3,5 = 13 $$
L'écart interquartile est de 13.

Étape 4 : Représenter les données

Une fois les données organisées dans un tableau, nous pouvons créer des graphiques pour voir les tendances visuellement. Les diagrammes en bâtons sont excellents pour comparer les effectifs, tandis que les diagrammes circulaires sont idéaux pour montrer les proportions.
Définition Diagramme en bâtons
Un diagramme en bâtons utilise des barres rectangulaires où la hauteur de chaque barre représente son effectif. Il peut être utilisé pour des données qualitatives ou quantitatives.
  • Pour les données qualitatives (catégorielles), chaque barre représente une catégorie distincte (ex : « Maths », « Sciences »). Les barres sont généralement dessinées avec des espaces entre elles pour montrer que les catégories sont séparées.
  • Pour les données quantitatives (numériques), chaque barre représente un nombre spécifique (ex : une note de « 3 » ou « 4 frères et sœurs »). Les nombres sont placés dans l'ordre sur l'axe horizontal.
Exemple
Trace un diagramme en bâtons pour nos données de l'enquête « Matière préférée ».
Matière Effectif
Maths 8
Sciences 5
Sport 7
Arts 5


Définition Diagramme circulaire
Un diagramme circulaire montre la proportion de chaque catégorie sous forme de part d'un cercle. Si la fréquence relative d'une catégorie est écrite sous forme décimale (par exemple \(0{,}32\)), l'angle de sa part se calcule ainsi :$$ \text{Angle} = \text{fréquence relative} \times 360^\circ. $$
Exemple
Trace un diagramme circulaire pour nos données de l'enquête « Matière préférée » (Total = 25 élèves).
Matière Effectif Fréquence
Maths 8 \(32\pourcent\)
Sciences 5 \(20\pourcent\)
Sport 7 \(28\pourcent\)
Arts 5 \(20\pourcent\)

D'abord, calculons l'angle pour chaque part :
  • Maths : \(0{,}32 \times 360^\circ \approx 115^\circ\)
  • Sciences : \(0{,}20 \times 360^\circ = 72^\circ\)
  • Sport : \(0{,}28 \times 360^\circ \approx 101^\circ\)
  • Arts : \(0{,}20 \times 360^\circ = 72^\circ\)

Étape 5 : Interpréter les données

Méthode Une méthode pour interpréter les données
L'interprétation est l'étape finale et la plus importante. C'est là que tu expliques l'histoire que racontent tes données. Suis ces étapes pour rédiger une bonne interprétation.
  1. Énoncer les principaux résultats : Commence par décrire les points les plus évidents. Quelle est la catégorie la plus populaire (le mode) ? Quelle est la moins populaire ?
  2. Faire des comparaisons : Utilise des mots de comparaison (par ex., « plus que », « moins que », « deux fois plus ») pour comparer les différentes catégories. Fais des calculs simples si nécessaire.
  3. Utiliser des données spécifiques comme preuves : Appuie tes affirmations avec des chiffres. Utilise les effectifs (comptes) ou les fréquences (pourcentages) de ton tableau ou graphique.
  4. Tirer une conclusion : Rédige une phrase de conclusion qui répond directement à ta question statistique de départ.
  5. Réfléchir et poser de nouvelles questions : Pense à ce que tes données ne te disent pas. Ce résultat s'applique-t-il à toute l'école, ou seulement à ta classe ? Que pourrais-tu étudier ensuite ?
Exemple Interprétation de l'enquête « Matière préférée »
Appliquons la méthode en 5 étapes pour interpréter les résultats de notre enquête sur les matières préférées.
Matière Effectif Fréquence
Maths 8 \(32\pourcent\)
Sciences 5 \(20\pourcent\)
Sport 7 \(28\pourcent\)
Arts 5 \(20\pourcent\)
  • Principaux résultats : Les données montrent que les Maths sont la matière la plus populaire. Les matières les moins populaires sont les Sciences et les Arts, qui sont à égalité.
  • Comparaisons : Plus d'élèves ont choisi les Maths (8) que le Sport (7). Le nombre d'élèves qui préfèrent les Sciences est le même que ceux qui préfèrent les Arts (5).
  • Preuves : Les Maths sont la matière préférée pour 32\(\pourcent\) de la classe, ce qui en fait clairement le mode.
  • Conclusion : En conclusion, d'après notre enquête auprès de 25 élèves, la matière préférée dans cette classe est les mathématiques.
  • Réflexion : Cette conclusion ne s'applique qu'à notre classe de 25 élèves. Une nouvelle question pour une future enquête pourrait être : « Les Maths sont-elles aussi la matière préférée dans toute l'école ? »