Sommaire
ILes séries statistiquesAVocabulaireBLes séries quantitatives discrètesCLes séries quantitatives regroupées en classesDLes séries qualitativesIILes paramètres de position d'une série quantitativeALa moyenneBLes médianesCLes quartilesIIILes représentations graphiquesALes diagrammes en bâtonsBLes histogrammesCLes diagrammes en boîte (ou boîtes à moustaches)Les séries statistiques
Vocabulaire
Population
Une population est un ensemble d'individus.
Les enfants nés à Paris en 2000 représentent une population.
Les voitures produites dans une usine au cours du mois de février 2010 représentent également une population.
Echantillon
Lorsque l'effectif d'une population est trop important, on étudie ses caractères à partir d'un échantillon représentatif qui est une partie de la population.
Si on veut par exemple étudier l'ensemble de la population française, il est préférable d'étudier un échantillon de cette population car l'effectif est trop grand.
Caractère
Un caractère est une caractéristique qui définit les individus d'une population, et dont les valeurs sont différentes d'un individu à un autre de la population.
La taille, le poids, l'âge sont des exemples des caractères.
Caractère quantitatif ou caractère qualitatif
Un caractère peut être quantitatif si ses valeurs sont numériques, ou qualitatif si ses valeurs ne sont pas numériques.
La taille est un caractère quantitatif alors que la couleur des yeux est un caractère qualitatif.
Les séries quantitatives discrètes
Série quantitative discrète
Soient n et p deux entiers naturels non nuls et i un entier naturel compris entre 1 et p.
On appelle série quantitative discrète une liste de n réels : ce sont les valeurs d'un caractère pour chacun des individus composant l'échantillon d'effectif total n. Pour étudier une telle série, on compte le nombre d'apparition n_{i} (effectif) de chaque réel de la liste, de manière à identifier p réels x_{i} distincts. On présente alors la série sous la forme de p couples :
\left(x_{i} ; n_{i}\right)
La série des pointures des 12 garçons d'une classe de seconde est donnée par la liste suivante :
{ (39 ; 2) ; (40 ; 3) ; (41 ; 5) ; (42 ; 1) ; (44 ; 1) }
Il y a donc parmi ces 12 garçons :
- Deux qui chaussent du 39
- Trois qui chaussent du 40
- Cinq qui chaussent du 41
- Un qui chausse du 42
- Un qui chausse du 44
On présente en général une série quantitative discrète à l'aide d'un tableau.
x_{i} | x_{1} | x_{2} | ... | x_{p} |
---|---|---|---|---|
n_{i} | n_{1} | n_{2} | ... | n_{p} |
La série des pointures des 12 garçons d'une classe de seconde, donnée par la liste suivante : { (39 ; 2) ; (40 ; 3) ; (41 ; 5) ; (42 ; 1) ; (44 ; 1) } peut être résumée dans un tableau.
Pointure x_i | 39 | 40 | 41 | 42 | 44 |
---|---|---|---|---|---|
Effectif n_i | 2 | 3 | 5 | 1 | 1 |
Effectif total
L'effectif total est la somme des effectifs de chaque valeur. C'est donc l'effectif de la population que l'on étudie ou de l'échantillon si on étudie un échantillon.
n =n_{1} + n_{2} +... + n_{p}
Pointure x_i | 39 | 40 | 41 | 42 | 44 | TOTAL |
---|---|---|---|---|---|---|
Effectif n_i | 2 | 3 | 5 | 1 | 1 | 12 |
L'effectif total est :
n=2 +3+5+1+1=12
Fréquence des x_i
La fréquence des x_i est le rapport de l'effectif d'une valeur par l'effectif total.
f_{i} = \dfrac{n_{i}}{n}
Pointure x_i | 39 | 40 | 41 | 42 | 44 | TOTAL |
---|---|---|---|---|---|---|
Effectif n_i | 2 | 3 | 5 | 1 | 1 | 12 |
Fréquence f_i | \dfrac{2}{12} | \dfrac{3}{12} | \dfrac{5}{12} | \dfrac{1}{12} | \dfrac{1}{12} | 1 |
La somme des fréquences d'une série est égale à 1.
f_{1}+f_{2}+...+f_{p}= 1
Pointure x_i | 39 | 40 | 41 | 42 | 44 | TOTAL |
---|---|---|---|---|---|---|
Effectif n_i | 2 | 3 | 5 | 1 | 1 | 12 |
Fréquence f_i | \dfrac{2}{12} | \dfrac{3}{12} | \dfrac{5}{12} | \dfrac{1}{12} | \dfrac{1}{12} | 1 |
On a bien :
\dfrac{2}{12}+\dfrac{3}{12}+\dfrac{5}{12}+\dfrac{1}{12}+\dfrac{1}{12}=1
Les séries quantitatives regroupées en classes
Série quantitative regroupée en classes
Une série quantitative regroupée en classes (de même amplitude ou non), ou série continue, est une série quantitative dont les valeurs x_{i} sont regroupées par intervalles de réels.
Taille (en cm) | [10 ; 20[ | [20 ; 25[ | [25 ; 40[ | [40 ; 50] |
---|---|---|---|---|
Effectif | 11 | 8 | 16 | 3 |
Les séries qualitatives
Série qualitative
Une série qualitative est une suite de valeurs d'un caractère non quantitatif.
Couleur | Rouge | Bleu | Vert | Jaune |
---|---|---|---|---|
Effectif | 12 | 28 | 7 | 13 |
Les paramètres de position d'une série quantitative
La moyenne
Moyenne
On appelle moyenne d'une série, généralement notée \overline{x}, le réel :
\overline{x} =\dfrac{n_{1} x_{1} + n_{2} x_{2} +... + n_{p} x_{p}}{n}
Le tableau d'effectifs suivant présente les notes obtenues par un groupe d'élèves :
Note | 5 | 8 | 9 | 10 | 10,5 | 11 | 13 | 14 | 14,5 | 16 |
---|---|---|---|---|---|---|---|---|---|---|
Nombre d'élèves | 1 | 3 | 5 | 6 | 2 | 5 | 6 | 1 | 2 | 1 |
On peut ainsi calculer facilement la moyenne pondérée (arrondie au dixième) :
m = \dfrac{5 \times 1 + 8 \times 3 + 9 \times 5 + 10 \times 6 + 10{,}5 \times 2 + 11 \times 5 + 13 \times 6 + 14 \times 1 + 14{,}5 \times 2 + 16 \times 1}{32} \approx 10{,}8
Pour une série regroupée en classes, on détermine une valeur approchée de la moyenne en remplaçant chaque classe par son centre.
On considère la série statistique suivante :
Taille x (en cm) | 10 \leq x \lt 20 | 20 \leq x \lt 25 | 25 \leq x \lt 40 | 40 \leq x \leq 50 |
---|---|---|---|---|
Centre de la classe (cm) | 15 | 22,5 | 32,5 | 45 |
Effectif | 11 | 8 | 16 | 3 |
La moyenne des tailles est donc :
m\approx\dfrac{15\times11+22{,}5\times8+32{,}5\times16+45\times3}{11+8+16+3}\approx26{,}3 cm (arrondie au dixième)
On peut calculer la moyenne d'une série en utilisant la fréquence de chaque valeur :
\overline{x} =f_{1} x_{1}+f_{2} x_{2}+...+f_{p} x_{p}.
On considère la série statistique suivante :
Pointure x_i | 39 | 40 | 41 | 42 | 44 | TOTAL |
---|---|---|---|---|---|---|
Effectif n_i | 2 | 3 | 5 | 1 | 1 | 12 |
Fréquence f_i | \dfrac{2}{12} | \dfrac{3}{12} | \dfrac{5}{12} | \dfrac{1}{12} | \dfrac{1}{12} | 1 |
On calcule la moyenne :
\overline{x}=39\times\dfrac{2}{12}+40\times\dfrac{3}{12}+41\times \dfrac{5}{12}+42\times \dfrac{1}{12}+44\times\dfrac{1}{12}=\dfrac{163}{4}=40{,}75
Les médianes
Médiane
On appelle médiane d'une série rangée par ordre croissant toute valeur qui partage la série en deux séries de même effectif.
On considère une série dont les valeurs des n individus sont rangées par ordre croissant.
- Si n est impair, on prend en général pour médiane la \dfrac{n+1}{2}^{\text{ème}} valeur de la série ordonnée.
- Si n est pair, on prend en général pour médiane le centre de l'intervalle \left[\dfrac{n}{2}^{\text{ème}} \text{ valeur ; }\dfrac{n}{2}+ 1 ^{\text{ème}} \text{ valeur}\right].
Une médiane de la série : 3, 5, 6, 11, 14, 21, 27 est la valeur 11.
Une médiane de la série : 12, 13, 14, 19, 31, 41 est la valeur arbitraire 16,5.
Ne pas confondre le rang d'une médiane et sa valeur.
Une médiane n'est pas toujours une valeur observée dans la série statistique.
Lorsque la série est une série continue, on prend comme médiane la valeur pour laquelle on obtient une fréquence cumulée de 50%.
Lors d'un devoir commun, les notes de tout l'établissement ont été regroupées en classes.
Notes | \left[ 0;4 \right[ | \left[ 4;8 \right[ | \left[ 8;10 \right[ | \left[ 10;12 \right[ | \left[ 12;16 \right[ | \left[ 16;20 \right[ |
---|---|---|---|---|---|---|
Centre de la classe | 2 | 6 | 9 | 11 | 14 | 18 |
Effectifs | 21 | 46 | 117 | 123 | 86 | 7 |
Fréquences (en %) | 5,25 | 11,5 | 29,25 | 30,75 | 21,5 | 1,75 |
Fréquences cumulées croissantes (en %) | 5,25 | 16,75 | 46 | 76,75 | 98,25 | 100 |
Le graphique (ou polygone) des fréquences cumulées croissantes (F.C.C.) est alors le suivant :
On y lit que 10,26 est une médiane de cette série
Les quartiles
Premier quartile
Le premier quartile est la plus petite valeur, notée Q_1, d'une série, rangée par ordre croissant, telle qu'au moins 25% de l'effectif lui soit inférieur ou égal.
On considère la série suivante issue d'un échantillon de taille 8 : 3, 4, 5, 6, 11, 14, 21, 27.
Comme \dfrac{25}{100}\times{8}=2, le premier quartile de cette série est son deuxième élément soit 4.
On considère la série suivante issue d'un échantillon de taille 7 : 10, 12, 13, 14, 19, 31, 41.
Comme \dfrac{25}{100}\times7=1{,}75, le premier quartile de cette série est son deuxième élément soit 12.
Troisième quartile
Le troisième quartile est la plus petite valeur, notée Q_3, d'une série, rangée par ordre croissant, telle qu'au moins 75% de l'effectif lui soit inférieur ou égal.
On considère la série suivante issue d'un échantillon de taille 8 : 3, 4, 5, 6, 11, 14, 21, 27.
Comme \dfrac{75}{100}\times8=6, le troisième quartile de cette série est son sixième élément soit 14.
On considère la série suivante issue d'un échantillon de taille 7 : 10, 12, 13, 14, 19, 31, 41.
Comme \dfrac{75}{100}\times7=5{,}25, le troisième quartile de cette série est son sixième élément soit 31.
Ecart interquartile
L'écart interquartile est le réel Q_{3} - Q_{1}.
L'écart interquartile de la série 3, 4, 5, 6, 11, 14, 21, 27 est la valeur 14 - 4 = 10.
L'écart interquartile de la série : 10, 12, 13, 14, 19, 31, 41 est la valeur 31 - 12 = 19.
Alors que la médiane n'est pas toujours une valeur observée, les quartiles sont des valeurs observées.
Lorsque la série est une série à caractère continu :
- On choisit comme premier quartile la valeur pour laquelle on obtient une fréquence cumulée de 25%.
- On choisit comme troisième quartile la valeur pour laquelle on obtient une fréquence cumulée de 75%.
On reprend l'exemple précédent des notes et le polygone des fréquences cumulées croissantes :
On obtient graphiquement :
- Q_1\approx 8{,}56
- Q_3\approx 11{,}89
Les représentations graphiques
Les diagrammes en bâtons
Diagramme en bâtons
Pour représenter une série non regroupée en classes, on peut construire un diagramme en bâtons : on associe un bâton à chacune des valeurs distinctes de la série, dont la hauteur est proportionnelle à l'effectif.
On considère la série statistique suivante :
Couleur | Rouge | Bleu | Vert | Jaune |
---|---|---|---|---|
Effectif | 12 | 28 | 7 | 13 |
Le diagramme en bâtons suivant représente la série de ce tableau, où un carreau en hauteur est égal à un effectif de 4.
Les histogrammes
Histogramme
Pour représenter une série regroupée en classes, on peut construire un histogramme : on associe un rectangle à chacune des classes de la série, dont l'aire est proportionnelle à l'effectif.
On considère la série statistique suivante :
Taille (en cm) | [5 ; 20[ | [20 ; 30[ | [30 ; 40[ | [40 ; 60] |
---|---|---|---|---|
Effectif | 12 | 8 | 16 | 4 |
L'histogramme suivant représente la série de ce tableau, où un carreau en abscisse est égal à 5 cm et l'aire d'un carreau est égale à un effectif de 1.
Les diagrammes en boîte (ou boîtes à moustaches)
Diagramme en boîte
Un diagramme en boîte est un diagramme donnant la position du minimum, du maximum, des quartiles et de la médiane choisie d'une série.
On représente, au-dessus d'un axe donnant les valeurs, un rectangle dont un des côtés donne la position de Q_1 et le côté opposé la position de Q_3. On ajoute une marque, dans ce rectangle, pour indiquer la position de la médiane choisie. On ajoute enfin des "moustaches" aux extrémités.
Dans l'exemple précédent des notes, on obtient le diagramme en boîte suivant :
Un tel diagramme peut permettre de comparer deux séries si l'on représente les diagrammes en boîte des deux séries au-dessus du même axe.