Sommaire
ITableaux croisés d'effectifsAPopulations, intersection, réunionBTableaux croisés d'effectifsIIReprésentations graphiques adaptées à l'analyse croisée de deux caractèresADiagrammes en barresBDiagrammes circulairesCNuages de pointsIIITravail sur les fichiers de donnéesL'analyse de l'information chiffrée est omniprésente dans le monde qui nous entoure et notamment sur des problématiques d'actualité (développement durable, changement climatique, biodiversité, économie, démographie, santé publique, etc.). Après avoir vu en 2nde des indicateurs permettant d'analyser les séries à une variable, on va s'intéresser maintenant aux séries bivariés (deux variables).
Tableaux croisés d'effectifs
Une série de donnée bivariée est souvent donnée sous la forme d'un tableau croisé d'effectifs. On lit alors l'effectif d'une sous-population répondant à deux critères à l'intersection d'une ligne et d'une colonne.
Populations, intersection, réunion
Afin de permettre l'utilisation de tableau croisé d'effectifs, il est important de comprendre les notions d'ensembles (ou population), d'intersection de sous-ensembles (ou sous-populaion) et de réunion de sous-ensembles.
Cardinal d'une population
Soit E une population sur laquelle on étudie un (ou des) caractère(s).
On appelle cardinal de la population E l'effectif de cette population.
On le note \text{Card}(E).
On considère une classe de 30 élèves sur laquelle on étudie un caractère.
En notant E cette population, on a :
\text{Card}(E)=30.
Intersection de deux sous-populations
Soit E une population sur laquelle on étudie un (ou des) caractère(s).
Soit A et B deux sous-populations de la population E.
On appelle intersection des sous-populations A et B, la sous-population, notée A\cap B des éléments appartenant aux deux sous-populations A et B.
Dans une population E constituée d'une classe de 30 élèves de 1ère générale, on note A la sous-population des élèves suivant la spécialité mathématiques et B la sous-population des élèves suivant la spécialité LLCE Anglais.
L'intersection A\cap B de ces deux sous-populations est la sous-population des élèves suivant la spécialité mathématiques et la spécialité LLCE Anglais.
Réunion de deux sous-populations
Soit E une population sur laquelle on étudie un (ou des) caractère(s).
Soit A et B deux sous-populations de la population E.
On appelle réunion des sous-populations A et B, la sous-population, notée A\cup B des éléments appartenant à au moins l'une des deux sous-populations A et B.
Dans une population E constituée d'une classe de 30 élèves de 1ère générale, on note A la sous-population des élèves suivant la spécialité mathématiques et B la sous-population des élèves suivant la spécialité LLCE Anglais.
La réunion A\cup B de ces deux sous-populations est la sous-population des élèves suivant au moins l'une des deux spécialités parmi la spécialité mathématiques et la spécialité LLCE Anglais.
Soit E une population sur laquelle on étudie un (ou des) caractère(s).
Soit A et B deux sous-populations de la population E.
Alors, \text{Card}(A\cup B)=\text{Card}(A)+\text{Card}(B)-\text{Card}(A\cap B).
Dans une population E constituée d'une classe de 30 élèves de 1ère générale, on note A la sous-population des élèves suivant la spécialité mathématiques et B la sous-population des élèves suivant la spécialité LLCE Anglais.
On sait que \text{Card}(A)=20, \text{Card}(B)=15 et \text{Card}(A\cap B)=10.
Comme \text{Card}(A\cup B)=\text{Card}(A)+\text{Card}(B)-\text{Card}(A\cap B), on obtient :
\text{Card}(A\cup B)=20+15-10
\text{Card}(A\cup B)=25
Dans cette classe il y a donc 25 élèves qui suivent au moins l'une des deux spécialités parmi la spécialité mathématiques et la spécialité LLCE Anglais.
Tableaux croisés d'effectifs
Les tableaux croisés d'effectifs permettent de dénombrer les individus d'une population en fonction de deux caractères étudiés.
Tableau croisé d'effectifs
Soit deux sous-populations A et B d'une même population E.
On peut croiser ces deux variables dans un tableau croisé d'effectifs, à deux entrées.
B | \overline{B} | Total | |
A | \text{Card}\left(A\cap B\right) | \text{Card}\left(A\cap \overline{B}\right) | \text{Card}\left(A\right) |
\overline{A} | \text{Card}\left(\overline{A}\cap B\right) | \text{Card}\left(\overline{A}\cap \overline{B}\right) | \text{Card}\left(\overline{A}\right) |
Total | \text{Card}\left(B\right) | \text{Card}\left(\overline{B}\right) | \text{Card}\left(E\right) |
Les deux colonnes et lignes nommées "Total" sont appelées les marges du tableau.
À la dernière évaluation de mathématiques, les notes de la classe (ensemble noté E) se sont réparties dans ce tableau croisé d'effectifs :
S (note \geq 10) | I (note <10) | Total | |
F (filles) | 9 | 4 | 13 |
G (garçons) | 8 | 3 | 11 |
Total | 17 | 7 | 24 |
On lit alors :
\text{Card}(E)=24
\text{Card}(F)=13
\text{Card}(G)=11
\text{Card}(S)=17
\text{Card}(I)=7
\text{Card}(F\cap S)=9
\text{Card}(F\cap I)=4
\text{Card}(G\cap S)=8
\text{Card}(G\cap I)=3
Représentations graphiques adaptées à l'analyse croisée de deux caractères
Afin de rendre plus visuel et donc parfois plus parlant un tableau de données, on peut représenter ces données en utilisant des graphiques.
Diagrammes en barres
Lorsque l'on souhaite représenter une série de données croisant deux caractères, on peut utiliser un diagramme en barres.
Pour représenter graphiquement les données d'un tableau croisé d'effectifs, on peut utiliser un diagramme en barres superposées.
Voici les notes obtenues à la dernière évaluation de mathématiques dans une classe de 25 élèves :
Notes | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
Filles | 1 | 0 | 2 | 1 | 0 | 3 | 0 | 2 | 0 | 0 | 2 | 0 | 0 | 1 | 1 |
Garçons | 1 | 2 | 0 | 1 | 1 | 0 | 0 | 3 | 0 | 3 | 0 | 1 | 0 | 0 | 0 |
On peut représenter les données de tableau croisé d'effectifs par le diagramme en barres suivant que l'on peut obtenir avec un tableur :
Diagrammes circulaires
Lorsque l'on souhaite représenter une série de données croisant deux caractères, on peut utiliser un diagramme circulaire.
Pour représenter graphiquement les données d'un tableau croisé d'effectifs, on peut utiliser un diagramme circulaire.
On reprend l'exemple précédent.
Voici les notes obtenues à la dernière évaluation de mathématiques dans une classe de 25 élèves :
Notes | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
Filles | 1 | 0 | 2 | 1 | 0 | 3 | 0 | 2 | 0 | 0 | 2 | 0 | 0 | 1 | 1 |
Garçons | 1 | 2 | 0 | 1 | 1 | 0 | 0 | 3 | 0 | 3 | 0 | 1 | 0 | 0 | 0 |
On peut représenter les données de tableau croisé d'effectifs par le diagramme circulaire suivant (la couronne intérieure est celle des garçons, celle extérieure est celle des filles) que l'on peut obtenir avec un tableur :
Nuages de points
Lorsque l'on souhaite représenter une série de données croisant deux caractères, on peut utiliser un nuage de points.
Pour représenter graphiquement les données d'un tableau croisé d'effectifs, on peut utiliser un nuage de points.
On reprend l'exemple précédent.
Voici les notes obtenues à la dernière évaluation de mathématiques dans une classe de 25 élèves :
Notes | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
Filles | 1 | 0 | 2 | 1 | 0 | 3 | 0 | 2 | 0 | 0 | 2 | 0 | 0 | 1 | 1 |
Garçons | 1 | 2 | 0 | 1 | 1 | 0 | 0 | 3 | 0 | 3 | 0 | 1 | 0 | 0 | 0 |
On peut représenter les données de tableau croisé d'effectifs par le nuage de points suivant que l'on peut obtenir avec un tableur :
Travail sur les fichiers de données
Lorsque l'on a à analyser des données à partir d'un fichier, il est très utile de pouvoir filtrer ces données en fonction de la valeur d'un certain caractère, voire de combiner plusieurs filtres.
Avec un tableur, on peut sélectionner un sous-ensemble d'individus en utilisant par exemple
- un filtre automatique
- une condition ET
- une condition OU
- une condition NON
Voici une partie de la liste des élèves d'un groupe de LLCE Anglais contenant quelques informations :
NOM | Prénom | Année naissance | Classe | Régime | Sexe |
ABDEL | Moustapha | 2008 | 1A | Externe | H |
DURAND | Maxime | 2007 | 1A | DP | H |
EINSTEIN | Albert | 2007 | 1C | DP | H |
MORIN | Paul | 2006 | 1E | DP | H |
PEGASE | Ursula | 2007 | 1A | Interne | F |
ZORRO | Elsa | 2008 | 1C | Externe | F |
Les tableurs permettent d'extraire un sous-ensemble d'individus de plusieurs façons parmi lesquelles on trouve les filtres.
On peut par exemple choisir "Auto-filtre" (Menu Données) qui permet de filtrer les données du fichier à partir de n'importe quelle donnée de n'importe quelle colonne. On peut par exemple choisir de filtrer les données précédentes et n'afficher que les élèves dont le régime est "DP".
On peut également choisir un "Filtre standard" qui permet de n'afficher que les élèves vérifiant une condition particulière. On peut cumuler les conditions avec les opérateurs logiques ET, OU, NON.
En filtrant les élèves ayant une année de naissance égale à 2007 ET un régime égal à DP, on obtient :
NOM | Prénom | Année naissance | Classe | Régime |
DURAND | Maxime | 2007 | 1A | DP |
EINSTEIN | Albert | 2007 | 1C | DP |
En filtrant les élèves ayant une année de naissance égale à 2007 OU un régime égal à DP, on obtient :
NOM | Prénom | Année naissance | Classe | Régime |
ABDEL | Moustapha | 2008 | 1A | Externe |
DURAND | Maxime | 2007 | 1A | DP |
EINSTEIN | Albert | 2007 | 1C | DP |
MORIN | Paul | 2006 | 1E | DP |
ZORRO | Elsa | 2008 | 1C | Externe |
On peut également filtrer les élèves dont l'année de naissance n'est pas 2007. On obtient :
NOM | Prénom | Année naissance | Classe | Régime |
ABDEL | Moustapha | 2008 | 1A | Externe |
MORIN | Paul | 2006 | 1E | DP |
ZORRO | Elsa | 2008 | 1C | Externe |