Lorsque l'on connaît la fréquence d'apparition f d'un caractère c dans un échantillon de taille n, on peut estimer la proportion p du caractère dans la population à l'aide d'un intervalle de confiance.
Dans un échantillon de 100 élèves interrogés après les résultats du baccalauréat, 82 déclarent avoir réussi l'examen. Donner un intervalle de confiance à 95% de la proportion des élèves ayant eu le baccalauréat cette année.
Montrer que les conditions sont vérifiées
Les trois conditions suivantes doivent être vérifiées :
- n\geqslant30
- np\geqslant5
- n\left(1-p\right)\geqslant5
Comme on ne connaît pas la valeur de p, on vérifie ces conditions en remplaçant p par f, la fréquence observée sur l'échantillon. On suppose alors que comme elles sont vérifiées pour f, elles le sont également pour p.
On a ici n=100 et f=\dfrac{82}{100}=0{,}82.
De plus :
- nf=82 donc nf \geqslant 5
- n\left(1-f\right)=100\times\left(1-0{,}82\right)=18 donc n\left(1-f\right)\geqslant5
Les conditions étant vérifiées pour f, on peut supposer qu'elles le sont également pour p.
Donner l'intervalle de confiance
D'après le cours, l'intervalle de confiance à 95% du paramètre p est :
IC=\left[f-\dfrac{1}{\sqrt{n}} ; f+\dfrac{1}{\sqrt{n}} \right]
D'après le cours, l'intervalle de confiance à 95% du paramètre p est :
IC=\left[f-\dfrac{1}{\sqrt{n}} ; f+\dfrac{1}{\sqrt{n}} \right]
Comme ici n=100 et f=0{,}82, on a :
IC=\left[0{,}82-\dfrac{1}{\sqrt{100}} ; 0{,}82+\dfrac{1}{\sqrt{100}} \right]=\left[0{,}72;0{,}92\right]