Les intervalles de fluctuation
Intervalle de fluctuation
Soient Z une variable aléatoire suivant la loi normale centrée réduite, \alpha un réel de \left]0;1\right[ et u_{\alpha } l'unique réel positif tel que p\left(-u_{\alpha } \leq Z \leq u_{\alpha }\right) = 1-\alpha .
Si X_n est une variable aléatoire suivant la loi binomiale \mathcal{B}\left(n;p\right), on pose :
I_n = \left[ p - u_{\alpha } \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt{n}} ; p + u_{\alpha } \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt{n}} \right]
Et on a alors :
\lim\limits_{n \to +\infty } p\left(\dfrac{X_n}{n} \in I_n \right) = 1-\alpha
L'intervalle I_n est appelé intervalle de fluctuation de \dfrac{X_n}{n} au seuil 1-\alpha , si les conditions suivantes sont satisfaites :
- n \geq 30
- np \geq 5
- n\left(1-p\right) \geq 5
Il s'agit de l'intervalle de fluctuation au seuil de \left(1-\alpha\right) de la fréquence d'un caractère dans un échantillon. Ce caractère a une fréquence p dans la population dont est issu l'échantillon de taille n. C'est donc l'intervalle centré sur p dans lequel on s'attend à trouver la fréquence du caractère étudié avec une probabilité de \left(1-\alpha\right).
Dans ce cas, la proportion du caractère étudié dans la population, ou la probabilité de l'observer en situation d'équiprobabilité, sont connues.
En particulier, pour \alpha = 0{,}05, un intervalle de fluctuation au seuil de 95\% de la fréquence d'apparition d'un caractère dans un échantillon aléatoire de taille n (à condition d'avoir n \geq 30, np \geq 5 et n\left(1-p\right) \geq 5 ) est :
I=\left[ p - 1{,}96 \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt{n}} ; p + 1{,}96 \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt{n}} \right]
Un fabricant de calculatrices commande auprès de son fournisseur deux types de composants électroniques : CA365 et TI512. Il demande 900 composants de chaque sorte.
Au moment de la livraison, le service de contrôle retire 50 composants.
Quel est l'intervalle de fluctuation asymptotique au seuil 0,95 de la fréquence de composants CA365 ?
Le fabricant a commandé autant de composants de chaque sorte. On peut donc supposer que la proportion de composants CA365 est égale à 0,5.
La taille de l'échantillon est n=50.
Vérifions si les paramètres n est p répondent aux conditions imposées :
- n=50\geq30
- n\times p=50\times 0{,}5=25\geq5
- n\times \left(1-p\right)=50\times 0{,}5=25\geq5
L'intervalle de fluctuation asymptotique au seuil 0,95 est alors :
I=\left[ 0{,}5 - 1{,}96\times \dfrac{\sqrt{0{,}5\times0{,}5}}{\sqrt{50}} ; 0{,}5 + 1{,}96\times \dfrac{\sqrt{0{,}5\times0{,}5}}{\sqrt{50}} \right]
Soit, après calculs :
I=\left[ 0{,}361;0{,}639 \right]
Un intervalle de fluctuation asymptotique peut servir à prendre une décision par rapport à une hypothèse émise, à savoir accepter l'hypothèse ou la rejeter. Lorsque la proportion du caractère étudié dans une population est supposée être égale à p, on peut, si les conditions suivantes sont vérifiées, accepter ou rejeter l'hypothèse à partir d'une fréquence observée sur un échantillon de taille n.
- n\geqslant30
- np\geqslant5
- n\left(1-p\right)\geqslant5
On note I l'intervalle de fluctuation asymptotique au seuil de 95% obtenu à partir de l'hypothèse de la proportion p :
- Si f\in I, alors on accepte l'hypothèse faite sur la proportion p.
- Si f\notin I, alors on rejette l'hypothèse faite sur la proportion p avec un risque de 5% de se tromper.
Les intervalles de confiance
Intervalle de confiance
On considère une expérience de Bernoulli dont on veut estimer la probabilité de succès p. On appelle f_n la fréquence d'apparition du succès après n répétitions indépendantes. Si les trois conditions suivantes sont vérifiées :
- n \geq 30
- nf_n \geq 5
- n\left(1-f_n\right) \geq 5
Alors p appartient à l'intervalle suivant avec un niveau de confiance de 95\% :
I_C=\left[ f_n - \dfrac{1}{\sqrt{n}} ; f_n + \dfrac{1}{\sqrt{n}} \right]
Il s'agit d'un intervalle de confiance à 95% de la proportion p du caractère étudié dans la population. C'est donc un intervalle centré sur f dans lequel on s'attend à trouver la proportion p avec une probabilité de 95%.
On dispose d'une urne contenant un grand nombre de boules blanches et noires. La proportion de boules blanches contenues dans l'urne n'est pas connue. On réalise un tirage de 100 boules et on obtient 54 boules blanches.
La fréquence observée est donc f=0{,}54.
L'intervalle de confiance de la proportion de boules blanches dans l'urne au niveau de confiance 95% est :
I_C=\left[ 0{,}54 - \dfrac{1}{\sqrt{100}} ; 0{,}54 + \dfrac{1}{\sqrt{100}} \right]
Soit, après calculs :
I_C=\left[ 0{,}44;0{,}64 \right]
Dans cette configuration, la proportion ou probabilité de succès p est inconnue.