Sommaire
IProbabilité et indépendanceIILoi binomialeIIILois à densitéAGénéralitésBLoi uniformeCLoi exponentielleDLoi normaleIVIntervalle de fluctuation et estimationProbabilité et indépendance
Probabilité conditionnelle
Soient A et B deux événements, avec A de probabilité non nulle.
On définit la probabilité de B sachant A par :
P_{A}\left(B\right) =\dfrac{P\left(A \cap B\right)}{P\left(A\right)}
Événements indépendants
Deux événements A et B sont indépendants si et seulement si :
P\left(A \cap B\right) = P\left(A\right) \times P\left(B\right)
Formule des probabilités totales
Soit {E_{1}, E_{2}, E_{3},..., E_{k}} un système complet d'événements de l'univers \Omega.
Alors, pour tout événement A de E :
P\left(A\right) = P\left(A \cap E_{1}\right) + P\left(A \cap E_{2}\right) + P\left(A \cap E_{3}\right) +... + P\left(A \cap E_{k}\right)
Loi binomiale
Loi binomiale
Soient un réel p compris entre 0 et 1 et n un entier naturel non nul.
Le nombre de succès dans la répétition de n épreuves de Bernoulli identiques et indépendantes suit la loi binomiale de paramètres n et p.
Une variable aléatoire suit ainsi la loi binomiale de paramètres n et p, notée B\left(n ; p\right), si :
- X\left(\Omega\right) = [\![0 ; n]\!]
- \forall k \in [\![0 ; n]\!] \text{ , } P\left(X = k\right) =\binom{n}{k}p^{k} \left(1 - p\right)^{n-k}
Le coefficient \binom{n}{k} est égal au nombre de possibilités de placer les k succès parmi les n répétitions.
Espérance et variance d'une loi binomiale
Si X suit la loi binomiale de paramètres n et p, on a :
E\left(X\right) = np
V\left(X\right) = np\left(1 - p\right)
Lois à densité
Généralités
Densité de probabilité
Une fonction f est une densité de probabilité sur un intervalle \left[a;b\right] si elle vérifie les conditions suivantes :
- f est continue sur \left[a;b\right], sauf peut-être en un nombre fini de valeurs
- f\left(x\right)\geq 0 sur \left[a;b\right]
- \int_{a}^{b}f\left(x\right)dx=1
Variable aléatoire continue
Soit X une variable aléatoire définie sur un intervalle I.
On dit que X est une variable aléatoire continue s'il existe une densité de probabilité f telle que pour tout intervalle J inclus dans I, p\left(X\in J\right)=\int_J f\left(x\right)dx.
Espérance
Soit X une variable aléatoire continue définie sur un intervalle I de densité de probabilité f.
On appelle espérance de X le réel :
E\left(X\right)=\int_I xf\left(x\right)dx.
Loi uniforme
Loi uniforme sur \left[a;b\right]
Fonction de densité sur \left[a;b\right] | f\left(x\right)=\dfrac{1}{b-a} |
---|---|
Probabilité | Pour tous réels c et d tels que a \leq c \leq d \leq b : P\left(c \leq X \leq d\right) = \dfrac{d-c}{b-a} |
Espérance | E\left(X\right) = \dfrac{a+b}{2} |
Loi exponentielle
Loi exponentielle de paramètre \lambda\gt0
Fonction de densité sur \left[0;+\infty\right[ | f\left(t\right)=\lambda e^{-\lambda t} |
---|---|
Probabilité | P\left(a \leq X \leq b\right) =\int_{a}^{b}\lambda e^{-\lambda t} \ \mathrm dt |
Espérance | E\left(X\right) = \dfrac{1}{\lambda} |
Soit un réel positif a.
- P\left(X \leq a\right) =\int_{0}^{a}\lambda e^{-\lambda t} \ \mathrm dt= 1 - e^{-\lambda a}
- P\left(X \gt a\right) = 1 - P\left(X \leq a\right) = e^{-\lambda a}
Loi de durée de vie sans vieillissement
Soit T une variable aléatoire suivant la loi exponentielle de paramètre \lambda (\lambda\gt0).
Pour tous réels positifs t et h :
P_{\, T \geq t}\left(T\geq t+h\right)=P\left(T\geq h\right)
Si X est une variable aléatoire continue suivant une loi sans vieillissement, alors elle suit une loi exponentielle.
Demi-vie
Soit X une variable aléatoire continue suivant une loi exponentielle de paramètre \lambda.
On appelle demi-vie le réel \tau tel que \int_{0}^{\tau}\lambda e^{-\lambda x}dx=\dfrac{1}{2}.
Avec les notations précédentes, on a :
\tau=\dfrac{\ln\left(2\right)}{\lambda}
Loi normale
Loi normale centrée réduite N\left(0;1\right)
Fonction de densité sur \mathbb{R} | f\left(x\right) = \dfrac{1}{\sqrt{2\pi }} e^{-\frac{x^2}{2}} |
---|---|
Probabilité | P\left(X \leq a\right) = \dfrac{1}{\sqrt{2\pi }}\int_{-\infty }^{a}e^{-\frac{t^2}{2}} \ \mathrm dt |
Espérance | E\left(X\right) = 0 |
Variance | V\left(X\right)=1 |
Loi normale \mathcal{N}\left(\mu;\sigma^2\right)
Définition | Une variable aléatoire X suit la loi normale \mathcal{N}\left(\mu;\sigma^2\right) si la variable aléatoire \dfrac{X-\mu}{\sigma} suit la loi normale centrée réduite. |
---|---|
Espérance | E\left(X\right) = \mu |
Variance | V\left(X\right)=\sigma^2 |
Valeurs remarquables de la loi normale
Si X suit la loi normale \mathcal{N}\left(\mu;\sigma^2\right), on a les valeurs remarquables suivantes :
P\left(\mu - \sigma \leq X \leq\mu + \sigma\right) \approx 0{,}683
P\left(\mu - 2\sigma \leq X \leq \mu + 2\sigma\right) \approx 0{,}954
P\left(\mu - 3\sigma \leq X \leq \mu + 3\sigma\right) \approx 0{,}997
Si X suit la loi normale N\left(0;1\right), alors :
P\left(-1 \leq X \leq 1\right) \approx 0{,}683
P\left(- 2\leq X \leq 2\right) \approx 0{,}954
P\left(- 3 \leq X \leq 3\right) \approx 0{,}997
Si X suit la loi normale N\left(0;1\right), alors :
P\left(-1{,}96\leq X\leq 1{,}96\right)\approx 0{,}95
P\left(-2{,}58\leq X\leq 2{,}58\right)\approx 0{,}99
Intervalle de fluctuation et estimation
Théorème de Moivre-Laplace
Soit X_n une variable aléatoire suivant la loi binomiale \mathcal{B}\left(n;p\right) , pour tout entier n \gt 0 on définit la variable aléatoire Z_n par :
Z_n = \dfrac{X_n-np}{\sqrt{np\left(1-p\right)}}
Pour tous réels a et b, ( a \lt b ), on a alors :
\lim\limits_{n \to +\infty } P\left(a \leq Z_n \leq b\right) = \dfrac{1}{\sqrt{2\pi }}\int_{a}^{b}e^{-\frac{t^2}{2}} \ \mathrm dt
Intervalle de fluctuation
Soient Z une variable aléatoire suivant la loi normale centrée réduite, \alpha un réel de \left]0;1\right[ et u_{\alpha } l'unique réel positif tel que P\left(-u_{\alpha } \leq Z \leq u_{\alpha }\right) = 1-\alpha .
Si pour tout entier n \gt 0, X_n est une variable aléatoire suivant la loi binomiale \mathcal{B}\left(n;p\right) , on pose :
I_n = \left[ p - u_{\alpha } \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt{n}} ; p + u_{\alpha } \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt{n}} \right]
Et on a alors :
\lim\limits_{n \to +\infty } P\left(\dfrac{X_n}{n} \in I_n \right) = 1-\alpha
L'intervalle I_n est appelé intervalle de fluctuation de \dfrac{X_n}{n} au seuil 1-\alpha , si les conditions suivantes sont satisfaites :
n \geq 30 \text{ , } np \geq 5 \text{ , } n\left(1-p\right) \geq 5
Il s'agit de l'intervalle de fluctuation au seuil de \alpha de la fréquence d'un caractère dans un échantillon. Ce caractère a une fréquence p dans la population dont est issu l'échantillon de taille n . C'est donc l'intervalle centré sur p dans lequel on s'attend à trouver la fréquence du caractère étudié avec une probabilité d'au moins 1-\alpha .
En particulier, pour \alpha = 0{,}05, \left[ p - 1{,}96 \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt{n}} ; p + 1{,}96 \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt{n}} \right] est un intervalle de fluctuation au seuil de 95% de la fréquence d'apparition d'un caractère dans un échantillon aléatoire de taille n (à condition d'avoir n \geq 30 \text{ , } np \geq 5 \text{ , } n\left(1-p\right) \geq 5 ).
Soit X_n une variable aléatoire suivant une loi binomiale B\left(n;p\right) où p est la proportion inconnue d'apparition d'un caractère, et F_n=\dfrac{X_n}{n} la fréquence associée à X_n.
Alors, pour n assez grand, p appartient à l'intervalle \left[F_n-\dfrac{1}{\sqrt{n}};F_n+\dfrac{1}{\sqrt{n}}\right] avec une probabilité supérieure ou égale à 0,95.
Dans la pratique, on utilise les mêmes conditions que pour les intervalles de fluctuation :
- n\geq 30
- n\times F_n\geq 5
- n\times \left(1-F_n\right)\geq 5
Intervalle de confiance
Avec les notations de la propriété précédente, l'intervalle \left[F_n-\dfrac{1}{\sqrt{n}};F_n+\dfrac{1}{\sqrt{n}}\right] est appelé intervalle de confiance de \dfrac{X_n}{n} au niveau de confiance 0,95.
Les intervalles de confiance précédents ont une amplitude de \dfrac{2}{\sqrt{n}}, déterminer la taille minimale des échantillons à utiliser pour obtenir une amplitude inférieure à un réel a revient donc à résoudre, dans \mathbb{N}, l'inéquation \dfrac{2}{\sqrt{n}}\leq a.
On utilise un intervalle de fluctuation quand :
- On connaît la proportion p de présence du caractère étudié dans la population,
- OU, on formule une hypothèse sur la valeur de cette proportion (on est alors dans le cas de la "prise de décision").
On utilise un intervalle de confiance quand on ignore la valeur de la proportion p de présence du caractère dans la population, et on ne formule pas d'hypothèse sur cette valeur.