Fiche de mathématiques
> >

Intervalle de fluctuation et estimation

Partager :
Prérequis :
Ces thèmes ont déjà été abordés en seconde et première. Il est donc souhaitable de connaître les cours des années précédentes. Tu auras besoin, pour pouvoir comprendre les démonstrations du cours de bien maîtriser le cours sur la loi binomiale de 1reS ainsi que celui sur la loi normale de TS.

Enjeu :
Il y a plusieurs objectifs dans ce chapitre. Le premier consiste, à partir d'une probabilité théorique, de prendre des décisions à l'aide de fréquences observées sur un échantillon. Le second, à l'inverse, est de fournir un intervalle dans lequel doit se trouver une probabilité théorique, qu'on ne peut pas calculer, à partir d'un échantillon représentatif. Il faut être très attentif aux énoncés proposés pour pouvoir répondre convenablement aux questions posées.


1 Intervalle de fluctuation

Dans cette partie, on connaît la probabilité d'apparition P d'un événement.
Voyons tout d'abord un résultat lié à la loi binomiale et la loi normale centrée réduite.
On considère un entier naturel n et une variable aléatoire Xn qui suit la loi binomiale \mathscr{B}(n,p) de paramètres n et p. La variable aléatoire F_n=\dfrac{X_n}{n} correspond à la fréquence de succès pour un schéma de Bernouilli de paramètres n et p. Cette variable aléatoire prend donc les valeurs suivantes : 0; \dfrac{1}{n}; \dfrac{2}{n}; \ldots; 1.
Propriété :
Pour tout réel \alpha\in]0;1[, on a :
\lim\limits_{n \to +\infty} P\left(F_n \in \left[p-u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\;;\;p+u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\right]\right)=1-\alpha


Remarques :
\bullet u_{\alpha} est l'unique réel déterminé dans le chapitre sur la loi normale pour lequel on a P\left(-u_{\alpha} \leqslant X\leqslant u_{\alpha}\right)=1-\alpha quand X suit la loi normale centrée réduite.
\bullet L'intervalle I_n=\left[p-u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\;;\;p+u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\right] est appelé intervalle de fluctuation asymptotique au seuil 1-\alpha.
Démonstration :
 \begin{array}{rl} F_n \in I_n &\Leftrightarrow p-u_\alpha\dfrac{\sqrt{p(1-p)}}{\sqrt{n}} \leqslant \dfrac{X_n}{n} \leqslant p+u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}} \\\\ &\Leftrightarrow np-u_{\alpha}\dfrac{n\sqrt{p(1-p)}}{\sqrt{n}} \leqslant X_n \leqslant p+u_{\alpha}\dfrac{n\sqrt{p(1-p)}}{\sqrt{n}} \\\\ &\Leftrightarrow np-u_{\alpha}\sqrt{np(1-p)} \leqslant X_n \leqslant np+u_{\alpha}\sqrt{np(1-p)} \\\\ &\Leftrightarrow -u_{\alpha}\sqrt{np(1-p)} \leqslant X_n-np \leqslant u_{\alpha}\sqrt{np(1-p)} \\\\ &\Leftrightarrow -u_{\alpha}\leqslant \dfrac{X_n-np}{\sqrt{np(1-p)}} \leqslant u_{\alpha} \end{array}

On pose Z_n=\dfrac{x_n-np}{\sqrt{np(1-p)}}.
D'après le théorème de Moivre-Laplace on a :\lim\limits_{n\to +\infty} P\left(-u_{\alpha} \leqslant Z_n \leqslant u_{\alpha}\right) = \displaystyle \int_{-u_{\alpha}}^{u_{\alpha}} \dfrac{1}{\sqrt{2\pi}}\text{e}^{-\frac{x^2}{2}}\mathrm{d}x=1-\alpha
Par conséquent \lim\limits_{n \to +\infty} P\left(F_n \in I_n\right) = 1-\alpha.

Remarques :
\bullet Plus n devient grand, plus la probabilité P\left(F_n\in I_n\right) se rapproche de 1-\alpha. C'est la raison pour laquelle on parle de fluctuation asymptotique.
\bullet Pour pouvoir utiliser les intervalles de fluctuation il faut vérifier trois conditions :
\begin{array}{rl} \rhd& n\geqslant 30 \\ \rhd& np\geqslant 5 \\ \rhd& n(1-p)\geqslant 5 \end{array}
\bullet On utilise très souvent les intervalles de fluctuation avec \alpha=0,05 ou  \alpha=0,01 pour des seuils de confiance de 95\% et 99\%. Les valeurs de u_{\alpha}, vues dans le chapitre sur la loi normale, sont alors respectivement 1,96 et 2,58.

Exemple : On lance une pièce de monnaie équilibrée 200 fois.
On a alors n=200 et p=0,5. On vérifie que les trois conditions soient bien vérifiées :
\begin{array}{rll} \rhd& n=200 \geqslant 30 & \checkmark \\ \rhd &np=100 \geqslant 5 &\checkmark \\ \rhd &n(1-p)=100 \geqslant 5 &\checkmark \end{array}
Un intervalle de fluctuation asymptotique au seuil de 95\% est alors :
 \begin{array}{rl}I_{200} &= \left[0,5-1,96\dfrac{\sqrt{0,5\times 0,5}}{\sqrt{200}}\;;\;0,5+1,96\dfrac{\sqrt{0,5\times 0,5}}{\sqrt{200}}\right] \\\\ &\approx [0,43\,;\,0,57] \end{array}

Attention quand on fournit des valeurs approchées, on arrondit la borne inférieure de l'intervalle par défaut et la borne supérieure par excès.

On lance 200 fois une pièce et constate qu'on obtient 110 "pile". Puisque qu'on a abtenu plus de 50\% de "pile" il est normal de se demander si ce résultat est aberrant .
La fréquence observée est f=\dfrac{110}{200}=0,55 \in I_{200}.
Au risque d'erreur de 5\%, cette fréquence est acceptable et on peut dire que la pièce ne semble pas truquée.

Plus généralement, pour prendre une décision de ce type, on suit la méthode suivante :
Prise de décision :
Dans un échantillon de taille n, on constate que la fréquence d'apparition de ce caractère est f.
On suppose que, dans une population donnée, la proportion d'un caractère est p.

On détermine l'intervalle de fluctuation asymptotique I_n au seuil de 95\%.
On regarde si la fréquence observée f appartient ou non à I_n.
\bullet si f\in I_n l'hypothèse faite sur p n'est pas remise en cause au seuil de confiance de 95\%;
\bullet si f\notin I_n l'hypothèse faite sur p est remise en cause au risque de 5\%.


Exemple : Une entreprise annonce que le pourcentage de moteurs défectueux dans la production est égal à 1\%.
Afin de vérifier cette affirmation 800 moteurs sont prélevés au hasard. On constate que 15 moteurs sont détectés défectueux.
Le résultat de ce test remet-il en question l'annonce de l'entreprise ? Justifier. On pourra s'aider d'un intervalle de fluctuation au seuil de 99\%.

On a n=800\geqslant 30, np=8\geqslant 5 et n(1-p)=792 \geqslant 5.
Un intervalle de fluctuation asymptotique au seuil de 95\% est :
\begin{array}{rl}I_{800}&=\left[0,01-1,96\dfrac{\sqrt{0,01\times 0,99}}{\sqrt{800}}\;;\;0,01+1,96\dfrac{\sqrt{0,01\times 0,99}}{\sqrt{800}}\right] \\ &\approx [0,003\,;\,0,017] \end{array}
La fréquence observée est f=\dfrac{15}{800}=0,01875\notin I_{800}.
Ce résultat remet donc en cause, au risque de 5\% l'annonce de l'entreprise.

Remarque : Si une des 3 conditions pour déterminer un intervalle de fluctuation asymptotique n'est pas vérifiée, la formule n'est plus valide et on doit utiliser ce qui a été vu en classe de 1re sur l'échantillonnage.

2 Intervalle de confiance

Dans cette partie, on va considérer des situations dans lesquelles il nous est impossible de connaître la probabilité p d'apparition d'un caractère donné dans une population. On va donc essayer d'en fournir une estimation à l'aide d'échantillons représentatifs. C'est typiquement le cas des sondages d'opinion.
Si on reprend la formule fournissant un intervalle de fluctuation asymptotique au seuil de 95\% on a : I_n=\left[p-1,96\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\;;\;p+1,96\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\right].
On considère la fonction f définie sur [0;1] par f(x)=x(1-x).
Il s'agit d'une fonction polynôme du second degré qui atteint son maximum en 0,5 et f(0,5)=0,25
Ainsi 1,96\sqrt{p(1-p)} \leqslant 1,96\sqrt{0,25} = 2 \times 0,5 = 1
On retrouve ainsi l'intervalle de fluctuation au seuil de confiance de 95\% vu en classe de seconde :
J_n=\left[p-\dfrac{1}{\sqrt{n}}\;;\;p+\dfrac{1}{\sqrt{n}}\right].
Si f est une fréquence observée du caractère étudié on a donc :
f\in J_n \Leftrightarrow p-\dfrac{1}{\sqrt{n}} \leqslant f \leqslant p+\dfrac{1}{\sqrt{n}}
Ainsi  p-\dfrac{1}{\sqrt{n}} \leqslant f \Leftrightarrow p \leqslant f+\dfrac{1}{\sqrt{n}} et  f \leqslant p+\dfrac{1}{\sqrt{n}} \Leftrightarrow f-\dfrac{1}{\sqrt{n}} \leqslant p
Par conséquent f\in J_n \Leftrightarrow f-\dfrac{1}{\sqrt{n}} \leqslant p \leqslant f+\dfrac{1}{\sqrt{n}}
Donc, au seuil de confiance de 95\% on a p \in \left[f-\dfrac{1}{\sqrt{n}}\;;\;f+\dfrac{1}{\sqrt{n}}\right]
Définition :
Soit f la fréquence observée d'un caractère donné dans un échantillon de taille n l'intervalle \left[f-\dfrac{1}{\sqrt{n}}\;;\;f+\dfrac{1}{\sqrt{n}}\right] est appelé intervalle de confiance au seuil de confiance de 95\% de la proportion p du caractère dans la population.


Remarques :
\bullet La majoration de u_{\alpha}\sqrt{p(1-p)} faite dans le cas où u_{\alpha}=1,96 peut être faite pour toutes les valeurs de u_{\alpha}. On obtient ainsi des intervalles de confiance pour tous les seuils de confiance et pas seulement pour 95\%.
\bullet Tout comme pour les intervalles de fluctuation asymptotique, il faut vérifier trois conditions pour pouvoir utiliser la définition d'un intervalle de confiance :
\begin{array}{rl} \rhd& n\geqslant 30 \\ \rhd& nf\geqslant 5 \\ \rhd& n(1-f)\geqslant 5 \end{array}

Exemple : Un sondage, effectué auprès de 1~200 personnes, indique que 52,9\% voteraient pour un candidat A.
Au seuil de confiance de 95\%, le candidat A peut-il croire en sa victoire?
On a :
\begin{array}{rll} \rhd& n=1~200 \geqslant 30 & \checkmark \\ \rhd &nf=634,8 \geqslant 5 &\checkmark \\ \rhd &n(1-f)=565,2 \geqslant 5 &\checkmark \end{array}
Un intervalle de confiance au seuil de 95\% est donc :
\begin{array}{rl} I_{1~200}&=\left[0,529-\dfrac{1}{\sqrt{1~200}}\;;\;0,529+\dfrac{1}{\sqrt{1~200}}\right]\\\\ &\approx [0,5001\;;\;0,5579]\end{array}
0,5 < 0,5001, par conséquent le candidat A peut croire en sa victoire au seuil de confiance de 95\%.

Remarque : L'amplitude d'un intervalle de confiance au seuil de 95\% est :
f-\dfrac{1}{\sqrt{n}}-\left(f+\dfrac{1}{\sqrt{n}}\right) = \dfrac{2}{\sqrt{n}}.
On peut ainsi déterminer la taille nécessaire d'un échantillon afin d'obtenir un intervalle ayant une amplitude donnée.
Ainsi, par exemple, si on veut un intervalle de confiance d'amplitude 0,02, cela signifie que \dfrac{2}{\sqrt{n}}=0,02 \Leftrightarrow \dfrac{1}{\sqrt{n}}=0,01\Leftrightarrow \sqrt{n}=100 \Leftrightarrow n=10~000

Publié le
ceci n'est qu'un extrait
Pour visualiser la totalité des cours vous devez vous inscrire / connecter (GRATUIT)
Inscription Gratuite se connecter
Merci à
Eh01
pour avoir contribué à l'élaboration de cette fiche


Vous devez être membre accéder à ce service...

Pas encore inscrit ?

1 compte par personne, multi-compte interdit !

Ou identifiez-vous :


Rester sur la page

Inscription gratuite

Fiches en rapport

parmi 1674 fiches de maths

Désolé, votre version d'Internet Explorer est plus que périmée ! Merci de le mettre à jour ou de télécharger Firefox ou Google Chrome pour utiliser le site. Votre ordinateur vous remerciera !