Intervalle de fluctuation et estimation
Prérequis :
Ces thèmes ont déjà été abordés en seconde et première. Il est donc souhaitable de connaître les cours des années précédentes.
Tu auras besoin, pour pouvoir comprendre les démonstrations du cours de bien maîtriser
le cours sur la loi binomiale de 1reS ainsi que celui sur la loi normale de TS.
Enjeu :
Il y a plusieurs objectifs dans ce chapitre. Le premier consiste, à partir d'une probabilité théorique,
de prendre des décisions à l'aide de fréquences observées sur un échantillon. Le second, à l'inverse, est de fournir un intervalle
dans lequel doit se trouver une probabilité théorique, qu'on ne peut pas calculer, à partir d'un échantillon représentatif.
Il faut être très attentif aux énoncés proposés pour pouvoir répondre convenablement aux questions posées.
1 Intervalle de fluctuation
Dans cette partie, on connaît la probabilité d'apparition
P d'un événement.
Voyons tout d'abord un résultat lié à la loi binomiale et la loi normale centrée réduite.
On considère un entier naturel
n et une variable aléatoire
Xn qui suit la loi
binomiale
)
de paramètres
n et
p. La variable aléatoire

correspond à la fréquence de succès pour un schéma de Bernouilli
de paramètres
n et
p. Cette variable aléatoire prend donc les valeurs suivantes :

.
Propriété :
Pour tout réel
![\alpha\in]0;1[](https://latex.ilemaths.net/latex-0.tex?\alpha\in]0;1[)
, on a :
![\lim\limits_{n \to +\infty} P\left(F_n \in \left[p-u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\;;\;p+u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\right]\right)=1-\alpha](https://latex.ilemaths.net/latex-0.tex?\lim\limits_{n \to +\infty} P\left(F_n \in \left[p-u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\;;\;p+u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\right]\right)=1-\alpha)
Remarques :

est l'unique réel déterminé dans le chapitre sur la loi normale pour lequel
on a
=1-\alpha)
quand

suit la loi normale centrée réduite.

L'intervalle
![I_n=\left[p-u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\;;\;p+u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\right]](https://latex.ilemaths.net/latex-0.tex?I_n=\left[p-u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\;;\;p+u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\right])
est appelé
intervalle de fluctuation
asymptotique au seuil 
.
Démonstration :
On pose
}})
.
D'après le théorème de Moivre-Laplace on a :
 = \displaystyle \int_{-u_{\alpha}}^{u_{\alpha}} \dfrac{1}{\sqrt{2\pi}}\text{e}^{-\frac{x^2}{2}}\mathrm{d}x=1-\alpha)
Par conséquent
 = 1-\alpha)
.
Remarques :

Plus
n devient grand, plus la probabilité
)
se rapproche de

.
C'est la raison pour laquelle on parle de fluctuation asymptotique.

Pour pouvoir utiliser les intervalles de fluctuation il faut vérifier trois conditions :

On utilise très souvent les intervalles de fluctuation avec

ou

pour des seuils de confiance de

et

.
Les valeurs de

, vues dans le chapitre sur la loi normale, sont alors respectivement

et

.
Exemple : On lance une pièce de monnaie équilibrée

fois.
On a alors

et

. On vérifie que les trois conditions soient bien vérifiées :
=100 \geqslant 5 &\checkmark \end{array} )
Un intervalle de fluctuation asymptotique au seuil de

est alors :
![\begin{array}{rl}I_{200} &= \left[0,5-1,96\dfrac{\sqrt{0,5\times 0,5}}{\sqrt{200}}\;;\;0,5+1,96\dfrac{\sqrt{0,5\times 0,5}}{\sqrt{200}}\right] \\\\ &\approx [0,43\,;\,0,57] \end{array}](https://latex.ilemaths.net/latex-0.tex? \begin{array}{rl}I_{200} &= \left[0,5-1,96\dfrac{\sqrt{0,5\times 0,5}}{\sqrt{200}}\;;\;0,5+1,96\dfrac{\sqrt{0,5\times 0,5}}{\sqrt{200}}\right] \\\\ &\approx [0,43\,;\,0,57] \end{array})
Attention quand on fournit des valeurs approchées, on arrondit la borne inférieure de l'intervalle par défaut et la borne supérieure par excès.
On lance

fois une pièce et constate qu'on obtient

"pile". Puisque qu'on a abtenu plus de

de "pile" il est normal de se demander si
ce résultat est aberrant .
La fréquence observée est

.
Au risque d'erreur de

, cette fréquence est acceptable et on peut dire que la pièce ne semble pas truquée.
Plus généralement, pour prendre une décision de ce type, on suit la méthode suivante :
Prise de décision :
Dans un échantillon de taille

, on constate que la fréquence d'apparition de ce caractère est

.
On suppose que, dans une population donnée, la proportion d'un caractère est
p.
On détermine l'intervalle de fluctuation asymptotique

au seuil de

.
On regarde si la fréquence observée

appartient ou non à

.

si

l'hypothèse faite sur
p n'est pas remise en cause au seuil de confiance de

;

si

l'hypothèse faite sur
p est remise en cause au risque de

.
Exemple : Une entreprise annonce que le pourcentage de moteurs défectueux dans la
production est égal à

.
Afin de vérifier cette affirmation 800 moteurs sont prélevés au hasard. On constate que

moteurs sont détectés défectueux.
Le résultat de ce test remet-il en question l'annonce de l'entreprise ? Justifier.
On pourra s'aider d'un intervalle de fluctuation au seuil de

.
On a

,

et
=792 \geqslant 5)
.
Un intervalle de fluctuation asymptotique au seuil de

est :
![\begin{array}{rl}I_{800}&=\left[0,01-1,96\dfrac{\sqrt{0,01\times 0,99}}{\sqrt{800}}\;;\;0,01+1,96\dfrac{\sqrt{0,01\times 0,99}}{\sqrt{800}}\right] \\ &\approx [0,003\,;\,0,017] \end{array}](https://latex.ilemaths.net/latex-0.tex?\begin{array}{rl}I_{800}&=\left[0,01-1,96\dfrac{\sqrt{0,01\times 0,99}}{\sqrt{800}}\;;\;0,01+1,96\dfrac{\sqrt{0,01\times 0,99}}{\sqrt{800}}\right] \\ &\approx [0,003\,;\,0,017] \end{array})
La fréquence observée est

.
Ce résultat remet donc en cause, au risque de

l'annonce de l'entreprise.
Remarque : Si une des

conditions pour déterminer un intervalle de fluctuation
asymptotique n'est pas vérifiée, la formule n'est plus valide et on doit utiliser ce qui a été vu
en classe de 1
re sur l'échantillonnage.
2 Intervalle de confiance
Dans cette partie, on va considérer des situations dans lesquelles il nous est impossible de connaître la probabilité
p
d'apparition d'un caractère donné dans une population. On va donc essayer d'en fournir une estimation à l'aide
d'échantillons représentatifs. C'est typiquement le cas des sondages d'opinion.
Si on reprend la formule fournissant un intervalle de fluctuation asymptotique au seuil de

on a :
![I_n=\left[p-1,96\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\;;\;p+1,96\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\right]](https://latex.ilemaths.net/latex-0.tex?I_n=\left[p-1,96\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\;;\;p+1,96\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\right])
.
On considère la fonction

définie sur
![[0;1]](https://latex.ilemaths.net/latex-0.tex?[0;1])
par
=x(1-x))
.
Il s'agit d'une fonction polynôme du second degré qui atteint son maximum en

et
=0,25)
Ainsi
} \leqslant 1,96\sqrt{0,25} = 2 \times 0,5 = 1)
On retrouve ainsi l'intervalle de fluctuation au seuil de confiance de

vu en classe de seconde :
![J_n=\left[p-\dfrac{1}{\sqrt{n}}\;;\;p+\dfrac{1}{\sqrt{n}}\right]](https://latex.ilemaths.net/latex-0.tex?J_n=\left[p-\dfrac{1}{\sqrt{n}}\;;\;p+\dfrac{1}{\sqrt{n}}\right])
.
Si

est une fréquence observée du caractère étudié on a donc :

Ainsi

et

Par conséquent

Donc, au seuil de confiance de

on a
Définition :
Soit

la fréquence observée d'un caractère donné dans un échantillon de taille

l'intervalle
![\left[f-\dfrac{1}{\sqrt{n}}\;;\;f+\dfrac{1}{\sqrt{n}}\right]](https://latex.ilemaths.net/latex-0.tex?\left[f-\dfrac{1}{\sqrt{n}}\;;\;f+\dfrac{1}{\sqrt{n}}\right])
est appelé
intervalle de confiance
au seuil de confiance de

de la proportion
p du caractère dans la population.
Remarques :

La majoration de
})
faite dans le cas où

peut être faite pour toutes les valeurs de

. On obtient ainsi des intervalles de confiance
pour tous les seuils de confiance et pas seulement pour

.

Tout comme pour les intervalles de fluctuation asymptotique, il faut vérifier trois conditions
pour pouvoir utiliser la définition d'un intervalle de confiance :
Exemple : Un sondage, effectué auprès de

personnes, indique que

voteraient pour un candidat A.
Au seuil de confiance de

, le candidat A peut-il croire en sa victoire?
On a :
=565,2 \geqslant 5 &\checkmark \end{array} )
Un intervalle de confiance au seuil de

est donc :

, par conséquent le candidat A peut croire en sa victoire au seuil de confiance
de

.
Remarque : L'amplitude d'un intervalle de confiance au seuil de

est :
 = \dfrac{2}{\sqrt{n}})
.
On peut ainsi déterminer la taille nécessaire d'un échantillon afin d'obtenir un intervalle
ayant une amplitude donnée.
Ainsi, par exemple, si on veut un intervalle de confiance d'amplitude

, cela signifie que