Intervalle de fluctuation et estimation
Prérequis :
Ces thèmes ont déjà été abordés en seconde et première. Il est donc souhaitable de connaître les cours des années précédentes.
Tu auras besoin, pour pouvoir comprendre les démonstrations du cours de bien maîtriser
le cours sur la loi binomiale de 1reS ainsi que celui sur la loi normale de TS.
Enjeu :
Il y a plusieurs objectifs dans ce chapitre. Le premier consiste, à partir d'une probabilité théorique,
de prendre des décisions à l'aide de fréquences observées sur un échantillon. Le second, à l'inverse, est de fournir un intervalle
dans lequel doit se trouver une probabilité théorique, qu'on ne peut pas calculer, à partir d'un échantillon représentatif.
Il faut être très attentif aux énoncés proposés pour pouvoir répondre convenablement aux questions posées.
1 Intervalle de fluctuation
Dans cette partie, on connaît la probabilité d'apparition
P d'un événement.
Voyons tout d'abord un résultat lié à la loi binomiale et la loi normale centrée réduite.
On considère un entier naturel
n et une variable aléatoire
Xn qui suit la loi
binomiale
de paramètres
n et
p. La variable aléatoire
correspond à la fréquence de succès pour un schéma de Bernouilli
de paramètres
n et
p. Cette variable aléatoire prend donc les valeurs suivantes :
.
Propriété :
Pour tout réel
, on a :
Remarques :
est l'unique réel déterminé dans le chapitre sur la loi normale pour lequel
on a
quand
suit la loi normale centrée réduite.
L'intervalle
est appelé
intervalle de fluctuation
asymptotique au seuil .
Démonstration :
On pose
.
D'après le théorème de Moivre-Laplace on a :
Par conséquent
.
Remarques :
Plus
n devient grand, plus la probabilité
se rapproche de
.
C'est la raison pour laquelle on parle de fluctuation asymptotique.
Pour pouvoir utiliser les intervalles de fluctuation il faut vérifier trois conditions :
On utilise très souvent les intervalles de fluctuation avec
ou
pour des seuils de confiance de
et
.
Les valeurs de
, vues dans le chapitre sur la loi normale, sont alors respectivement
et
.
Exemple : On lance une pièce de monnaie équilibrée
fois.
On a alors
et
. On vérifie que les trois conditions soient bien vérifiées :
Un intervalle de fluctuation asymptotique au seuil de
est alors :
Attention quand on fournit des valeurs approchées, on arrondit la borne inférieure de l'intervalle par défaut et la borne supérieure par excès.
On lance
fois une pièce et constate qu'on obtient
"pile". Puisque qu'on a abtenu plus de
de "pile" il est normal de se demander si
ce résultat est aberrant .
La fréquence observée est
.
Au risque d'erreur de
, cette fréquence est acceptable et on peut dire que la pièce ne semble pas truquée.
Plus généralement, pour prendre une décision de ce type, on suit la méthode suivante :
Prise de décision :
Dans un échantillon de taille
, on constate que la fréquence d'apparition de ce caractère est
.
On suppose que, dans une population donnée, la proportion d'un caractère est
p.
On détermine l'intervalle de fluctuation asymptotique
au seuil de
.
On regarde si la fréquence observée
appartient ou non à
.
si
l'hypothèse faite sur
p n'est pas remise en cause au seuil de confiance de
;
si
l'hypothèse faite sur
p est remise en cause au risque de
.
Exemple : Une entreprise annonce que le pourcentage de moteurs défectueux dans la
production est égal à
.
Afin de vérifier cette affirmation 800 moteurs sont prélevés au hasard. On constate que
moteurs sont détectés défectueux.
Le résultat de ce test remet-il en question l'annonce de l'entreprise ? Justifier.
On pourra s'aider d'un intervalle de fluctuation au seuil de
.
On a
,
et
.
Un intervalle de fluctuation asymptotique au seuil de
est :
La fréquence observée est
.
Ce résultat remet donc en cause, au risque de
l'annonce de l'entreprise.
Remarque : Si une des
conditions pour déterminer un intervalle de fluctuation
asymptotique n'est pas vérifiée, la formule n'est plus valide et on doit utiliser ce qui a été vu
en classe de 1
re sur l'échantillonnage.
2 Intervalle de confiance
Dans cette partie, on va considérer des situations dans lesquelles il nous est impossible de connaître la probabilité
p
d'apparition d'un caractère donné dans une population. On va donc essayer d'en fournir une estimation à l'aide
d'échantillons représentatifs. C'est typiquement le cas des sondages d'opinion.
Si on reprend la formule fournissant un intervalle de fluctuation asymptotique au seuil de
on a :
.
On considère la fonction
définie sur
par
.
Il s'agit d'une fonction polynôme du second degré qui atteint son maximum en
et
Ainsi
On retrouve ainsi l'intervalle de fluctuation au seuil de confiance de
vu en classe de seconde :
.
Si
est une fréquence observée du caractère étudié on a donc :
Ainsi
et
Par conséquent
Donc, au seuil de confiance de
on a
Définition :
Soit
la fréquence observée d'un caractère donné dans un échantillon de taille
l'intervalle
est appelé
intervalle de confiance
au seuil de confiance de
de la proportion
p du caractère dans la population.
Remarques :
La majoration de
faite dans le cas où
peut être faite pour toutes les valeurs de
. On obtient ainsi des intervalles de confiance
pour tous les seuils de confiance et pas seulement pour
.
Tout comme pour les intervalles de fluctuation asymptotique, il faut vérifier trois conditions
pour pouvoir utiliser la définition d'un intervalle de confiance :
Exemple : Un sondage, effectué auprès de
personnes, indique que
voteraient pour un candidat A.
Au seuil de confiance de
, le candidat A peut-il croire en sa victoire?
On a :
Un intervalle de confiance au seuil de
est donc :
, par conséquent le candidat A peut croire en sa victoire au seuil de confiance
de
.
Remarque : L'amplitude d'un intervalle de confiance au seuil de
est :
.
On peut ainsi déterminer la taille nécessaire d'un échantillon afin d'obtenir un intervalle
ayant une amplitude donnée.
Ainsi, par exemple, si on veut un intervalle de confiance d'amplitude
, cela signifie que