Inscription / Connexion Nouveau Sujet
Niveau enseignement
Partager :

Echantillonnage (estimation d'une proportion)

Posté par
kaiser Moderateur
06-05-10 à 21:07

Bonjour

Je suis actuellement en train de préparer un cours sur l'échantillonnage à ma classe de seconde et il y a une chose que je n'arrive pas à comprendre car je sens qu'il y a quelque chose qui est passé sous silence.

Dans le programme, il est dit :

Citation :
Le professeur peut indiquer aux élèves le résultat suivant, utilisable dans la pratique pour des échantillons de
taille n > 25 et des proportions p du caractère comprises entre 0, 2 et 0, 8
: si f désigne la fréquence du caractère
dans l’échantillon, f appartient à l’intervalle \Large{[p-\frac{1}{\sqrt{n}},p+\frac{1}{\sqrt{n}}]} avec une probabilité d’au moins 0, 95.



ça, c'est bien compris. Le problème est que lorsque l'on essaie d'utiliser ça dans l'autre sens : on cherche à estimer p en disant que 95% des intervalles de la forme \Large{[f-\frac{1}{\sqrt{n}},f+\frac{1}{\sqrt{n}}]} contiennent la valeur p (où f est une fréquence donnée pour un échantillon de taille n) .

Voilà ma question : est-ce qu'on ne doit pas dire à un moment que ceci est vrai, si l'on suppose p compris entre 0,2 et 0,8, parce que sinon, ce n'est pas forcément vrai, étant donné que l'on utilise le résultat précédent ?

Je tiens à préciser une chose : à la page 18 du document d'accompagnement suivant (officiel) , il n'est pas fait mention de ce problème.

Serait-ce un faux problème (c'est-à-dire on est en seconde donc on ne se complique pas la vie et il n'y a pas de problème) ou alors il y a bien quelque chose qui cloche ?

Kaiser

Posté par
Pierre_D
re : Echantillonnage (estimation d'une proportion) 06-05-10 à 22:32

Bonjour Kaiser,

Je ne connaissais pas ce résultat, que je trouve pour le moins bizarre de présenter aux élèves de seconde car il n'a aucun caractère exemplaire ou pédagogique. En tous cas, il s'agit d'une dégradation du résultat sur l'estimation d'une proportion, issu de "l'approximation normale" de \frac{X-np}{\sqrt{np(1-p)}} , où X est binomiale(n,p), par la variable normale réduite u ; la dégradation vient de ce que 2\sqrt{x(1-x)}\le 1 et donc approximativement u_{0,975}\sqrt{x(1-x)}\le1 sur [0,1] : on peut donc grossièrement majorer 1,96\sqrt{\frac{p(1-p)}n} par \frac1{\sqrt n} ! Tu as donc raison, ce "résultat" est soumis aux conditions de validité relative de "l'approximation normale", qui varient d'ailleurs suivant les auteurs ...

Posté par
minkus Posteur d'énigmes
re : Echantillonnage (estimation d'une proportion) 07-05-10 à 02:15

Hello

Les programmes : mettre de plus en plus de stats et expliquer ensuite aux eleves comment le faire avec leur calculatrice.

Ce genre de formule sortie de nulle part (cote eleve) m'exaspere.

Avis peu objectif de qqun pas fan des stats

minkus

PS : Autre objectif plus recent des programmes : mettre de l'algorithmique un peu partout (cf nouveau BO sur 1ere ES/S a la rentree prochaine) et expliquer aux eleves comment le faire avec un ordinateur.

Posté par
Coll Moderateur
re : Echantillonnage (estimation d'une proportion) 07-05-10 à 06:45

Bonjour à tous,
Bonjour kaiser

Un exemple récent d'utilisation de cette nouvelle "formule"
algorithme

Posté par
Yzz
re : Echantillonnage (estimation d'une proportion) 07-05-10 à 07:00

salut,
Entièrement d'accord avec minkus
J'ai l'impression, pour faire court, qu'on va vers un remplacement du raisonnement par l'utilisation de l'outillage (calculatrice, ordi), avec les défauts de la méthode: "on voit bien ça sur l'écran, donc c'est vrai".

Posté par
kaiser Moderateur
re : Echantillonnage (estimation d'une proportion) 07-05-10 à 10:01

Bonjour et merci à tous d'avoir répondu

Je suis d'accord avec vous que l'application bête et méchante de cette "formule" sortie de nulle part discutable.
Avec un peu de bonne volonté, je me suis dit : OK, on va laisser passer (difficilement).
Mon réel problème, et je n'ai pas forcément été clair sur ce coup, c'est lorsque l'on essaie d'estimer une proportion et que l'on applique directement cette formule alors que p, qui est inconnue, pourrait très bien se trouver en dehors de l'intervalle [0,2;0,8].
Plus frappant encore : je sais que les manuels scolaires ne sont pas forcément des références, mais j'ai eu affaire à l'exercice suivant ainsi qu'à sa correction qui m'a pour le moins rendu perplexe.

Voici l'exercice :

Citation :
Lors d'une élection, un sondage portant sur 1000 personnes donne 400 votants pour le candidat A. Avec un risque d'erreur de 5%, quelles informations peut-on obtenir sur la proportion de votants pour ce candidat dans la population ?


Voici la correction proposée :

Citation :
La fréquence des votants pour la candidat A dans cet échantillon est \Large{f=\frac{400}{1000}=0,4}.
Puisque \Large{0,2\leq f\leq 0,8} et \Large{n\geq 25}, au seuil 95%, p appartient à l'intervalle de confiance [0,36;0,44] car \Large{\sqrt{1000}\approx 31,6}.
On peut estimer, avec un risque d'erreur de 5%, que le candidat A obtiendra entre 36% et 44% des voix.


Ici, on voit que f vérifie l'inégalité que p doit normalement vérifier pour pouvoir appliquer le formule. En quoi est-ce légitime ? Bref, j'ai l'impression qu'on fait passer quelque chose sous silence, à savoir que p est susceptible de vérifier cette double inégalité car n est suffisamment grand et f vérifie cette double inégalité (on utilise en grand le fait que les fréquences se stabilisent sans en faire mention, ce qui me paraît très limite et sournois).

Kaiser

Posté par
carpediem
re : Echantillonnage (estimation d'une proportion) 07-05-10 à 16:43

salut

en fait cela vient de ce que si p-e<f<p+e alors f-e<p<p+e

si p est connue 95% des échantillons ont une fréquence f dans [p-e,p+e] donc réciproquement au risque de 5% tu conclus que p est dans [f-e,f+e]

le fait d'accepter p alors que c'est faux est appelé risque de première espèce
le fait de refuser p alors que c'est vrai est appelé risque de deuxième espèce
(à partir d'un échantillon donné)

... ou peut-être est-ce le contraire ?....

Posté par
kaiser Moderateur
re : Echantillonnage (estimation d'une proportion) 07-05-10 à 20:35

D'accord, ça, je l'ai bien compris mais tout ceci est applicable uniquement si p est dans l'intervalle [0,2;0,8].
La seule chose que je ne comprenais pas, c'était que l'on appliquait ce résultat à un p que l'on ne connait pas et donc il peut très bien se trouver en dehors de ce dernier intervalle auquel cas notre résultat se trouve en défaut.

Dans l'exercice précédent, il se trouve que l'on vérifie cette hypothèse mais uniquement sur la fréquence associée à un échantillon. Aujourd'hui, j'ai demandé à un collègue et il se trouve que mon intuition semble "correcte" : plus précisément, lorsque n est assez grand, on suppose que la fréquence associée à un échantillon est suffisamment proche de la proportion recherchée de sorte que si f est dans l'intervalle [0,2;0,8], alors p le sera aussi, mais je trouve ça quand même très bizarre de présenter ça de cette manière aux élèves (surtout que cet intervalle n'est qu'une approximation, comme certains l'on dit plus haut).
En d'autres termes, si cette fréquence observée sur un échantillon ne se trouve pas dans cet intervalle, alors on ne peut pas appliquer le résultat et alors on prend un autre échantillon jusqu'à tomber sur une fréquence "acceptable". Enfin, il semblerait!!

Kaiser

Posté par
verdurin
re : Echantillonnage (estimation d'une proportion) 08-05-10 à 14:54

Bonjour,
en fait la relation donné

Citation :
f appartient à l'intervalle \Large{[p-\frac{1}{\sqrt{n}},p+\frac{1}{\sqrt{n}}]} avec une probabilité d'au moins 0,95.

est valable quelque soit p (pour n assez grand).
À mon avis, la limitation à 0,2<p<0,8 vient de ce que la majoration est vraiment trop grossière en dehors de cet intervalle.

Posté par
carpediem
re : Echantillonnage (estimation d'une proportion) 11-05-10 à 16:50

....et aussi pour approximer la loi binomiale par une loi exponentielle...

Posté par
borneo
re : Echantillonnage (estimation d'une proportion) 27-07-10 à 10:20

Bonjour à tous

Minkus :

Citation :
PS : Autre objectif plus récent des programmes : mettre de l'algorithmique un peu partout (cf nouveau BO sur 1ere ES/S a la rentrée prochaine) et expliquer aux élevés comment le faire avec un ordinateur.


On voit de plus en plus d'exercices d'algorithmique, ce qui a obligé les "dinosaures de l'île" (dont je fais partie  ) à se mettre aux logiciels tels qu'algobox. Une chose me choque dans ce nouveau chapitre, c'est que la plupart des élèves font des exercices sans pratiquer le moins du monde, sans avoir le moindre logiciel pour s'entraîner et voir si leur programme tient la route.

Posté par
sloreviv
re : Echantillonnage (estimation d'une proportion) 27-07-10 à 11:43

Bonjour à tous
borneo->
moi aussi "dinosaures de l'île"  et je me pose des questions sur comment ça va passer petit a petit au bac (c'est dans l'air) peut on dire "tous les eleves doivent connaitre algobox " ou savoir donner un programme qui marche avec LEUR calculette ou au contraire savoir discuter d'un algorithme proposé comme au Bac L l'an dernier ???
Mystère , que de réflexions pour préparer mon cours de seconde!

Posté par
borneo
re : Echantillonnage (estimation d'une proportion) 03-08-10 à 00:27

Bonjour Sloreviv  


Je me suis mise à algobox grâce à Coll, qui est très fort
J'ai appris à m'en servir grâce aux exemples qui sont donnés, le tutoriel est assez bien fait.

Pour moi, écrire un algorithme sans pouvoir le tester, c'est comme écrire une partition sans instrument pour la jouer.



Vous devez être membre accéder à ce service...

Pas encore inscrit ?

1 compte par personne, multi-compte interdit !

Ou identifiez-vous :


Rester sur la page

Désolé, votre version d'Internet Explorer est plus que périmée ! Merci de le mettre à jour ou de télécharger Firefox ou Google Chrome pour utiliser le site. Votre ordinateur vous remerciera !