Bonjour à tous,
Je dois coder un programme qui me permet de savoir quelle est le meilleur logo pour un projet.
L'idée est de que je vais proposer à un échantillon de population de voter pour leur logo préféré (il y aura deux choix avec obligation d'en faire un) et j'ai besoin de savoir quelle doit être la taille de cet échantillon pour être sûr à x% que la population totale (de n personnes) sera majoritairement d'accord avec ce choix.
J'ai exploré la possibilité d'utiliser une marge d'erreur et un niveau de confiance mais je ne sais pas si c'est le plus pertinent pour ce projet (car ce qui m'intéresse n'est pas de savoir si les pourcentages seront les mêmes dans la population totale et dans l'échantillon mais simplement de savoir si le logo A sera majoritairement préféré au logo B ou pas).
J'aimerais connaître la relation entre la taille de mon échantillon et la probabilité que la préférence entre A et B soit la même pour la population totale et l'échantillon. On doit sans doute prendre en compte la représentativité de l'échantillon dans la formule...
J'espère que c'est clair !
Si vous avez la moindre piste pour m'aider à avancer ce serait top...
Merci beaucoup !
Adrien
salut
une theorie : si ta population est distribuée selon une loi normale de parametre N(µ,
²)
alors quelque soit la taille de l'echantillon prelevé , la proportion du caractère etudié suit aussi une loi normale de parametre F--> N(p,
(p(1-p)/n)) si des fois cela peut te servir
Merci pour cette super réponse @LeDino.
Cependant, j'ai du mal à comprendre comment tu calcules q avec q.norm(x) :: quantile x de la loi normale standard.
En effet, si par loi normale standard tu entends N(0,1), on a q ~ 1,64 pour x = 95% il me semble (d'après la table ici : http://bit.ly/1yW2E9W), or q^2 = 4 d'après ton calcul lorsque tu me dis que n > 1/(d^2).
Merci de ton aide 
Tu as parfaitement raison
... je suis allé un peu vite dans l'écriture.
Le test est BILATERAL puisque si A l'emporte sur B ou l'inverse tu concluras dans chaque cas à l'inégalité et donc à la domination de l'un ou de l'autre. Si la confiance est de , alors le risque de rejet à tort sera
et la probabilité à considérer pour chaque zone symétrique de rejet sera la moitié de
, donc
.
Donc dans les formules que j'ai données (qui sont justes), il faut adopter :
C'est d'ailleurs ce que j'ai fait puisque j'ai adopté la valeur arrondie à
, qui correspond bien à
pour une confiance
et donc un risque
.
Autre remarque :
Faire une approximation par la loi normale n'est pas impératif.
La relation que j'ai donnée découle de la valeur de la moyenne et de l'écart-type de la binomiale suivie par la fréquence d'apparition de A... Elle fait intervenir le quantile
de distribution de
, qui en toute rigueur est une distribution binomiale et n'est qu'approchée par une normale.
En d'autres termes, si tu disposes d'une fonction qui calcule la distribution inverse de la loi binomiale (qbinom), tu n'es pas obligé de passer par une loi normale.
Dans le cas où tu devrais programmer par toi même la fonction de quantile , il est peut-être plus simple en définitive de programmer une binomiale. Le programme est simple et la complexité de l'algorithme (bien écrit) est linéaire en
. Pour cela : partir de
, puis écrire
à partir de
par récurrence : la relation est toute simple. Faire une boucle sur
et s'arrêter à la valeur de probabilité cumulée qui dépasse le seuil fixé (
étant le nombre de votes pour A dans l'échantillon).
Correctif : c'est qui suit une binomiale.
Ce qui ne change rien à ce qui précède, mais implique juste d'en tenir compte dans le programme...
Merci beaucoup LeDino
Toute dernière question : ceci ne fonctionne qu'avec "n suffisamment grand" n'est-ce pas ?
Car, par exemple, j'obtiens que si pour un échantillon de 3 personnes ils choisissent tous le logo A par rapport au logo B (100% de l'échantillon) alors cela signifierait qu'il y a plus de 80% de chances que la population totale (dont la taille reste indéfinie dans ces calculs) soit majoritairement d'accord avec ce choix. Ce qui me semble beaucoup. Si c'est lié à une erreur, d'où viendrait-elle ? Sinon, que peut-on considérer comme "suffisamment grand" ?
Merci mille fois 
!
Vous devez être membre accéder à ce service...
Pas encore inscrit ?
1 compte par personne, multi-compte interdit !
Ou identifiez-vous :