Bonjour tout le monde. Un tout petit exercice facile comme tout me pose un problème assez épineux.
J'analyse sur une base de données plutôt défaillante qui contient 100000 articles. Par une simple analogie sur une base beaucoup plus importante et presque à jour (plus de 7,2 millions d'articles), il a été estimé que 22% des articles sont erronés (information partielle, expirée ou fausse).
Quel est le problème ?
Je voudrais faire un tableau de sélection d'échantillons et calculer la probabilités qu'ils soient tous faux. Rien de plus simple qu'une loi de Bernoulli.
Mais voilà, pour k=10, calculer le rapport suivant est impossible par calculatrice ou ordinateur, en prenant p pour probabilité d'article défectueux.
A priori, la loi de Poisson pourrait m'aider dans ce cas. Mais je ne vois pas comment m'y prendre.
Je cherche à calculer les probabilités pour X=10 à 100, X multiple de 10.
L'intérêt pour moi est de faire un rapport pour montrer que cette base de données... est bonne pour aller à la poubelle.
Si vous pouviez m'aider... merci !
salut,
1/ l'approximation par la loi de Poisson n'est pas possible ici car il faudrait p proche de 0.
On prendra plutot l'approximation par la loi normale.
2/ P(X=k) pour k=10..100 n' a aucun interet, ces probabilites sont nulles.
En revanche on peut calculer par exemple P(21900<X<22050)
Vous devez être membre accéder à ce service...
Pas encore inscrit ?
1 compte par personne, multi-compte interdit !
Ou identifiez-vous :