Bonjour, j'ai besoin d'aide pour mon dm de math de terminal, merci d'avance.
Le filtrage bayésien anti-spam:
Principe: Dans une première phase (phase d'apprentissage), l'utilisateur, en désignant les spams et les messages légitimes permet au filtre d'établir une base de données qui permettra de calculer la probabilité qu'un message soit un spam ou non en fonction des mots que contient ce message.
1) Une boîte mail contient 2500 messages. On considère que 1700 de ces messages sont des spams. Le mot "euros" est dans 1400 spams et dans 100 messages qui ne sont pas des spams. Quelle est la probabilité qu'un mail qui contient le mot "euros" soit un spam ?
Pour celle là je pense avoir trouver (14/15) grâce arbre de probabilité
2) Dans cette question, on considère que la proportion de spams est p où p∈[0;1].
Le mot "chance" apparaît dans 20% des spams et dans 8% des non-spams
a)Montrer que la probabilité qu'un mail qui contient le mot chance soit un spam est égale à (5p)/(2+3p).
Et c'est là où je bloque, je suppose que je dois utiliser la loi de Bernoulli mais vu le seul exemple que j'ai dans mon cours (On appelle épreuve de Bernoulli une expérience aléatoire qui ne comptent qui 2 issues = l'une appelé succès (S) et l'autre échec (S̄), Si p(S)=p alors p(S̄)=1-p) je ne vois pas du tout comment l'adapter a mon exercice
merci de votre aide.
ugo75, bonjour
le multicompte est strictement interdit sur notre site
Je te demande donc de fermer le compte Ugodavid
bonjour
1) ce n'est pas 14/15
montre ton arbre pondéré si tu ne trouves pas ton erreur.
2) fais un nouvel arbre (pas besoin de Bernoulli ici).
"probabilité qu'un mail qui contient le mot chance soit un spam"--- comment tu traduis ceci en vocabulaire des probabilités ?
Bonjour
Pour la après avoir fait avec calcul j'ai trouvé que P(E)=0.59998
P(E)=P(S∩E)+P(S̄∩E)
(1700/2500)*0.8235+(800/2500)*0.125=0.59998
¨Pour la deux j'ai fais un autre arbre, je traduit la phrase par Pc(S), mais comme il n'y a pas de données pour S je trouve uniquement
Pc(S)=P(C∩S)/P(C)
(p*0.2)/(0.2)
Je dois sûrement oublié quelque chose mais je ne vois pas quoi,
1) non tu n'y es pas
à quoi correspond 0.8235? et 0.125?
on est d'accord que
mais ce n'est pas ce qui est demandé :
"Quelle est la probabilité qu'un mail qui contient le mot "euros" soit un spam ? "
c'est ....? (une proba conditionnelle)
montre moi ton arbre pour la 1) ==> la réponse sera dessus !
2) la probabilité qu'un mail qui contient le mot chance soit un spam
je traduis la phrase par Pc(S) ---- oui
Pc(S)=P(C∩S)/P(C) ---- oui
Pc(S)= (p*0.2)/(0.2)
en bleu correct
en rouge faux
pour trouver p(C), fais comme tu as pensé pour p(E) : probabilités totales.
Voila mon arbre, 0.8235 et 0.125 représente E et Ē de S (j'ai transformé 1400 et 300 en et décalé la virgule pour faire avec le seul exemple que j'ai car si je fais comme l'exemple de mon cours, mais du coup si c'est tout simplement une proba conditionnelle, quelle est sur l'arbre et qu'il n'y a pas bsn de calculs bah ça doit être 1400? Mais ça me paraît trop simple...
Pour la 2 j'ai aussi mis mon arbre ducoup le calcul doit être Pc(S)= (p*0.2)/((p*0.2)+(p*0.08)) si je fais comme mon idée pour P(E), le problème c'est que en faisant comme ça en simplifiant j'arrive à 5/7.....
1) ton arbre est bien construit mais les nombres sur les branches ne conviennent pas.
==> il doit y figurer des probabilités comme tu as fait pour le second arbre, pas des cardinaux.
par exemple, à la place de 1700, on doit avoir 1700/2500, soit 17/25
et ça, c'est une proba comprise entre 0 et 1, comme il se doit... d'accord ?
reprends-le.
"mais du coup si c'est tout simplement une proba conditionnelle oui, laquelle ?,
quelle est sur l'arbre - en effet -
et qu'il n'y a pas besoin de calculs - oui, quand même, voir arbre dûment complété"
2) ton arbre est bon SAUF la probabilité de Sbarre (d'où ton résultat faux à la fin)
une erreur tout simple... si p est la proba de S, la proba de l'événement contraire Sbarre est ...?
corrige ça, après ça devrait aller.
ps : un détail : sur ton second arbre, appelle "C", par exemple, l'événement "mot chance",
pour différencier du E de la question 1)
je reviens demain.
bonne nuit
... je viens de voir :
"Voila mon arbre, 0.8235 et 0.125 représente E et Ē de S"
impossible, en vertu de la règle : la somme des probas issues d'un même nœud de l'arbre est toujours égale à ...?
garde les fractions (valeurs exactes ) pour les probas de l'arbre, pas de valeurs décimales arrondis, quand c'est le cas.
J'ai refais les 2 arbres, alors pour la 2 ducoup j'ai compris que Sbarre était 1-p le calcul devrait être (p*0.2)/((p*0.2)+(1-p*0.08)) là je trouve 5p/(3p+25) je m'approche mais y'a toujours un problème...
Bonne nuit également
merci de l'aide
...... En fait ça y'est (p*0.2)/((0.2p)+(0.08(1-p)) j'ai remis dans le bon ordre je trouves bien ce qu'il faut
bonjour ugo75
les arbres sont justes.
n'hésite pas si tu as besoin d'aide pour les autres questions.
Bonjour, j'ai besoin d'aide pour la question 2) de cet exercices, merci d'avance.
J'ai le corrigé mais je n'arrives toujours pas à comprendre comment on trouve P(C)=0,2p+0,08(1−p) =0,12p+0,08 ?
Merci de votre aide.
salut
je prend un peu la relève ( Salutation à carita )..
"P(C)=0,2p+0,08(1−p)" est la partie obtenue en appliquant la formule des probabilités totales
P(C)=P(chance) = P(chance /spam) .P(spam) + P(chance /non spam) .P(non spam)
bonsoir à tous
... si ta question concerne seulement ce que tu as mis en rouge,
il suffit de développer/réduire 0,2p+0,08(1−p) pour arriver à 0,12p+0,08.
je laisse la main à flight.
Tout d'abord, merci flight pour la réponse car j'ai compris ce qui été écrit.
Malheureusement je rencontre encore un problème au niveau de ce que j'ai mis en rouge ( 0,12p+0,08 ) car je ne comprends comment on peut développer ou réduire pour arriver à ce résultat.
Merci d'avance pour votre aide.
Bonjour,
@Albux
Saurais-tu développer et réduire 0,2x+0,08(1-x) pour obtenir une expression de la forme ax+b ?
Bonjour, tout d'abord merci de votre réponse. Je me suis rendu compte qu'au final c'était tout simple il fallait juste développer (1-x) puis après simplifier pour obtenir l'expression de type ax+b. Ce qui me donne :
0,2x +0,08(1-x)
0,2x+ 0,08 - 0,08x
0,12x +0,08
Est-ce bien correcte ?
Vous devez être membre accéder à ce service...
Pas encore inscrit ?
1 compte par personne, multi-compte interdit !
Ou identifiez-vous :