Inscription / Connexion Nouveau Sujet
Niveau Grand oral
Partager :

grand-oral / Filtrage bayésien utilisation

Posté par
Chloe634
10-06-22 à 00:02

Bonjour,
Je suis actuellement en train de préparer mon grand oral de mathématiques. J'ai donc choisi de parler du filtrage bayésien, et pour cela j'ai décidé de présenter un exercice. Le problème etant que je bloque sur la fin et ne suis pas sûre de toutes mes réponses.

Pourriez-vous m'aidez s'il vous plaît? Cela me serait vraiment d'une grande aide. L'exercice paraît long mais c'est juste l'énoncé ou plutôt la mise en contexte. Le problème vient du livre Belin

Filtrage bayésien des spams

Problème 1

Nous recevons régulièrement dans nos boîtes de messagerie électronique des courriers indésirables, aussi appelés spams. C'est pourquoi il existe des logiciels dont le rôle est de filtrer ces messages. Voici un des principes qui est utilisé pour réaliser ce filtrage. Le logiciel repère les mots les plus fréquents dans les spams à l'aide de l'utilisateur de la messagerie qui peut indiquer au fur et à mesure du temps si un courrier est légitime ou non. Ensuite, lorsqu'un message arrive, le logiciel analyse les mots qu'il contient et évalue à partir de leur fréquence d'apparition dans les spams la probabilité que le message en soit un ou non. Si cette probabilité est suffisamment grande, il range le message dans un dossier « courrier indésirable » et sinon il le laisse passer dans la boîte de réception principale.

En simplifiant le filtrage sur un mot donné (par exemple : « facture », « cadeau »?), on peut modéliser la situation de la façon suivante.
On choisit un message au hasard dans une boîte de messagerie et on considère les événements suivants :
-Le message est un spam (S)
-Le message contient le mot en question (M).
Les renseignements de l'utilisateur ont permis d'établir que :
P de M sachant S = 0,7
P de M sachant Sbarre=0,4

On considère qu'il n'y a pas plus de chance qu'un message arrivant dans la boîte soit un spam qu'il ne le soit pas.
D'où P(S)=P(Sbarre)=0,5

Question 1:
Remplir un arbre ponderé (voir photo n°1)

Question 2:
Un message qui contient le mot arrive dans la boîte de réception. Quelle est la probabilité que ce soit un spam ?

Nous savons déjà que P de M sachant S=0,7 et que P(S)=0,5. Afin de pouvoir utiliser la formule de Bayes il faut que l'on calcule P(M).
D'après la formule des probabilités totales P(M)=P(M inter S)+P(M inter Sbarre)
         =P de M sachant S×P(S) + P de M                   sachant Sbarre×P(Sbarre)
         =0,7×0,5 + 0,4×0,5
         =0,35 + 0,2
         =0,55
D'après la formule de Bayes:
P de S sachant M= P de M sachant S× P(S) le tout divisé par P(M)
=0,7×0,5/0,55
=0,35/0,55
~0,63

Question 3:

a-En réalité, on estime que la proportion de spams qui arrivent dans une boîte de messagerie varie entre 55 % et 95 %.

On note alors x la probabilité qu'un message soit un spam.

Ainsi P(S)=x et les valeurs de P de M sachant S et P de M sachant Sbarre sont inchangées.

Modifier l'arbre de probabilité précédant afin de représenter cette nouvelle situation.

(Voir 2eme photo)

b- Exprimer  P de S sachant M en fonction de x. On notera f(x) cette fonction.

P de S sachant M= 0,7x/0,55

c-Étudier les variations de f sur [0 ; 1].

d-Le logiciel classe un message dans le dossier « courrier indésirable » à partir du moment où P de S sachant M?90 %. Déterminer la valeur de x à partir de laquelle un message sera rangé dans ce dossier sachant qu'il contient le mot en question.


Voilà, j'espère que vous pourrez m'aider a trouver les solutions et corriger mes fautes si il y en a.

Merci beaucoup d'avance !



Vous devez être membre accéder à ce service...

Pas encore inscrit ?

1 compte par personne, multi-compte interdit !

Ou identifiez-vous :


Rester sur la page

Désolé, votre version d'Internet Explorer est plus que périmée ! Merci de le mettre à jour ou de télécharger Firefox ou Google Chrome pour utiliser le site. Votre ordinateur vous remerciera !