Bonjourà tous, j'ai un petit souci, je suis même complétement bloqué de puis hier soir sur une petite question,
voila je voudrais connaitre la probabilité qu'on a de trouver au moins un mot de longueur n donnée dans un mot de longuer N, ce qu'il faut savoir c que chaque lettre du mot ne peux prendre que 4 valeur et que n<N.
Voila donc au début je me suis dit qu'il ya au moins une donc pour calculer cette probabilité, faut donc passer par son contraire.
Donc je veux réussir à calculer la probabitlité de ne pas trouver un mot donné de longueur n dans un mot de longueur N.
Apres la je reste bloqué comme un con, je ne sais pas par quoi commencé???
si quelqu'un pouvait m'aider ca serais trop cool!!Jujste le début d'une piste
J'ai déja essayé un truc en me disant que il y avit 4^N mot de longuer N possible, donc 4^n mot de longueur n possible.
Il faut donc toutes les n lettres du mot N , on ne trouve pas le mot de longueur n, et la moi j'ai trop de parametre et je m'embrouille tout seul!
Bref merci d'avance pour votre aide.
L'expérience c'est de générer un mot de longueur n et un mot de longueur N et de connaitre la probabilité de trouver au moins une fois le mot de longuer n dans le mot de longuer N. Chaque lettre d'un mot à le chois entre 4 symboles. Par exemple A, B , C ou D!
Tu saisi le truc?
Non je ne saisis pas... générer un mot, qu'est-ce que ça veut dire ?
On a quoi au départ ? Disons un sac rempli de jetons avec 4 symboles différents sur les jetons, on tire N jetons avec remise ? On fait quoi ???
Donc tu tire N fois avec remise pour créer N, tu tire n fois avec remise pour créer n et on doit calculer la probabilité de trouver au moins une fois le mot n dasn le mot N!!
merci bcp de m'aider
Appelons un k-mot un mot de k lettres
"trouver le n-mot dans le N-mot", ça vaut dire qu'avec les lettres du N-mot on peut écrire le n-mot, ou alors il faut que les lettres du n-mot soient dans le même ordre et se touchent dans le N-mot ?
Par exemple, si N=10 et que le N-mot est "abcabcabcd", et si n=4, est-ce qu'on peut dire qu'on trouve le 4-mot "abab" dans le 10-mot "abcabcabcd" ? Ou est-ce que ça peut être seulement "abca", "bcab", "cabc", "abcd" ?
Par exemple , SI N=10 et n=4,
il faut trouver exactement le 4-mot dans le 10-mot , c'est à dire si le 10-mot c'est "abcabcabcd" et le 4mot c'est "abca", il y a 2 fois le 4-mot dans le 10-mot.
Voila en fait le truc
Bon j'ai avancé sur le problèmes t'en pense quoi,
le nombre de mots possibles de n lettres c'est 4^n donc le nombre de mot de n lettres différent d'un mot donné c'est 4^n - 1. La probabilité donc qu'un mot de n lettres soit différent du mot court donné c'est 4^n - 1 / 4^n = (1 - 1/4^n)
Dans un mot de N lettres, il y a N+1-n mot de n lettres, la probabilité donc qu'un mot donné de n lettre ne figure pas dans un mot de N lettre c'est ( (1 - 1/4^n)^(N+1-n) ) soit la probabilité qu'il existe au moins un mot de n lettre dasn un mot de N lettre c' est :
1 - ( (1 - 1/4^n)^(N+1-n) )
voila si t'as un avis contraire fais moi signe
Donc le N-mot de départ est donné, ok.
Dans un mot de N lettres, il y a N+1-n mot de n lettres : oui mais il y en a qui sont identiques, par exemple dans le mot de 10 lettres "abcabcabcd", il y a seulement quatre mots différents de 4 lettres.
Et puis d'abord, tu n'as toujours pas été clair. Tu vas déjà me répondre aux 2 questions que je te pose ci-dessous :
1) La façon de tirer au hasard un mot de longueur n, c'est pareil que faire n tirages au hasard avec remise de jetons placés dans un sac contenant des jetons avec 4 symboles différents, et de noter le mot obtenu ?
2) Le N-mot de départ, on ne le choisit pas au hasard ? Il est donné ? Et on ne sait rien d'autre que sa longueur ?
Excuzez moi tout le monde pour ma clarté,
mais 1) oui c la meme chose.
2)On ne sait rien d'autre de sa longueur c un mot donné au hazard.
Merci encorre pour votre aide
En fait par analogie à de la programmation, c'ewt comme de rechercher une chaine de caractere dasn une autre sauf que la l'ensemble des symboles pour choisir la lettre d'un mot ce n'est pas l'alphabet mais 4 lettre de cet alphabet, moi ce que je veux arriver à calculer c'est la probabilité que cette fonction de recherche marche, c'est à dire trouve au moins une fois le mot.
C'est une question qui vient en fait d'un sujet sur les biopuces adn,
et on demande juste de trouver, je cite : "Quelle est la probabilité de trouver une séquence de n bases (le n-mot) dans un adn génomique consituté de N bases(n<N)?
voila c pour ca que j'ai essayé de le reforumuler avec des mots car je trouvais cela plus simple à expliquer.
vous en pensez quoi?
Ouaip, je me disais que c'était un truc avec l'adn, car j'ai déjà vu des problèmes de ce genre. Je vais y réfléchir.
Oki merci beaucoup car la perso j'arrive mais vraiment à rien ya quelqu'un qui m'a parlé d'arbre décisionnel ou je ne sais trop quoi ,
j'ai même pas réussi à comprendre ce qu'il voulai dire!!
Bon... j'y ai légérement réfléchi mais je ne vois pas trop.
Peut-être qu'on peut s'en sortir en considérant d'abord la première lettre du 4-mot parmi les N-n+1 premières lettres du N-mot, selon le nombre de lettres différentes, il faudrait distinguer les cas...
Sinon t'as pas essayé de chercher sur le ouebbe ? C'est un problème connu, c'est sûr.
Si si j'ai recherché pas mal avant de poster sur le forum mais rien de concluant je continue d'ailleur encore à chercher, le truc c'est que pour distinguer les cas j'ai fait un arbre il est assez grand et je me dis en regardant de loin l'arbre qu'il faudrais utlliser une suite et peut etre par récurence trouver la solution du probleme je vais essayer de regarder ca ce soir.
Bon voila où en est ma réflexion,
On a dans un mot N-n+1 emplacement de n-mot posible dans un N-mot (avec n<N)!
La probabilité de trouver un emlacement égale au n-mot c'est à dire qui comporte les meme symboles est :
Produit pour i de 1 à n de (1/4)^(i).
Donc la probabilité de trouver au moins 1 n-mot dans un N-mot est :
Produit pour i de 1 à n de (1/4)^(i) * (N-n+1)
Vous en pensez quoi?
Vous devez être membre accéder à ce service...
Pas encore inscrit ?
1 compte par personne, multi-compte interdit !
Ou identifiez-vous :