Bonsoir,
Je dispose de deux équipes qui vont s'affronter. Il y aura un gagnant et un perdant. Chaque équipe a une note sur 5.
L'équipe A obtient une note de 3.
L'équipe B obtient une note de 2,35.
QUESTION: Quel est leur pourcentage de chance de gagner?
Merci !
Bonsoir
Quelles sont le règles du jeu ? Et comment on détermine un éventuel gagnant ?
Quel est la signification de la phrase : "Quel est leur pourcentage de chance de gagner? " pour qui ?
Comment sont attribuées les notes ?
Qui jouent : des équipes ou de parieurs ?
Qui gagnent : des équipes (selon quel critère ?) , des parieurs (avec quel critère qui permet d'être parmi les gagnants ? ) , des bookmakers , des organisateurs qui reçoivent des dons et qui redistribuent des gains ?
On va avoir du mal à deviner ce que tu cherches !
Ah? Je croyais que mon message avait été effacé sur l'autre forum, d'où ma venue ici. Désolé, je pollue un peu la végétation là ^^
En principe il n'y a nul besoin de connaître les règles du jeu. Ce sont des notes que j'attribue aux clubs de football de 1ère division française selon plusieurs paramètres. Cela est censé être une aide à la décision pour mes paris sportifs.
Je précise ne pas savoir si ce problème a une solution^^ Vu vos réactions, j'ai un peu peur de passer pour un alien !
La note représente le niveau de l'équipe. 5 représente le maximum, 1 représente le minimum. Les 2 équipes s'affrontent avec chacune un niveau respectif. L'équipe A obtient une note de 3, l'équipe B une note de 2.35.
Naturellement, l'équipe A est favorie vu que sa note est supérieure à celle de B. Mais quelles sont ses chances de l'emporter?
Si ça vous chante, vous pouvez essayer avec une équipe A de niveau 4 et une équipe B de niveau 2.
Je pars du principe que si les 2 équipes ont la même note, elles ont chacune 50% de chance de remporter le match.
Merci pour votre aide !
Autre petit détail :
En plus du match nul que tu as écarté, se pose également la question de qui joue à domicile...
A moins de considérer uniquement des matches par élimination directe (sans nul) et sur terrain neutre...
Sinon, en championnat de L1, jouer à domicile procure un avantage quantifiable...
Bonjour LeDino,
Merci pour ta réponse.
Je ne comprends pas en quoi la sévérité du système de notation a une importance.
L'idée est d'estimer la probabilité que possède chaque équipe de gagner COMME SI LE NUL N'EXISTAIT PAS. Il existe ce type de pari sur les bookmaker : le DRAW NO BET, mise remboursée si match nul. Du coup P(A)+P(B)=1
Si cela peut aider, voici comment je procède pour construire ma note d'équipe :
NIVEAU 11 DE DEPART = SOMME DES NIVEAUX DE CHAQUE JOUEUR ALIGNE / 11
+ MOTIVATION EQUIPE
+ COHERENCE TACTIQUE
+ FORME DU MOMENT
le tout divisé par 4
j'obtiens une note X avec 1<X<5.
A cela j'ajoute la note domicile (si l'équipe joue à domicile) calculée sur le nombre de points moyens gagnés à domicile la saison dernière. Exemple, l'équipe a un bilan de 36 pts sur 19 matchs.
36/19= 1.89
Par un produit en croix, pour élever la note sur 5 :
1.89*5/3 = 3.15 = Y
(X+Y)/2 = NOTE FINALE prête à être comparée à l'équipe visiteuse !
OK, tu as répondu sur le match nul : seul la victoire et la défaite t'intéressent, et le nul "annule" le pari.
Tu as répondu aussi implicitement sur l'effet "à domicile" en intégrant cette composante dans le niveau. Soit.
---
Reste le point de blocage de départ : tant que tu ne le comprends pas il te seras impossible d'espérer trouver la probabilité que tu cherches.
Avec le système de notation que tu proposes, tu es capable d'évaluer l'équipe qui reçoit (A) et l'équipe qui visite (B).
Tu as donc deux notes : NA et NB.
Ce que tu cherches c'est une fonction F, qui à deux notes NA et NB associe la probabilité PA pour A de gagner (et la probabilité symétrique PB = 1-PA).
---
Suppose à présent qu'une autre personne du forum ait son propre système de notation. Et qu'il n'aboutisse pas à la même évaluation du niveau de A et de B.
Explique moi par quel miracle on pourrait trouver une fonction F qui marche pour TON système de notation et pour SON système de notation.
Tu vois bien qu'il y a quelque chose qui cloche ?
Quand tu m'auras confirmé que tu as compris, je pourrai t'indiquer des pistes de réflexion.
Et bien, j'imagine que ses propres notes conduisent à un calcul de probabilité différent du mien. Non?
Je comprends bien. C'est ici que la qualité des connaissances du parieur entre en jeu. Plus il note juste, meilleures sont ses estimations ! Il s'agira alors de les comparer avec celles des bookmakers pour dénicher les "value-bet".
Si tu as vraiment compris, alors tu as compris aussi que tu n'obtiendras pas ta probabilité par un calcul "probabiliste".
Il n'y a rien dans ton énoncé qui permette de dire : NA et NB donne PA (et PB).
Ce que tu peux espérer, c'est trouver une fonction F paramétrable, avec NA et NB en argument, et qui produise une valeur respectant les propriétés d'une probabilité, c'est à dire :
- toujours comprise entre 0 et 1,
- respectant F(NA,NA) = 50%
- respectant F(NA,NB) = 1 - F(NB,NA)
- respectant NA>NB ==> F(NA,NB) > 50%
Ensuite si tu appliques ta notation sur les équipes d'un championnat, par exemple L1 2015, tu peux calculer une estimation de PA à domicile et à l'extérieur par simple comptage des victoires et des défaites. Il te reste alors à faire varier les paramètres de ta fonction F pour que les probabilités qu'elle produit coïncident le mieux possible avec les observations passées.
Bonsoir,
Je crois avoir trouvé un système intéressant.
A partir de ce raisonnement tout bête : si l'équipe A est 2 fois plus forte que l'équipe B, sa probabilité de l'emporter est 2 fois plus élevée.
Soit N le "rapport qualité" entre les deux équipes. Ici N=2 car A est 2 fois plus forte que B.
P(B)= 1 / (1+N) = 1 / (1+2) = 1/3
P(B)= 0.33
On a donc
P(A) = 1-0.33
P(A) = 0.67
Exemple:
l'OM obtient la note de 4 tandis que Bastia obtient la note de 2.
N= 4/2 = 2
Plus généralement, sans avoir besoin de calculer ce "rapport qualité",
P(OM)= 1 / (1+ (note OM / note Bastia ) )
donc
P(A) = 1 / (1+ (A/B) )
Autre exemple :
Nantes reçoit Monaco. Note Nantes : 2,97. Note Monaco : 3,14
P(Nantes) = 1 / (1 + (note Monaco / note Nantes ) )
P (Nantes) = 1 / (1+ (3.14 / 2.97) )
P(Nantes) = 1 / (1 + 1.0572) avec 1.0572 = N = rapport qualité
P (Nantes) = 0.4861
Nantes a 48,61 % de chance de gagner contre Monaco MATCH NUL EXCLU.
Qu'en pensez-vous ?
Il ne reste plus qu'une chose à définir : c'est quoi une équipe 2 fois plus forte qu'une autre !
Une équipe qui a un chiffre d'affaires double de l'autre ?
Une équipe qui dépense le double de l'autre en nouveaux recrutements ?
Une équipe qui a le même propriétaire depuis le double d'années que l'autre ?
Une équipe qui a gagné 2 fois plus que l'autre l'année précédente ? Mais avec les nouvelles recrues , on fait quoi ?
Une équipe qui a le double de supporters ?
Une équipe dont le salaire moyen des joueurs est le double de l'autre ?
Une équipe dont l'entraineur est nommé depuis le double d'années que l'autre !
Je ne parle pas de leur pointure ni de l'âge moyen de leurs enfants ou du nombre de femmes que les joueurs ou entraineurs ou propriétaires ont.
Tout ceci est subjectif et ne situe pas dans un espace probabiliste !
Vous faites exprès les z'amis ou quoi ?
Les notes représentent LE NIVEAU de l'équipe, et qui dit NIVEAU dit attribution d'une note dans les DOMAINES REPRESENTATIFS DU NIVEAU (cités plus haut)
Exemple (je partirais sur une note allant de 0 à 6 maintenant):
6: excellent
5: très bon
4 : bon
3 : moyen
2 : faible
1: très faible
0: catastrophique
Je rappelle que je suis conscient de la subjectivité de la note. Ce n'est pas une science exacte, simplement une aide à la décision grâce à des critères sélectionnés par mes soins, CEUX QUI ONT UNE IMPORTANCE NOTABLE.
Pour information, voici les données du dernier championnat de L1.
FD = Fréquences des victoires à Domicile
FD = Fréquences des victoires à l'Extérieur
ND = Niveau à Domicile
NE = Niveau à l'Extérieur
Equipe FD ND FE NE
Paris-SG 98% 5,9 75% 4,5
Lyon 88% 5,3 62% 3,7
Monaco 80% 4,8 71% 4,2
Marseille 76% 4,6 53% 3,2
Saint-Étienne 86% 5,1 58% 3,5
Bordeaux 86% 5,1 42% 2,5
Lille 79% 4,7 31% 1,9
Montpellier 65% 3,9 38% 2,3
Rennes 57% 3,4 38% 2,3
Guingamp 50% 3,0 38% 2,3
Nice 46% 2,8 44% 2,6
Bastia 67% 4,0 27% 1,6
Caen 44% 2,6 42% 2,5
Nantes 58% 3,5 29% 1,7
Reims 50% 3,0 29% 1,7
Lorient 43% 2,6 35% 2,1
Toulouse 62% 3,7 21% 1,3
Evian-TG 41% 2,5 24% 1,4
Metz 40% 2,4 7% 0,4
Lens 33% 2,0 13% 0,8
Merci pour ton apport LeDino, this is really helpful !
Je t'avouerai ma difficulté à te suivre parfois, suis obligé de te relire à plusieurs reprises ^^ Toutefois je crois comprendre la globalité du message (ce qui est très honorable pour un quidam comme moi).
Je vais essayer à mon tour de mettre en pratique la technique. Pour cela, il faut que mes paramètres soient clairement définis (échelle des notation, choix des coefficients, réflexion sur l'ajout d'autres facteurs d'influence...etc). Tout mettre au point prend du temps mais je vais essayer de te livrer cela rapidement. De toute façon je n'ai plus de temps à perdre, le championnat reprend ses droits dans 2 semaines !
Comment trouves-tu 98% de victoires du PSG sur ses matchs à domicile de la saison passée ? l'équipe a enregistré 15 V et 4 N sur 19 matchs. De plus, deux choix sont possibles : Soit tu estimes la performance de l'équipe sur son nombre de victoires par rapport au total de matchs à domicile, soit sur son nombre de points obtenus sur le total possible. Au mieux, (2ème option) tu trouves 85%. Au pire 78%.
Après, NE SURTOUT PAS OUBLIER que la mise en relation des notes finales obtenues conduit à des probabilités sans nul envisagé. Sachant qu'un nul a en moyenne 30% de chance de se produire en football, il faudrait "grignoter" 15% de chaque côté (je n'ai que cette idée en tête pour l'instant !). Donc si une équipe est 2 fois plus forte qu'une autre, le 67/33 se transforme en 52/30/18. See my point ? ^^
Encore merci LeDino, on bosse bien ensemble !!
Bonsoir,
Je cherche à trouver un coefficient multiplicateur pour chaque équipe de L1. Celui-ci me permettra d'obtenir la note de l'équipe, que selon elle reçoit son adversaire ou se déplace. J'essaie tant bien que mal de trouver une formule depuis hier, sans succès...
Ce coeff sera généralement supérieur à 1 si l'équipe joue à domicile
et généralement inférieur à 1 si l'équipe joue à l'extérieur.
Dans le meilleur des mondes, les paramètres suivants seraient associés:
- Avantage général de recevoir ET handicap général de joueur hors de ses bases dans ce championnat
- Tendance saison dernière du club concernée
- Tendance en cours nouvelle saison
Soccerstats peut vous aider.
N'hésitez pas si vous avez d'autres idées !
Merci
Mais pourquoi 15/15 et non pas 15/19 ? Les probabilités de victoire ne tiennent pas compte de l'âpreté à remporter la victoire, donc pourquoi diminuer arbitrairement de 2% un résultat?
Que pensez vous de ma méthode (plutôt amatrice à mon sens) pour passer de P(A) et P(B) aux 3 possibilités incluant le NUL ?
Désolé : dans mon dernier post je t'ai répondu à côté de la plaque sur le passage de PA, PB à P1, PN, P2.
J'ai répondu à une autre question qui aurait été : peut-on évaluer le niveau en général sans tenir compte de l'effet domicile, puis appliquer un correctif. question que tu avais posée avant...
---
Je crois tout à fait possible de passer de PA (et PB=1-PA) à P1, P2, PN, comme tu le proposes
En premier lieu, il suffit d'observer les proportions de nuls obtenus par les équipes fortes pour établir une loi empirique simple...
... du type le NUL est à un peu plus de 30% sur un match équilibré, et il décroit avec le déséquilibre.
Ensuite une fois que tu connais PN, c'est très simple :
P1 = (1-PN)PA
P2 = (1-PN)PB
Exemple :
PA = 0.60
PB = 0.40
PN = 0.30 ==> P1 = 0.42 et P2 = 0.28
C'est bien mieux ainsi, avec la dernière formule que tu m'as donné. En effet la comparaison avec les côtes bookmaker pour les types de pari 1N2 et DRAW NO BET concorde parfaitement. Le perte de proportion est d'autant plus flagrante lorsque le déséquilibre grandit entre les deux équipes.
Sinon, je persiste et signe pour le 15/19. Cela ne rime à rien du tout d'établir un ratio de victoires sur le nombre total de victoires... Peut-être devrais-tu te relire sur ce coup On ne peut pas ignorer totalement le match nul puisqu'il compte comme un match et donc comme une chance (avant détermination du résultat) de victoire.
victoires= 79% = 15/19
défaites = 0% = 0/19
nul = 21% = 100% - 79%
Comme je te l'ai dit, je préfère calculer une note au 11 de départ (somme des notes de chaque joueur divisé par 11), lui appliquer les corrections "forme", "cohésion d'équipe" et "motivation" (je pensais à des BONUS/MALUS de l'ordre de 10 à 30% de la note du 11 de départ, selon l'importance de ces facteurs), ET EN DERNIER LIEU multiplier la note par ce fameux ratio proche de 1 (que je n'arrive pas à déterminer) pour l'avantage maison ou l'handicap extérieur.
Tu l'as souligné, la justesse du correctif est déterminante.
Pour mes expériences, je me suis appuyé sur plusieurs matchs de la saison dernière:
dom ext
équipe PSG OM
note d'equipe 5,36 4,55
bonus/malus confiance
bonus/malus envie +10%
bonus/malus cohésion -10%
note générale 5,896 4,095 (avant détermination dom ou ext)
bonus/malus terrain +10% -10% (application d'un bonus/malus arbitraire en attendant de trouver mieux)
note finale 6,49 3,69
% victoire hors nul 63,76% 36,24%
cote du nul 3,91 (côte vendue par le bookmaker)
% match nul 25,58%
% victoire 1 2 47,46% 26,97%
côte estimée 2,11 3,71 (la côte fabriquée suite à l'expérience)
côte bookmaker 1,64 5,4 (la côte vendue par le bookmaker)
écart 0,78 1,46 (côte book / côte estimée)
nombre de values 0 1 1 signifie qu'il y a un intérêt à parier, ici sur la victoire de l'OM
Bon, on se rend compte sur ce 1er test que le résultat n'est pas terrible, mes prédictions sont bien trop éloignées de la réalité.
Suite de l'expérience...
dom ext
équipe Reims St Etienne
note d'equipe 2,55 3,64
bonus/malus confiance
bonus/malus envie
bonus/malus cohésion -10%
note générale 2,29 3,64
bonus/malus terrain +10% -10%
note finale 2,52 3,28
% victoire hors nul 43,52% 56,48%
cote du nul 3,17
% match nul 31,55%
% victoire 1 2 29,79% 38,66%
côte estimée 3,36 2,59
côte bookmaker 3,67 2,19
écart 1,09 0,85
nombre de values 1 0 il y a ici un intérêt à choisir la victoire des Reims
On s'aperçoit que les côtes calculées sont bien plus proches cette fois.
J'ai réédité l'expérience sur 3 autres rencontres et je trouve des résultats similaires, ce qui est plutôt encourageant, comparé à ce PSG/OM bancal.
Au fait : utiliser les cotes des bookmakers sur des paris est une autre approche astucieuse pour étalonner ton système de niveaux et ta formule.
En effet, on peut supposer que les bookmakers (au moins ceux qui "font les cotes") ont un système d'évaluation des niveaux et une formule. Ils sont bien placés pour étalonner et peaufiner leur dispositif d'évaluation et leur formule... en les recoupant avec les résultats observés : ils ont des moyens, des compétences et les enjeux légitiment la démarche...
Globalement, leurs cotes sont bien faites (sinon il serait facile de les battre).
Donc prendre leur cotes pour estimer les probabilités des matches est globalement astucieux.
Sur un grand nombre de matches ça doit permettre d'arriver à un système cohérent et à peu près calibré.
Ensuite c'est à toi de jouer pour évaluer les niveaux mieux qu'eux... en fonction de ton expertise.
Et de repérer des matches où tu te penses meilleur qu'eux.
Bon, je commence par répondre à quoi ? ^^ (moi le rigolo de service)
Saches d'abord que j'ai parfaitement compris le raisonnement, ma remarque visait la justesse de l'exemple et non la méthode.
Les côtes de PSG/OM étaient celles des victoires respectives, nul compris, même si je ne l'avais pas mentionné. Donc aucune histoire de grosse commission là-dedans, ce serait trop beau. A cette époque là (novembre 2014), Paris était déjà plutôt bien dans ses pompes mais comptait 4 pts de retard sur l'OM. C'était victoire impérative pour combler le trou, et 2 suspensions de joueurs + 1 blessure côté olympien explique ce déséquilibre. En tant normal, c'aurait plus été du 1@1.9 X@3,3 2@4,2.
Il me faudrait trouver cette fameuse fonction G qui accentue le niveau du favori. Car là vu comme c'est parti, je vais trouver la value uniquement chez les outsiders lol (oui tu avais raison !^^).
As-tu ta ptite idée ? Appliquer une augmentation de 25% à la note plus élevée ? Si N(A)=2.8 et N(B)=4 .... N(B)=5 en réalité...
Partir des côtes des book peut s'avérer une excellente idée aussi ! C'est globalement ce que fait un parieur lambda qui n'a pas trop envie de se faire chier. Il regarde la côte et la juge, selon son expérience, basse ou haute. Le souci avec cette pratique c'est qu'elle repose sur un ressenti et non sur un calcul. Avec l'appât du gain le parieur va parfois s'imaginer des value bets alors que y'a rien du tout^^ Je veux éviter ça car c'est du vécu. Je veux me baser sur des résultats mathématiques. Ces derniers étant obtenus grâce à une connaissance la plus approfondie et objective possible. Le sport ne peut se résumer à des stats, d'autres composants rentrent en jeu comme la psychologie et autres détails quantifiables.
Bref, que je parte d'un système de notation ou des côtes toutes faites des book, la problématique est la même: Trouver des arguments probabilistes justifiant la valeur d'un pari.
Bonjour,
Dans le prolongement de mon post précédent, si tu es en mesure de me fournir (par exemple) les cotes des matches retour du championnat de L1 2015 (donc à une époque où les niveaux des équipes étaient supposées évaluées correctement par les bookmakers, et en espérant que les niveaux restent stables dans la durée...), je dois pouvoir calculer un "niveau théorique" dont il sera facile de vérifier si il respecte la propriété que nous recherchons, à savoir rendre la formule du rapport de force globalement cohérente.
Si c'est le cas, cela prouvera de facto qu'une telle échelle théorique de niveau existe.
Tu pourras alors établir ta propre échelle pour les équipe concernée et on devrait pouvoir trouver la fonction G.
Il sera ensuite toujours possible de vérifier les résultats globaux du championnat a posteriori, pour vérifier si le système est cohérent.
Méthode proposée :
Pour chaque match avec un cote connue, on convertit la cote en probabilité PA/PB.
On en déduit tous les rapports de force entre équipes.
On en déduit une hiérarchie des équipes en calculant leur rapport de force moyen.
On classe les équipes : A > B > C > D ... > T
On force à 1 le niveau de l'équipe la plus faible (T)
On adopte pour chaque équipe la moyenne des rapports de force.
Vérification :
Les rapports de forces ainsi calculés devraient en principe peu varier.
On peut le vérifier en calculant l'écart-type et en contrôlant qu'il est faible.
Mais surtout : on applique la formule du rapport de force pour estimer les probabilité des rencontres.
Et on calcule la distance entre ces probabilités et celles induites par les cotes de bookmakers.
Une telle distance peut être par exemple la moyenne quadratique (racine carrée de la moyenne des carrés des erreurs).
On obtient ainsi une sorte "D'ERREUR-TYPE".
Si cette erreur type est faible (par exemple de l'ordre de 3%), alors on est sur la bonne voie.
Cela signifie que la formule du rapport de force est "viable" et qu'on doit pouvoir définir une échelle compatible avec le projet ...
Salut LeDino !
J'ai pas mal avancé de mon côté. Aujourd'hui, chacun des "onze-type" a sa note ainsi que sa force domicile-extérieure. Les prédictions pour les rencontres de la 1ère journée de championnat (dans 8 jours) sont faites. Le résultat est plutôt satisfait car il n'y a plus de value uniquement chez l'outsider. Il y a souvent aucune value des 2 côtés même, ce qui prouve que le book fait bien son boulot et que moi aussi puisque la côte "fabriquée" ressemble à la sienne + sa commission.
Comme je te le disais, je me suis tourné vers l'application d'une constante AU FAVORI dans le but d'accentuer sa domination, et donc augmenter le rapport de force, et donc rééquilibrer mon système initial par cette fonction G.
Sur mes 10 prédictions, il fallait en moyenne trouver autant de value-bets chez le favori que chez l'outsider. Le favori et l'outsider étant bien entendu déterminés par les côtes des bookmakers. Je me suis donc amusé à faire varier cette constante C (ou fonction G) et, sur cet échantillon-là, j'obtiens les résultats suivants :
1 < C < 1,55 : Les value-bets sont plus nombreux chez les outsiders.
1,55 < C < 1,75 : Les value-bets se répartissent de façon plutôt égale.
C > 1,75 : Les value-bets sont plus nombreux chez les favoris.
Je coupe donc la poire en deux et choisis C = 1,65, autrement dit le système s'équilibre quand la note déformée du favori est égale à 165% de sa note théorique.
J'ai bien conscience que l'échantillon est très petit et donc que la valeur de cette constante est seulement approchée. Avec un échantillon plus grand il sera possible d'affiner la fonction.
Qu'en penses-tu LeDino ?! Je bosse bien hein?!!
Je te laisse à disposition ce site http://www.oddsportal.com/soccer/france/ligue-1/ pour ton calcul de niveaux théoriques. Tu trouveras ton bonheur dans RESULTS; il te suffit de choisir la saison passée.
Après... ne pas oublier que les effectifs changent entre temps... donc les niveaux calculés de cette manière peuvent ne plus refléter les niveaux d'aujourd'hui.
Tu as aussi de bonnes bases de données ici http://fr.soccerway.com/national/france/ligue-1/20152016/regular-season/r31546/
et ici http://fr.soccerstats.com/latest.asp?league=france
Enjoy
Bon sang le merdier....
J'ai expérimenté ce coeff d'1,65 sur 10 matchs de la saison dernière. Bilan: 2 values chez le favori et 6 chez l'outsider ! Conclusion: Soit l'échantillon contient des favoris surévalués, soit ce coeff est encore trop imprécis.
J'ai alors mis en commun les résultats de cet échantillon avec ceux de l'échantillon précédent, et le coeff idoine serait 1,80 à présent.
IL FAUT ABSOLUMENT NE PAS SE TROMPER sur l'équilibrage du système sinon je vais droit dans le mur ^^ et mes évaluations auront beau être bonnes, leurs incidences seront nulles. Allez... Plus que 7 jours avant le début du championnat ! Il est encore temps !!!
Bonjour aixorigin,
J'ai repris les 380 matches du championnat 2014-2015 de ligue 1 (depuis ton site)...
Pour chacun d'eux, j'ai traduit en probabilités PA, PB les cotes du bookmaker.
Calcul de PA,PB à partir des cotes C1,CN,C2 (rappel) :
PA = C2/(C1+C2)
PB = C1/(C1+C2)
C1 cote de l'équipe à domicile
C2 cote de l'équipe à l'extérieur
On peut prendre les cotes avec ou sans match nul, le résultat est le même et donne la probabilité sans match nul.
Pour convertir PA,PB en P1,PN,P2... il faut une formule qui donne PN en fonction de PA :
Une fois PN déduit de PA :
P1 = (1-PN)PA
P2 = (1-PN)PB
J'ai ensuite établi qu'à partir d'un niveau théorique on pouvait déduire le niveau à domicile et à l'extérieur :
NIVEAU DOMICILE = NIVEAU * 1.29
NIVEAU EXTERIEUR = NIVEAU / 1.29
Puis j'ai rempli un tableau avec le NIVEAU THEORIQUE de chaque équipe :
Chaque niveau étant modifiable, je les ai fait varier jusqu'à trouver le minimum de l'erreur entre modèle et référence, sur les 380 matches.
La référence, c'est la probabilité PA déduite des cotes du bookmaker.
Le modèle, c'est la probabilité PA* estimée avec la formule du rapport de force appliquée à deux équipes.
Calcul de PA* à partir des niveaux NA, NB (rappel) :
PA* = NA/(NA+NB)
PB* = NB/(NA+NB)
Avec les niveaux théoriques ainsi calculés, on obtient un écart moyen en valeur absolue de l'ordre de 3.6% entre les probabilités PA et PA*.
C'est raisonnablement faible. Surtout si l'on considère que les équipes ont pu voir leur niveau varier au cours de la saison (le calcul les considère comme fixes), et que les bookmakers avaient des informations au cas par cas qui pouvaient leur faire moduler leur cotes par rapport à la tendance...
Il n'était donc de toutes façons pas imaginable d'avoir un écart entre PA et PA* inférieur à un ou deux pourcents.
Ce résultat confirme selon moi la possibilité de définir un niveau théorique par équipe auquel la formule du rapport de force est applicable pour obtenir la probabilité de l'issue d'une rencontre.
Voici les niveaux théoriques que j'ai obtenus pour 2015.
Equipe Points Diff. NDOM N NEXT
Paris SG 83 47 12,99 10,07 7,81
Lyon 75 39 4,30 3,33 2,58
Monaco 71 25 4,84 3,75 2,91
Marseille 69 34 5,20 4,03 3,12
St Etienne 69 21 4,00 3,10 2,40
Bordeaux 63 3 2,86 2,22 1,72
Montpellier 56 7 2,18 1,69 1,31
Lille 56 1 3,03 2,35 1,82
Rennes 50 -7 2,09 1,62 1,26
Guingamp 49 -14 1,75 1,36 1,05
Nice 48 -9 1,68 1,30 1,01
Bastia 47 -9 1,43 1,11 0,86
Caen 46 -1 1,73 1,34 1,04
Nantes 45 -11 1,99 1,54 1,19
Reims 44 -19 1,42 1,10 0,85
Lorient 43 -6 1,88 1,46 1,13
Toulouse 42 -21 2,35 1,82 1,41
Evian TG 37 -21 1,35 1,05 0,81
Metz 30 -30 1,37 1,06 0,82
Lens 29 -29 1,29 1,00 0,78
Salut,
Merci pour ton travail LeDino.
Peux-tu expliquer PN= 0,302-4,08.......
Je suis assez étonné par ta trouvaille. 1,29 me paraît bcp comme coefficient DOM/EXT. En effet, si tu regardes le % moyen de points pris à domicile sur la saison dernière tu obtiens 60%, et donc 40% à l'extérieur. Idem sur la saison 2013/2014 et 2012/2013 !
Du coup, les coeff devraient être 1,2 à DOM et 0,8 à l'EXT, non ?
Voici mes notes d'équipe, basées sur chaque onze titulaire (notes évidemment amenées à changer en fonction de la compo et de la forme des joueurs au moment du match):
PSG 5,27
LYON 4,36
MONACO 4,09
MARSEILLE 3,82
LILLE 3,64
ST ETIENNE 3,45
BORDEAUX 3,27
MONTPELLIER 3,27
RENNES 3
TOULOUSE 3
CAEN 2,73
NICE 2,73
REIMS 2,73
LORIENT 2,64
GUINGAMP 2,45
NANTES 2,36
BASTIA 2,18
TROYES 2,18
ANGERS 1,91
GAZ AJACCIO 1,82
De mon côté je vais reprendre des matchs de la saison dernière et appliquer la méthode. Le tout dans l'objectif d'agrandir mon échantillon et de peaufiner la fonction pour le moment égale à : 1,8 x NOTE FAVORI
WOW ! Très impressionnant ! Tu es prof LeDino ?
Effectivement je préfère que chaque équipe ait son propre coeff DOM/EXT. Certaines sont encore plus à l'aise devant leur public, tandis que d'autres sont moins gênées. Ma logique de calcul est la suivante : (% points pris saison passée + moyenne % L1 saison passée + tendance saison en cours) * 2/3
Exemple: Bordeaux a pris 65% de ses points à la maison en 2014/15. La moyenne L1 est 60%. Donc coeff DOM Bordeaux = 0,65+0,6 = 1,25
On en déduit que son coeff EXT = 0,75. (0,35+0,4)
Imaginons qu'au bout de 4 journées de championnat, Bordeaux ait reçu 2 fois et se soit déplacé 2 fois. Nombre de pts gagnés à la maison : 4. Nbre de pts gagnés à l'extérieur: 2.
% pts gagnés à DOM : 67%.
Donc, coeff DOM = 1,25+0,67 * (2/3) = 1,28
Les notes d'équipe (mon post précédent) ne te suffisent pas pour calculer une fonction G ? Que puis-je te donner de plus ?
J'ai fais un truc avec tes notes.
En recoupant tes "niveaux" avec les "niveaux théoriques" (que dorénavant j'appelle "FORCE").
J'obtiens une courbe G qui donne la FORCE en partant de ton NIVEAU (j'insiste sur le "ton" : si tu changes ton échelle, il faudra changer G...).
Bien sûr il y a des points qui s'éloignent de la courbe G...
... Mais ce n'est pas un problème, au contraire.
La force est étalonnée grâce aux cotes des bookmakers.
Or précisément, les points hors courbes sont ceux qui ont été mal cotés tout au long de la saison.
Ainsi par exemple, la courbe indiquerait que LYON a été sous estimée, ce qui veut dire que ceux qui ont joué LYON ont fait des bénéfices...
Tandis qu'à l'inverse, Marseille a été surestimée, et que ceux qui ont joué Marseille vainqueur ont probablement perdu de l'argent.
Il semble que tes propres notes corrigent ces sous estimations...
Donc à mon sens ça conforte plutôt la courbe G.
Essaie la pour calculer les cotes de la première journée de L1 (avec la formule du rapport de force appliquée à tes niveaux transformés par G)...
... ça devrait légèrement améliorer les choses...
Et dis moi ce qu'il en est...
---
Pour l'effet domicile et extérieur, j'ai un recoupement qui se tient.
J'appelle alpha le ratio par lequel il faut multiplier (ou diviser) la force de chaque équipe.
FORCE_DOM = FORCE * ALPHA
FORCE_EXT = FORCE / ALPHA
Sur chaque rencontre entre équipes 1 et 2 j'aurai :
PA = FORCE1_DOM / (FORCE1_DOM + FORCE2_EXT)
PA = ALPHA*FORCE1 / (ALPHA*FORCE1 + FORCE2/ALPHA)
Or, les équipes vont toutes se rencontrer entre elles, donc la force intrinsèque des équipes s'équilibre globalement : FORCE1 = FORCE2 (en moyenne)
Si je suppose ALPHA commun à toues les équipes.
Et si j'applique le calcul de PA sur l'ensemble du championnat, je devrais retomber sur la proportion de victoires FA du championnat.
Cette proportion est de 61.3% environ (sur trois ans de championnat).
Donc je devrais avoir :
PA moyen = ALPHA/(ALPHA + 1/ALPHA) = ALPHA²/(ALPHA²+1)
On en déduit : ALPHA = RACINE(PAmoyen/(1-PAmoyen))
PA moyen peu différent de 61.3% donne : ALPHA = 1.26
Ce calcul est "approximatif" car les fluctuations de niveau créent une distorsion...
... Mais au moins, ce calcul approché confirme que mon ALPHA = 1.29 est très cohérent.
Pour ce qui est de ton 1.2, tu donnes une justification intuitive (avec les points à domicile...), mais tu ne démontres rien...
En particulier tu n'essaies pas d'appliquer les formules que tu as toi même définies...
Si tu as un calcul qui explique pourquoi le ratio "devrait" être de 1.2 je suis preneur...
Mais en l'état, le calcul ci-dessus me semble confirmer la valeur 1.29 comme cohérente.
J'ai fait mieux pour ALPHA :
Pour chaque équipe, j'ai calculé la cote moyenne (moyenne géométrique) de tous les adversaires rencontrés à domicile.
J'ai fait la même chose pour les équipes rencontrés à l'extérieur.
Le rapport des deux donne le rapport entre niveau de chaque équipe à domicile et à l'extérieur.
En prenant la racine carrée de ce rapport on trouve ALPHA par équipe...
Voici ce que ça donne :
Avec ça, non seulement on valide l'ordre de grandeur moyen de ALPHA aux alentours de 1.29...
... Mais surtout on obtient un ALPHA nuancé par équipe ...
Ainsi : Saint-Etienne, Nice, Lorient et Marseille sont les équipes qui bénéficient le plus de l'effet domicile.
Tandis que Guingamp, Caen ou Montpellier en profitent moins...
Que penses tu des valeurs trouvées ?
Cela recoupe-t-il ce que tu sais de ces équipes ?
Monsieur l'ingénieur, cela commence à être compliqué pour un petit apprenti comptable comme moi cela !!!
Avant de réagir à tes messages, je veux m'assurer que l'on se trouve sur le même chemin. A savoir qu'il est impossible de donner une note à une équipe sur l'ensemble d'une saison. Le Lyon de novembre 2014 n'est pas le même Lyon que celui d'août 2014 par exemple. Sa note a grosso merdo été augmentée de 20% grâce à des jeunes en pleine éclosion et une cohésion de groupe absolument folle. Ainsi, comment comparer le niveau actuel de son meilleur 11 avec celui de l'année dernière? A quel moment de l'année dernière faut-il faire la comparaison ? Tu vois le truc...
Le book constate en même temps que le parieur, au fil des rencontres, qu'une équipe est surcôtée ou sous-côtée. Il ne va pas continuer à proposer Lyon @1,80 à domicile alors qu'il enchaîne les victoires. Le niveau de l'équipe n'est pas fixe, les côtes fluctuent en fonction des performances et de l'actu, pas uniquement en fonction du niveau de l'adversaire (qui lui varie aussi). J'ai donc du mal à situer la pertinence de tes notes théoriques, même si je crois que tu y réponds dans ton explication précédente, je cite:
Voici à quoi ressemble le nuage dont je parle...
J'ai mis en relation :
- la grandeur PA calculée à partir des cotes des bookmakers, et qui constitue la référence à prédire,
- la grandeur PA* qui est mon modèle.
PA* est un prédicteur de PA.
Autrement dit : j'essaie de deviner au plus juste les cotes que produiront les bookmakers si ils font la même analyse de niveau que moi sur les équipes en présence.
A partir de là, si le modèle est juste, et que PA* diverge de PA, c'est en raison d'une divergence d'expertise sur les niveaux.
Les points sont les matches du championnat.
Les points qui s'éloignent de la tendance correspondent probablement aux matches pour lesquels le modèle se trompe parce qu'il n'est pas à égalité de connaissance avec le bookmaker et qu'il applique des niveaux constants alors que ceux-ci fluctuent certainement et que les bookmakers en tiennent comptent.
Mais la tendance du modèle reste néanmoins très visible.
Si j'ai le temps un jour, j'essaierai de trouver comment faire varier le niveau d'une équipe dans le temps, pour aboutir à un modèle plus précis.
Bon sang y'a du level là, on est chaud patate!!!! (tu, surtout^^)
We look like fucking researchers !
Bon, calmons-nous. Cela ne signifie en rien que je vais violer les bookmakers, quitter mon boulot et partir en vacances à l'autre bout du monde.
Je suis rassuré sur la pertinence des niveaux théoriques à présent. Effectivement l'objectif était de trouver la bonne fonction/déformation pour N. Celle-ci sera valable pour les années suivantes n'est-ce pas ? A l'inverse d'alpha qui lui doit être mis à jour chaque été ?
PA moyen = 61,3% OK je te suis, pas de pb là dessus. Mais comment passes-tu de ce pourcentage à un indice ALPHA de 1,26 ??? En fait je crois qu'il faudrait me réexpliquer ton tableau avec C2DOM, ALPHA et C1EXT...
Prenons Paris : C2DOM= 3,21 signifie que Paris au Parc des Princes est en moyenne 3,21 fois plus fort que son adversaire ? C1EXT= 1,98 donc Paris est quasiment 2 fois plus fort que l'adversaire qu'il rend visite? Pourquoi prendre la raciné carré du rapport ? et de quel rapport d'ailleurs ? DOM ou EXT ?
ALPHA s'applique t-il à la note ou à la côte ?
Il n'y a pas de souci, prends tout le temps qu'il te faut pour respirer. Ca tiendrait qu'à moi... je t'aurai filé le prix Nobel et 10 brunes en maillot de bain (j'espère que tu préfères pas les blondes) !
Je suis très très content du résultat et vais partir sur cette fonction pour le début du championnat. Ce dernier commence dans... 3 petits jours maintenant ! Y'a plus vraiment le time d'améliorer des travaux qui semblent de toute manière largement satisfaisants. Puis... ma compréhension totale du chmilblick viendra avec le temps. J'aurai simplement voulu être fixé sur les COEFF DOM/EXT (ALPHA). Savoir quel système j'apprivoise. Le mien n'a pas l'air si dégueu, s'applique directement à la note (et non à la côte comme ALPHA ?), et a l'avantage de prendre en considération les tendances de la saison en cours.
What do YOU think ?
Vous devez être membre accéder à ce service...
Pas encore inscrit ?
1 compte par personne, multi-compte interdit !
Ou identifiez-vous :