J'ai tenté hier soir la méthode suivante et j'ai vu ses limites. Vous pouvez m'aider à les résoudre ?
Je cherche à prévoir le score d'un candidat au deuxième tour (que je note St2) en me basant sur les résultats de quelques villes.
Je dis que ce score sera la somme de 3 sous-scores, réalisés sur 3 sous-ensembles (formant une partition) des électeurs - les ensembles étant déterminés par le vote au premier tour. En résumé :
St2 = SOMME sur i de 1 à 3 (nb d'électeurs ayant fait le vote Vi X propension de ces électeurs à voter pour mon candidat au deuxième tour).
Prévoir le résultat de l'élection revient à déterminer ces propensions Pi. Avec les résultats de 3 villes, j'obtiens un système linéaire 3 équations 3 inconnues ; j'inverse la matrice... et j'obtiens des propensions, parfois négatives, parfois supérieures à 1, bref tout sauf du crédible ;-(
Je crois comprendre que c'est mon hypothèse, selon laquelle ces 3 propensions P1, P2, P3, sont identiques dans toutes les villes, qui est fausse. Mais est-ce qu'il serait possible de tomber sur des résultats "corrects" (cad au moins compris entre 0 et 1) en estimant que mon hypothèse est "presque" vraie ?
Est-ce que je peux introduire la contrainte 0 < Pi < 1 dans mon système et comment ? merci de votre aide !
il y a qqchose que je ne comprends pas, quelle est la definition
exacte de V<sub>i</sub> ?
Il devrait y avoir 2 indices : un sur les sous-ensembles et un sur le
nombre de candidats.
Si le nbre de candidats n'es pas pris en compte, les resultats
ne sont pas normalises.
oui excusez-moi je n'ai pas été assez précis.
Dans le contexte de la présidentielle j'avais fait 2 simplifications
:
1) sur les candidats au deuxième tour : comme on connaît assez tôt l'abstention,
et comme il n'y a que deux candidats (disons X et Y), déterminer
le score (en nb de voix) d'UN des candidats au 2-ième tour suffit
à déterminer le résultat complet ;
2) sur les votes au premier tour : j'ai regroupé ces votes en seulement
3 paquets (au lieu de 17 ) ) :
- les votes qui se sont portés sur un candidat du premier tour
ayant appelé à voter pour X au deuxième ; (c'est mon V1)
- idem pour Y ; (c'est le V2)
- 3-ième paquet : les votes qui se sont portés sur un candidat
ayant appelé à s'abstenir au deuxième tour + les abstensions
du premier tour (c'est le V3).
3) en synthèse, si j'appelle X l'estimation des voix de X
au deuxième tour, j'aurais donc :
X = (P1 x V1) + (P2 x V2) + (P3 x V3). V1, V2 et V3 étant connus.
4) Pour calculer P1, P2, P3, je décline ça sur 3 villes a, b, c pour
lesquelles je connais les résultats (bureaux fermant à 18h00) :
V1a .P1 + V2a.P2 + V3a.P3 = Xa
V1b .P1 + V2b.P2 + V3b.P3 = Xb
V1c .P1 + V2c.P2 + V3c.P3 = Xc
j'ai inversé la matrice :
| V1a V2a V3a |
| V1b V2b V3b |
| V1c V2c V3c |
J'ai appliqué cette matrice inversée à (Xa, Xb, Xc) et j'ai obtenu
les résultats aberrants pour P1, P2, P3.
Merci de votre intérêt - à bientôt j'espère !
(nb : ce regroupement est sûrement faiblement pertinent au plan politique
- je voulais juste m'en servir pour valider une formalisation,
et, après, le régler plus finement. Et j'ai des pbs avec la
formalisation).
peux-tu donner les donnees ?
V1 2 3 pour chaque ville et X a b c
Ne rigole pas sur la taille des échantillons - pour avoir des bureaux
fermés à 18h00, il ne faut pas voir trop grand
Ville a :
Tour 1 : V1a = 1576 ; V2a = 420 ; V3a = 1474
Tour 2 : Xa = 2315
Ville b :
Tour 1 : V1b = 1017 ; V2b = 262 ; V3b = 523
Tour 2 : Xb = 1364
Ville c :
Tour 1 : V1c = 1725 ; V2b = 468 ; V3b = 1212
Tour 2 : Xb = 2393
à bientôt,
jm.
le probleme a mon avis est que les equations sont identiques (a peu
de choses pres). Il faut voir l'ensemble des solutions de chaque
equation comme une droite dans une espace a 3D.
chaque equation sensiblement la meme donne une droite tres proche des autres.
Les solutions peuvent donc donner n'importe quoi a moins d'avoir
un echantillon enorme.
le fait que P1 2 3 ne soient pas sensiblements les memes n'a a
priori que peu d'importance lorsqu'on considere ce qui
precede. Il faut resoudre un ensemble d'equation approchees
OK ce WE je vais essayer avec des "villes" fictives plus différenciées.
Sinon, hier soir j'ai tenté "linear equations" + "constraints"
sur GOOGLE, mais je manque de recul et d'expérience dans le
domaine pour trier parmi les multiples voies qui se présentent. J'en
ai vu une qui permet de compléter un tel système (3 eq. 3 inconnues)
par des inéquations genre (ici) : 0 < P1 < 1, mais ce n'est
pas immédiat de l'appliquer à mon pb. Je vais aussi regarder
cela. En attendant : MERCI !! et bon week-end. Jean-Marc.
Vous devez être membre accéder à ce service...
Pas encore inscrit ?
1 compte par personne, multi-compte interdit !
Ou identifiez-vous :