Bonjour à tous,
Quand on a une variable binaire de type 0/1 que l'on veut modéliser par des variables explicatives avec un régression logistique, on peut calculer les résidus de déviance et de Pearson.
Résidu de Pearson:
avec , c'est ce qu'on cherche à modéliser, la probabilité (théorique, estimée) que sachant , vale 1.
Pour les résidus de déviance:
et
.
On conclut en disant que s'il y a n lignes, K coefficients, alors et suit une Khi2 à (n_K_1) degrés de liberté si le modèle est bien fait.
Or, j'ai un modèle avec 57444 lignes, K vaut une vingtaine, la somme des carrés des résidus de Pearson vaut 56900, donc OK, c'est bon, la somme des carrés appartient bien à un intervale de confiance 95% d'une Khi2.
Par contre, la valeur de la somme des carrés de résidus de déviance vaut seulement 22636. Et c'est là que j'hésite:
ou je considère que la valeur n'appartient clairement pas à un IC(95%) d'une Khi2(57424), et je flanque mon modèle à la corbeille
ou je considère que la valeur est encore plus proche de zéro qu'attendu, et donc que ce modèle est absolument mirifique, vu que les résidus sont très bas.
Bref, que faire?
Merci.