Inscription / Connexion Nouveau Sujet
Niveau école ingénieur
Partager :

test du khi2 avec le logiciel R

Posté par
reverine
13-08-14 à 14:04

Bonjour,

Je suis un peu perdue, ayant loupé les cours de statistiques du semestre dernier... Dans le cadre de mon stage, j'aimerais savoir s'il y a une corrélation entre l'âge des personnes et la possession ou non d'un Iphone. J'ai supposé qu'il fallait faire un test du Khi2 et j'ai fait un tableau de contingence sous excel que j'ai présenté ainsi:
age/IOS yes   no
[20-30]    5     6
]30-40]    1     4
]40-50[    2     6
>50         3     5
(et que j'ai enregistré en csv)
quand j'écris sous R:  chisq.test(IOSage)
on me répond:
Erreur dans chisq.test(IOSage) :
toutes les valeurs de 'x' doivent être positives ou nulles et définies

quelqu'un pourrait m'éclairer s'il vous plaît??? Est-ce un problème de syntaxe sous R ou est-ce mon tableau qui est mal présenté?

merci d'avance

Posté par
LeDino
re : test du khi2 avec le logiciel R 13-08-14 à 21:48

Bonjour,

Un test de Khi2 est complètement inapproprié ici : tu perds l'information liée à l'âge puisque les classes que tu crées ne sont plus ordonnées !
Et ce n'est pas de la statistique... c'est du simple bon sens...
De surcroit tes données sont assez pauvres... donc à première vue l'effet lié à l'âge me semble difficile à mettre en évidence sur ce que tu as fait.

Ce que tu peux tenter en reprenant tes données de départ :
Calculer la moyenne d'âge des détenteurs d'iPhone et celle des non détenteurs.
Puis faire un test de comparaison de moyennes (test de Student).

Posté par
LeDino
re : test du khi2 avec le logiciel R 14-08-14 à 00:39

Citation :
(et que j'ai enregistré en csv)
quand j'écris sous R:  chisq.test(IOSage)
on me répond:
Erreur dans chisq.test(IOSage) :
toutes les valeurs de 'x' doivent être positives ou nulles et définies

Vérifie que tu as correctement chargé ton fichier CSV (il semble que ses valeurs ne soient pas ce que tu attendais).
Pour ça tu affiches l'objet IOSage dans lequel tu l'as chargé (un dataframe ou une matrice je suppose...).
Pour afficher c'est tout simple :

> IOSage


Cela étant dit, ton test de Khi2 est idiot.
Voir mon message précédent.
Et par ailleurs, vue les données dont tu disposes, si les détenteurs d'un IPhone sont plus jeunes, ça ne se voit pas vraiment.
Donc la différence doit être mince, et le peu de données dont tu disposes ne suffira probablement pas à établir si cette différence est significative (je dis ça au pifomètre, parce que je n'ai pas fait le test... mais ça sent à plein nez la cause perdue ton truc ...).

Posté par
LeDino
re : test du khi2 avec le logiciel R 14-08-14 à 13:46

Il est également possible de faire une simple régression linéaire de la variable binaire iPhone (qui vaut 1 en cas de détention d'un iPhone et 0 dans le cas inverse) expliquée par la variable quantitative âge (en revenant aux valeurs de chaque individu si possible).

C'est techniquement un peu différent dans l'approche.
Mais le résultat en terme de significativité est strictement équivalent au test de Student de comparaison de moyennes.

Posté par
reverine
re : test du khi2 avec le logiciel R 14-08-14 à 16:46

Je vous remercie de votre réponse.
Mon raisonnement peut paraître un peu bête mais ça fait longtemps que je n'ai pas fait de statistiques et sans mes cours, je suis un peu perdue...
Je me suis bien rendue compte que je perdais de l'information en créant des classes, mais j'avais vu sur un cas qui me semblait similaire une personne qui disait de faire un tableau de contingence (et un test du khi2...)
J'avais déjà essayé la régression linéaire mais le résultat était plutôt moche.
Raaah je ne suis pas si bête que ça. ^^
Je suis tout à fait consciente que mon échantillon n'est pas assez grand (il faut dire ça aux gens qui ne répondent pas à notre sondage) mais comme je dois rendre un rapport de stage, j'analyse quand même les résultats, c'est la démarche qui compte.
En tout cas, le test de Student me plaît bien et je l'ai vu en cours.

Merci à vous!

Posté par
LeDino
re : test du khi2 avec le logiciel R 14-08-14 à 18:53

Tu peux faire les deux : test de Student ET régression linéaire.
En principe tu dois trouver la même p-value.

Ici avec les données que tu as, ne t'attends pas à des miracles.
Un calcul approché montre qu'il n'y a pas d'écart supérieur à 2 ans entre les deux populations.
Compte tenu de la dispersion de l'âge et du faible nombre d'individus, il n'y a AUCUNE chance pour que la p-value soit inférieure à 0.05 et te permette de conclure dans le sens que tu souhaites.

Pour la forme, tu concluras au non rejet de H0, ce qui revient à dire que tu n'auras pas pu prouver que l'âge influence la détention de l'iPhone.

---
NB : comme tu ne dis pas dans quel "sens" tu pressens l'influence de l'âge, tu dois faire un test bilatéral en toute rigueur (ce qui est plus sévère et permet moins souvent de conclure).

Par ailleurs, sur un plan explicatif il y a au moins deux éléments antagonistes qui pourraient jouer :
1. Un effet "jeunesse" (attraction de l'offre ayant une image jeune).
2. Un effet "économique" (iPhone plus cher, donc adressant les plus riches, donc les plus âgés...)

Posté par
LeDino
re : test du khi2 avec le logiciel R 14-08-14 à 18:55

Citation :
Je me suis bien rendue compte que je perdais de l'information en créant des classes, mais j'avais vu sur un cas qui me semblait similaire une personne qui disait de faire un tableau de contingence (et un test du khi2...)

Il faut être désespéré pour faire ça ...
Ou alors considérer les tranches d'âge comme non ordonnées...
Dans certains cas, ça peut se justifier... mais c'est tiré par les cheveux.

Posté par
LeDino
re : test du khi2 avec le logiciel R 14-08-14 à 18:56

Citation :
J'avais déjà essayé la régression linéaire mais le résultat était plutôt moche.

Oui : parce que les données ne montrent pas d'écart visible.
Et tu auras des résultat tout aussi moches avec Student (encore heureux ...).
Ou sinon, c'est que tu t'es plantée...



Vous devez être membre accéder à ce service...

Pas encore inscrit ?

1 compte par personne, multi-compte interdit !

Ou identifiez-vous :


Rester sur la page

Inscription gratuite

Fiches en rapport

parmi 1742 fiches de maths

Désolé, votre version d'Internet Explorer est plus que périmée ! Merci de le mettre à jour ou de télécharger Firefox ou Google Chrome pour utiliser le site. Votre ordinateur vous remerciera !