Inscription / Connexion Nouveau Sujet
Niveau autre
Partager :

comparaison d'écarts-types

Posté par
ma22
26-12-12 à 17:55

Bonjour,

Je suis étudiante en dernière année d'orthophonie et je réalise mon mémoire de fin d'études. Pour cela, je dois faire des statistiques... mais je n'y connais quasiment rien et avec mon bac L, je n'ai aucun cours là-dessus qui pourrait m'aider. C'est pourquoi je fais appel à vous: en fait, je dois comparer les résultats de deux groupes d'enfants pour voir si la différence de performances est significative ou non. J'ai trouvé comment comparer des moyennes et des pourcentages (certains logiciels libres le font sur internet, c'est bien pratique), mais je ne trouve pas:
- comment calculer une moyenne à partir d'écarts-types: je me retrouve avec plusieurs scores en écarts-types et je dois calculer une moyenne...
- comment comparer des écarts-types entre eux. Par exemple, entre un enfant qui a -1 ET à une épreuve et un autre enfant qui a +0.50 ET à la même épreuve, comment savoir si la différence est significative? Quelle formule faut-il utiliser?
Merci d'avance pour votre aide et bonne soirée!

Ma.

Posté par
JN9
re : comparaison d'écarts-types 27-12-12 à 00:31

Salut alors en terminale s je ne fais plus trop de statistiques. Il me semble qu'il faut
1)élever au carré les écart-types de chaque série pour retrouver la moyenne des écarts au carrés

2) multiplier par le nombre de mesure de chaque série pour retrouver la somme des écarts au carrés

3) additionner ces sommes toutes séries confondues, diviser le résultat par le nombre total de mesures toutes séries, puis mettre à la racine carré. Essaye comme ça pour voir :$

Posté par
LeDino
re : comparaison d'écarts-types 27-12-12 à 02:18

Bonsoir,

En fait tes scores ne sont pas à proprement parler des écart-types.
En particulier : -1 est une valeur négative... donc sûrement pas un écart-type ...

Le score qui est indiqué "en ET" te donne en fait l'écart de performance par rapport à la moyenne, mesuré en écart-type.

Un score :  S1 = -1 ET   signifie que la performance est égale à la moyenne moins un écart-type.
Un score :  S2 = +0,5 ET   signifie que la performance est égale à la moyenne plus un demi écart-type.

Tu peux donc déjà comparer chaque individu avec la population générale :
Le score calculé est probablement supposé suivre une loi normale (en particulier s'il résulte de l'addition de plusieurs composantes aléatoires : questions, tests, mesures...).
Dans ce cas il suffit de lire dans une table le score obtenu en ET, pour situer l'individu dans son percentile.

Tu peux donc également comparer deux individus entre eux en considérant leurs positionnements respectifs.

Pour un groupe donné :
Tu peux comparer sa moyenne (en ET) à la moyenne théorique de référence (0 ET par définition).
Pour celà :
n = nombre d'individus dans le groupe évalué (>30)
m = moyenne des scores du groupe (en ET)
s = écart-type des scores du groupe (en ET)
Z = (m-0)/racine(s²/n)
Z doit suivre une loi N(0,1) :  normale centrée réduite.
Reste à lire dans une table si Z est significativement forte ou faible...
Si le test est significatif, alors la moyenne 'm' obtenue représente un phénomène significatif :
le groupe se distingue de la norme (au seuil de confiance fixé lors du test, en général alpha=0,05).

Si n est faible (inférieur à 30), il faut appliquer un test de Student à n-1 degrés de liberté.

Pour deux groupes comparés :
Tu fais un test de comparaison de moyennes.
Z = (m1-m2)/(s1²/n1 + s2²/n2)
Si n1 et n2 sont grands (>30) alors Z doit suivre une loi N(0,1) :  normale centrée réduite.

Sinon Z doit suivre un t de student à (n1+n2-2) degrés de liberté.

Posté par
LeDino
re : comparaison d'écarts-types 27-12-12 à 02:30

Remarque :
Si tu disposes d'un logiciel qui fait automatiquement les tests de comparaison, il te suffit de rentrer les scores obtenus (exprimés en ET, qui n'est qu'une "unité" particulière...).

Tu peux comparer le groupe A avec la population générale (comparaison de moyenne du groupe en ET, avec la moyenne théorique générale qui est 0 ET).

Tu peux faire de même avec le groupe B.

Et tu peux comparer les groupes A et B entre eux en faisant une comparaison de moyennes.

Posté par
ma22
re : comparaison d'écarts-types 27-12-12 à 12:41

Merci pour vos réponses, je vais essayer d'appliquer ces formules. Je n'ai pas de logiciel qui fait automatiquement les scores de comparaison, malheureusement... J'en ai cherché sur internet, mais sans résultat. Si vous avez des noms de logiciels à me suggérer, je suis preneuse, parce que je ne pense pas que je pourrai faire sans (les stats sont une langue étrangère pour moi).
Quelques précisions: les deux groupes que je dois comparer comprennent plus de 30 individus. Cependant, je ne sais pas si les tests que j'utilise suivent une loi normale (ce qui reviendrait à dire qu'ils sont paramétriques si j'ai bien compris), mais je ne crois pas que ce soit le cas. Est-ce que je peux quand même utiliser le test de Student et les autres formules?

Posté par
LeDino
re : comparaison d'écarts-types 27-12-12 à 17:25

Pour situer UN individu : la loi est nécessaire...
Les scores que tu utilises doivent suivre une loi connue par les concepteurs du score qui ont du l'étalonner sur une population de référence.
Donc avec le score, il doit y avoir un "mode d'emploi".
A défaut, c'est à toi de faire éventuellement une hypothèse (en précisant que ce n'est qu'une hypothèse si tu n'as pas la source formelle qui l'indique).

Souvent les auteurs cherchent à créer un test dont le résultat suit une loi normale.
C'est souvent le cas pour un test de QI par exemple...
En particulier, lorsque le score résulte d'une somme d'un nombre important d'éléments (nombre de résultats justes à une série de questions par exemple), il a d'autant plus de chances de suivre une loi normale (car une somme de variables aléatoires converge vers la loi normale...).

Le fait que les scores soient exprimés en "ET", semble être une invitation à considérer ce score comme suivant une loi normale (sauf mention contraire)...
Cette hypothèse te sera nécessaire si tu veux situer UN individu par rapport à la population d'ensemble.

Mais si tu veux situer un GROUPE par rapport à la population générale, ou comparer DEUX GROUPES entre eux...
Dans ce cas, tu n'as pas besoin que les scores suivent une loi particulière.
Lorsque tu compares des moyennes, tu dois "agréger" un grand nombre de scores. C'est cet agrégat qui fait que la variable Z suit approximativement une loi normale.

Conclusion :  pour comparer des groupes, surtout si les effectifs sont au dessus de 30, tu peux appliquer un test de normalité.

Posté par
LeDino
re : comparaison d'écarts-types 27-12-12 à 17:29

Pas besoin de logiciel spécialisé.
Ce d'autant que tes n1 et n2 sont > à 30.

Tu calcules Z comme indiqué plus haut.
Tu regardes si la valeur est supérieure à 1,96 (seuil de confiance 95%).
Si oui, alors l'écart est significatif au seuil de 95%.

Donne tes calculs ici si tu as un doute...

Posté par
ma22
re : comparaison d'écarts-types 29-12-12 à 08:57

Merci beaucoup LeDino! C'est beaucoup plus clair pour moi Je n'ai pas trouvé de "mode d'emploi" avec les tests utilisés, mais d'après ce que tu dis, on est obligé de supposer que ces tests suivent une loi normale pour situer un individu par rapport à la population d'ensemble, donc je vais partir de cette hypothèse.
Je n'ai pas encore évalué toute la population donc je n'ai pas encore tous les scores, mais je devrais les avoir d'ici fin janvier. J'essayerai de faire les calculs toute seule et je reviendrai ici en cas de doute
Bonne journée et à bientôt!

Posté par
LeDino
re : comparaison d'écarts-types 16-02-13 à 14:51

Up pour ma22...

Posté par
ma22
re : comparaison d'écarts-types 06-03-13 à 10:14

Bonjour,

J'ai bien a
Les deux échantillons sont constitués de 30 et 32 enfants et les tests utilisés ne sont pas paramétriques. Les statistiques ont donc été réalisées à partir du test de Mann et Whitney pour voir si la différence de résultats est significative.
Je m'interroge cependant car on m'a dit qu'il fallait calculer la déviation standard pour chacun de mes résultats (qui je crois correspond à l'écart-type?). Or, je ne sais pas comment calculer cette déviation standard et surtout, je ne sais pas si cela est pertinent dans mon étude étant donné que les tests que j'ai utilisé pour évaluer les enfants ne sont pas paramétriques...

Qu'en pensez-vous? Votre aide me serait précieuse...
Bonne journée !

Posté par
LeDino
re : comparaison d'écarts-types 06-03-13 à 14:25

Citation :
Les deux échantillons sont constitués de 30 et 32 enfants

OK, c'est déjà pas mal pour faire un test qui tient la route.
Donne leur un nom A et B.
Et précise si il y en a un qui est supposé "issu de la population normale".

Citation :
et les tests utilisés ne sont pas paramétriques.

Cette phrase en soi ne veut rien dire.
Parles-tu des tests passés par les enfants ? Dans ce cas, la phrase n'a aucun sens.
Les enfants ont passé par exemple un test "d'aptitude".
Ils ont obtenu un "score", exprimé en ET.

A partir de là, c'est TOI qui décide du type de test "statistique", paramétrique ou non, que tu vas appliquer. Tu donnes l'impression de mélanger les deux...

Pour éviter la confusion, parles de SCORE quand tu parles de résultat du test d'aptitude.
Et garde le terme TEST, pour le test statistique.

Citation :
Les statistiques ont donc été réalisées à partir du test de Mann et Whitney pour voir si la différence de résultats est significative.

Que signifie "ont donc été réalisées" ?
C'est TOI qui l'a fait ?
Quels résultats et conclusions ?

Citation :
Je m'interroge cependant car on m'a dit

Qui ça ?
Si tu as un tuteur qui te guide, il faut suivre ses recommandations, et lui poser des question A LUI.
L'aide qu'on pourra te donner ici, avec très peu d'information et des échanegs limités, sera forcément de moindre qualité que celle donnée par un tuteur qui maîtrise le sujet et son contexte métier...

Citation :
... qu'il fallait calculer la déviation standard pour chacun de mes résultats (qui je crois correspond à l'écart-type?). Or, je ne sais pas comment calculer cette déviation standard et surtout, je ne sais pas si cela est pertinent dans mon étude étant donné que les tests que j'ai utilisé pour évaluer les enfants ne sont pas paramétriques...

Pour pouvoir aider correctement il faut être correctement informé.
Ton résumé n'est pas clair, tes informations sont tronquées et ambigues...
On ne fait pas des statistiques en sondant vaguement l'opinion de gens à l'aveuglette ...

Je ne sais même pas si tu as commencé par appliquer tout simplement les premiers conseils que je t'ai donnés.
C'est tout simple à faire, ça donne de bons repères avant -- éventuellement -- d'aller plus loin avec des théories que tu ne maîtrises absolument pas.

Le test que je t'ai proposé d'appliquer prend 5 minutes à faire :
Tu calcules l'effectif, la moyenne (en ET) et l'écart-type du groupe A : nB mA et sA
Tu calcules l'effectif, la moyenne (en ET) et l'écart-type du groupe B : nB mB et sB
Puis tu calcules la valeur à tester :  Z = (mA-mB)/racine(sA²/nA + sB²/nB)

Z, ici, représente l'écart de moyenne entre les deux populations, "réduit" (pour être ramené à une distribution standard).
Pour n1 et n2 assez grands, Z doit suivre une loi N(0,1) :  normale centrée réduite.
Tu calcules Z, tu regardes dans une table normale la p-value correspondant au Z trouvé.
Si cette p-value est très faible (inférieure au seuil de confiance que tu te fixes, généralement : 0,05), alors tu peux conclure.

Commences par faire ce test (même s'il est éventuellement criticable...).
Et dis nous les résultats que tu trouves.
Au moins : tu auras appliqué un test en le comprenant et tu auras une valeur de référence intéressante.
Et tu pourras aller plus loin ensuite...

Parce que si tu tombes sur Z = 0,3... (p-value élevée) alors c'est pas la peine d'écrire un bouquin : ton groube B n'est pas statistiquement différent du groupe A, quel que soit le test que tu utiliseras par la suite (qui de surcroit a plus de chance d'être moins conclusif).

Et si à l'inverse tu trouves Z = 3 voire mieux (p-value très proche de 0)... alors tu peux toujours envisager d'approfondir la méthode ou le test, pour ne pas prêter le flanc à la critique sur la forme... mais tu sauras déjà que "c'est dans la poche" et que tu as de bonnes chances d'arriver à conclure à la différence significative des deux groupes.

Tu commences par ça, OK ?

Posté par
ma22
re : comparaison d'écarts-types 06-03-13 à 18:55

Merci pour ta réponse LeDino.
Je suis désolée de paraître vague dans mes explications, mais je n'ai jamais eu de cours de stats, donc pour moi, tout cela est du chinois; je n'utilise donc certainement pas les bons termes et dois me débrouiller comme je peux, entre un maître de mémoire très peu présent et mon mémoire à rédiger.
Alors, pour préciser:
- L'une de mes deux populations est effectivement composée d'enfants tout-venant.
- Les scores des épreuves (que j'ai faites passer aux enfants) ayant permis de constituer l'étalonnage ne suivent pas une distribution gaussienne (c'est ce que j'ai voulu dire en disant que ces épreuves n'étaient pas paramétriques, mais je me suis trompée de terme apparemment).
- J'ai fait moi-même les stats avec un site internet qui permet de réaliser automatiquement le test U de Mann et Whitney. Je n'ai eu qu'à rentrer les données, et le site me fournissait la p-value (bien pratique!).Les résultats sont presque tous significatifs au seuil de significativité 5% (p<0.05). Il y en a beaucoup donc je ne vais peut-être pas tous les donner ici.
- C'est une étudiante qui m'a conseillé de calculer les déviations standards, mais je ne sais ni à quoi cela correspond, ni si cela est adapté à mon étude. Ce sont des "on dit", mais n'ayant que peu de réponses de la part de mon maître de mémoire, j'essaie de me renseigner comme je peux...
- Je n'ai pas pu effectuer le calcul de Z comme tu me l'avais conseillé, car la plupart de mes résultats se présente sous forme de pourcentages de réussite ou de scores bruts. L'épreuve dont les scores étaient présentés sous forme d'écarts à la moyenne a finalement été abandonnée. Ma question est donc la suivante: faut-il calculer les déviations standards et si oui, comment?
D'autre part, je ne comprends pas ce qu'est la distribution "standard" dont tu parles, est-ce que c'est la même chose qu'une distribution gaussienne? Est-ce que, du coup, Z correspond à la même chose qu'une déviation standard? Ce n'est pas évident d'expliquer quelque chose dont on ne comprend rien du tout; je précise que je ne veux pas DU TOUT faire des stats mon métier, mais juste comprendre le minimum pour pouvoir faire mon mémoire.
Merci et bonne soirée!

Posté par
carpediem
re : comparaison d'écarts-types 06-03-13 à 19:09

salut

que représente dans la culture anglo-saxonne le terme "standard déviation" ? ....

Posté par
LeDino
re : comparaison d'écarts-types 06-03-13 à 20:00

Bonsoir ma22,

Je viens de lire ta réponse. Je n'ai pas le temps de te répondre maintenant sur le fonc, mais je le ferai.

Pour ce qui est de ta question sur la distribution standard, c'est tout bête.

L'écart de moyenne entre A et B (mA - mB) est supposé suivre une loi normale.
Dans l'hypothèse que tu vas tester, cet écart est supposé nul (i.e.: il n'y a pas de différence entre A et B : hypothèse H0 à rejeter si tu veux prouver qu'il y a une différence).
Donc tu supposes déjà par hypothèse que la loi normale suivie par Z est "centrée" (de moyenne nulle).

En divisant cet écart (mA-mB) par l'écart-type (racine de sA²/nA + sB²/nB), tu ramènes de surcroit la distribution normale au cas particulier de la loi normale "centrée réduite", appelée encore "loi normale standard".
Centrée parce que d'espérance nulle.
Réduite parce que d'écart-type 1.
On a donc "fabriqué" Z de manière à "standardiser" l'écart de moyenne (mA-mB).
C'est juste ça.
Z te donne une variable qui est supposée suivre une N(0,1) : loi normale standard qu'on trouve dans les tables.

OK ?

Posté par
LeDino
re : comparaison d'écarts-types 06-03-13 à 20:04

Citation :
Ma question est donc la suivante: faut-il calculer les déviations standards et si oui, comment?

"Standard deviation" est jsute l'équivalment en anglais de "Ecart-type".

Donc peut-être (surement) faut-il calculer des écart-types pour résoudre ton problème...
Mais lesquels ?
Quelles sont les donénes dont tu disposes ?

Posté par
carpediem
re : comparaison d'écarts-types 06-03-13 à 20:17

merci LeDino ... ce n'est pas de toi que je doutais ....

Posté par
LeDino
re : comparaison d'écarts-types 06-03-13 à 23:51

Citation :
Je suis désolée de paraître vague dans mes explications, mais je n'ai jamais eu de cours de stats, donc pour moi, tout cela est du chinois; je n'utilise donc certainement pas les bons termes et dois me débrouiller comme je peux, entre un maître de mémoire très peu présent et mon mémoire à rédiger.
Raison de plus pour utiliser D'ABORD les concepts les plus simples.
Et n'avoir éventuellement recours à des techniques plus complexes, qu'en connaissance de cause.

Citation :
Alors, pour préciser:
- L'une de mes deux populations est effectivement composée d'enfants tout-venant.
OK. Appelons cette population le groupe A. Et l'autre échantillon, le groupe B.

Citation :
- Les scores des épreuves (que j'ai faites passer aux enfants) ayant permis de constituer l'étalonnage ne suivent pas une distribution gaussienne (c'est ce que j'ai voulu dire en disant que ces épreuves n'étaient pas paramétriques, mais je me suis trompée de terme apparemment).
Je l'avais effectivement "deviné" ainsi.
Tu fais une association entre normalité des scores et application d'un test paramétrique.

On peut pourtant souvent appliquer un test paramétrique même si les scores ne sont pas gaussiens.
C'est le cas notamment quand tu compares les moyennes de deux groupes ayant un grand nombre d'individus.
Parce que dans ce cas, la moyenne elle même est considérée comme suivant approximativement une loi normale (grâce à un puissant théorème appelé "théorème central limite" qui dit que toute somme infinie de variables aléatoires tend vers une loi normale, même si les variables ne suivent pas elles-mêmes une loi normale).

Il suffit donc de disposer d'échantillons de grandes tailles (et ne comprenant pas de valeurs aberrantes susceptibles de fausser l'étude).
Avec plus de 30 individus par groupe, et à moins que tes données ne soient vraiment "bizarres", il est donc très plausible que tu sois dans un cas où on peut appliquer un simple test paramétrique de comparaison de moyennes.

Comme ce test est très simple, et qu'il permet de comprendre la logique des tests statistiques, je te recommande encore une fois de l'appliquer. Au moins sur les variables qui ont une "bonne tête" (à défaut d'être de distribution normale).

Le résultat que tu trouveras sera une référence. Un point de repère.
Tu obtiendras une première p-value "indicative".

Et si par la suite tu affines l'analyse en faisant un test non paramétrique, tu devrais alors trouver une deuxième p-value, qui sera moins petite que la première :  c'est parfaitement logique, car ce test est plus rigoureux et robuste... mais en contrepartie il permet moins souvent de conclure.

Citation :
- J'ai fait moi-même les stats avec un site internet qui permet de réaliser automatiquement le test U de Mann et Whitney. Je n'ai eu qu'à rentrer les données, et le site me fournissait la p-value (bien pratique!).
C'est pratique, mais c'est dangereux :
Tu ne peux pas calculer le test par toi même.
Et tu n'as pas beaucoup de moyen de recoupement...
Celà dit, c'est une démarche astucieuse et courageuse, et je te félicite de l'avoir tentée.

Tu serais plus tranquille si tu faisais d'abord un test paramétrique.
Tu pourrais comparer les deux résultats et vérifier que la p-value-TNP (Test Non Paramétrique) est légèrement plus élevée que la p-value-TP (Test Paramétrique).

Citation :
Les résultats sont presque tous significatifs au seuil de significativité 5% (p<0.05).
Bonne nouvelle.
Ils devraient donc être "encore plus significatifs" sur le test paramétrique (avec les réserves faites plus haut sur son applicabilité).

Citation :
Il y en a beaucoup donc je ne vais peut-être pas tous les donner ici.
Tu peux éventuellement donner un exemple représentatif.
Notamment si tu veux que je confirme le test de Mann et Whitney (qui peut se reconstituer sur EXCEL sans trop de mal).

Citation :
- C'est une étudiante qui m'a conseillé de calculer les déviations standards, mais je ne sais ni à quoi cela correspond, ni si cela est adapté à mon étude. Ce sont des "on dit", mais n'ayant que peu de réponses de la part de mon maître de mémoire, j'essaie de me renseigner comme je peux...
Si elle t'a conseillé ça entre deux stations de métro je ne crois pas qu'il faille prendre ça pour argent comptant. Il y a un demi milliard d'explications au fait qu'elle t'ait dit ça. A commencer par le fait qu'elle ait voulu t'impressionner en étalant une science que de ton coté tu ignores... et que de son coté elle ne maîtrise pas au point de te la communiquer...

Bref. Soit elle est plus précise. Soit elle la ferme .
Entre autre : avait-elle connaissance du test non paramétrique que tu as employé, et est-ce dans ce contexte qu'elle a fait cette recommandation ?
Ce serait étonnant, vu que ce test n'utilise pas les valeurs des scores, mais juste leurs "rangs croisés"...

Citation :
- Je n'ai pas pu effectuer le calcul de Z comme tu me l'avais conseillé, car la plupart de mes résultats se présente sous forme de pourcentages de réussite ou de scores bruts.
On peut parfaitement comparer la moyenne des pourcentages de réussite !
Au contraire même...
Si ce pourcentage est le nombre de réussites divisé par le nombre d'essais, on a là une variable qui a surement "une bonne tête" .

Quant à un "score brut" je ne vois pas ce que c'est.
Mais si c'est calculable pour Mann & Whitney, il y a peu de raison que ce ne le soit pas pour une simple comparaison de moyenne.

Citation :
L'épreuve dont les scores étaient présentés sous forme d'écarts à la moyenne a finalement été abandonnée.
Ca importe peu, mais je serais curieux de savoir pourquoi.
J'espère que ce n'est pas parce que les résultats n'allaient pas "dans le sens voulu" ...

Citation :
Ma question est donc la suivante: faut-il calculer les déviations standards et si oui, comment?
Tu as compris à ce stade que "deviation standard" veut juste dire "écart-type".
Donc il n'y a pas de réponse sensée à ta question sans complément d'information sur son contexte.

Citation :
D'autre part, je ne comprends pas ce qu'est la distribution "standard" dont tu parles, est-ce que c'est la même chose qu'une distribution gaussienne ?
Non.

Standard veut juste dire de moyenne nulle et d'écart-type 1.

Exemple : une loi normale quelconque se note N(m,s) avec m pour moyenne et s pour écart-type.
Si la loi normale est de moyenne nulle, on dit qu'elle est "centrée" : N(0,s).
Si la loi normale est d'écart-type 1, on dit qu'elle est "réduite" : N(m,1).
Et si elle est les deux on dit qu'elle est "centrée réduite" ou encore "standard" : N(0,1).

Par exemple, ton score exprimé en "ET" (écart-type), Eh bien c'est typiquement un score "standardisé".

Le test d'aptitude calcule d'abord une note. Puis il lui retranche la moyenne obtenue dans la population de référence, et divise le tout par l'écart-type de la population de référence. Ce faisant, le score d'un individu pris au hasard dans la population de référence, doit alors suivre une loi "centrée et réduite", donc "standard" (pas forcément "normale" du reste, mais ayant une moyenne nulle et un écart-type à 1).

Les tests de QI pourraient être présentés ainsi également.
La moyenne est à 100. L'écart-type est de 15.
Quelqu'un qui obtiendrait un score de QI de 130 aurait alors une score centré réduit (standardisé) à +2 ET.
Un QI à 115 vaurdait +1 ET, un QI à 100 vaudrait 0 ET par définition. Un QI à 85 vaudrait -1 ET. Etc...
Quand on dispose d'une variable suivant une loi normale, c'est très simple de la centrée : on lui retranche m.
Et c'est très simple de la réduire : on la divise par s.

C'est pour ça que les tests paramétriques ressemblent toujours plus ou moins à un truc du genre écart de moyenne au numérateur, et écart-type au dénominateur.

Citation :
Est-ce que, du coup, Z correspond à la même chose qu'une déviation standard ?
Non. Plus justement, tu peux dire que Z est "standardisée".

Et par ailleurs je rappelle que "standard deviation" signifie simplement écart-type, donc hors sujet.

En revanche, Z est effectivement construite de manière à suivre une loi centrée et réduite, donc standardisée.
Dans le test de comparaison de moyenne, cette loi est de surcroit proche de la loi normale.
On peut donc appliquer la table de la loi normale standard.

Citation :
Ce n'est pas évident d'expliquer quelque chose dont on ne comprend rien du tout; je précise que je ne veux pas DU TOUT faire des stats mon métier, mais juste comprendre le minimum pour pouvoir faire mon mémoire.
C'est tout à ton honneur.
Et c'est l'unique raison pour laquelle je te donne ces explications, ce que je répugne à faire habituellement, tant que pense qu'on ne peut pas faire des statistiques "par correspondance".

Les statistiques sont un sujet trop complexe pour être manipulées au petit bonheur la chance ou suivant des "on-dit". Même si tu reçois de bons conseils, cela reste des conseils isolés, fragmentés, déconnectés de la réalité et du contexte : tout ce qu'il faut pour faire une erreur ensuite...

Donc je renouvelle ma recommandation :  fais absolument au moins UN test paramétrique simple, en faisant tous les calculs toi même (avec un tableur c'est simple). Ne serait-ce que pour comprendre déjà ça. Et eégalement parce que je suis convaincu que ce test a de bonne chances d'être applicables à certaines de tes grandeurs analysées. De surcroit, ce test te donnera un intéressant (et rassurant) point de recoupement avec les résultats des tests plus sophistiqués que tu as éventuellement utilisés.

Et si tu veux, poste ici un exemple que tu as fait.

Bon courage .

Posté par
ma22
re : comparaison d'écarts-types 07-03-13 à 08:05

Bonjour,

L'épreuve avec les résultats sous forme d'écarts à la norme a été abandonnée car elle permettait juste de voir si les résultats des enfants était "pathologiques" par rapport à la norme ou non (il y avait un seuil en-dessous duquel on considérait le résultat comme pathologique par rapport à la norme). Donc aucun intérêt de calculer les moyennes des groupes d'enfants: j'ai compté combien d'enfant se situaient en-dessous de ce seuil dans chaque groupe. Rien à voir avec des résultats qui ne "vont pas dans le bon sens"

Le "score brut" correspond au score obtenu par les enfants (qu'on distingue parfois de note standard), mais on n'utilise pas de notes standards dans les épreuves que j'ai faites passer ici donc nous pouvons garder le terme de "score").

J'ai utilisé un test paramétrique (le test T de Student) comme tu me l'avais conseillé. Par contre, je n'ai pas réussi à le faire moi-même sur Excel car rien que pour le test de Student, Excel propose 5 formules différentes, et ouvre ensuite une fenêtre à laquelle je ne comprends rien... J'ai donc utilisé le site internet dont je t'avais parlé.

On cherche à savoir si la différence entre les groupes A et B est significative pour les praxies bilatérales d'une part, unilatérales d'autre part.

Voici les données dont on dispose (je n'ai pas réussi à joindre un doc Excel, donc je les ai retapées ici, désolée pour la lisibilité...):
soit A le groupe d'enfants tout-venant et B le groupe d'enfants avec trouble du langage.

Praxies bilatérales
- groupe A: 0,64
0,86 ; 0,86 ; 0,93 ; 1 ; 0,5 ; 0,5 ; 0,64 ; 0,93 ; 1 ; 0,57 ; 0,71 ; 0,86 ; 0,57 ; 0,93 ; 0,86 ; 0,86 ; 1 ; 0,86
0,79 ; 0,79 ; 0,86 ; 0,86 ; 0,93 ; 0,79 ; 0,93 ; 0,86 ; 0,79 ; 0,79 ; 0,93 ; 0,86 ; 1.
- groupe B: 0,36
0,57 ; 0,79 ; 1 ; 1 ; 0,57 ; 0,86 ; 0,43 ; 0,71 ; 0,43 ; 0,64 ; 0,79 ; 0,57 ; 1 ; 0,64 ; 0,5 ; 0,36 ; 0,29 ;0,79
0,86 ; 0,43 ; 0,93 ; 0,79 ; 0,64 ; 0 ; 1 ; 1 ; 1 ; 1 ; 1.

Praxies unilatérales
- groupe A: 0,375 ; 0,8125 ; 0,75 ; 0,4375 ; 0,75 ; 0,75 : 0,625 ; 0,5 ; 0,75 ; 0,625 ; 0,625 ; 0,5 ; 0,8125
0,875 ; 0,875 ; 0,5 ; 0,75 ; 1 ; 0,6875 ; 0,625 ; 0,5625 ; 0,875 ; 1 ; 0,875 ; 0,75 ; 0,9375 ; 0,9375 ; 0,5
0,9375 ; 0,875 ; 0,6875 ; 0,75.
- groupe B: 0 ; 0,75 ; 0,5 ; 0,6875 ; 0,375 ; 0,5 ; 0,8125 ; 0,125 ; 0,4375 ; 0,4375 ; 0,25 ; 0,6875 ; 0,4375
0,25 ; 0,6875 ; 0,6875 ; 0 ; 0 ; 0,4375 ; 0,625 ; 0 ; 0,8125 ; 0,375 ; 0,5625 ; 0,5625 ; 0,75 ; 0 ; 0,5 ; 0,5625
0,5.

Ce serait très gentil à toi de vérifier, si tu en as le temps.

Voici les résultats des tests statistiques:
Praxies bilatérales: test de Student: p-value=0.030988312715065
                     test de Mann et Whitney: p-value<0.01
Praxies unilatérales: test de Student: p-value=5.8910471317814E-6
                      test de Mann et Whitney; p-value=1.24

Dans cet exemple, la p-value TNP est légèrement plus élevée que la p-value TP, ce qui est bon signe d'après ce que j'ai compris. Crois-tu que je dois faire un test de student en plus du test de Mann et Whitney pour toutes mes données?
Je me posais la question concernant Z, car j'ai du mal à voir à quoi cela correspond: tu m'as dit qu'il s'agit d'une variable qui est supposée suivre une loi normale, mais concrètement, à quoi cela correspond dans mon étude? Mon maître de mémoire m'a en effet renvoyé des résultats statistiques dans lesquels il donne la p-value et Z, mais je en sais pas quoi faire de ce Z...
D'après ce contexte, penses-tu que je dois calculer les écarts-type, et comment?

Merci pour tes explications et bonne journée!

Posté par
LeDino
re : comparaison d'écarts-types 07-03-13 à 19:55

Bonjour,

Je ne pourrai probablement rgarder ça que demain...

Peux-tu juste me confirmer :

1. Les deux praxis (BI et UNI) correspondent à des grandeurs différentes, donc des scores distincts et donc des tests statistiques spécifiques, c'est bien ça ?

2. Les scores ressemblent à des "taux" (compris entre 0 et 1) et ont des intervalles réguliers :  ce sont à l'origine des nombres de réussites (ou échecs) à un test ou questionnaire, avec une valeur allant de 0 à 14, c'est bien ça ?

3. Les scores ne sont pas triés... a priori leur ordre n'a pas d'importance, c'est bien ça ?

4. Tu as sauté de ligne après la valeur 0,64 du groupe A/BI, mais c'est juste une valeur parmi les autres : en tout 32 valeurs dans le groupe A. C'est bien ça ?

5. Idem pour la valeur 0,36 du Groupe B/BI (32 valeurs).

6. Peux-tu vérifier tes valeurs pour chaque p-value.
Certaines sont supérieures à 1 !!!
S'agit-il de pourcentages ? Dans ce cas il faut l'indiquer...

A plus .


PS:  à "première vue", les données ne suivent pas exactement une loi normale...
Quoi que le groupe A n'en soit pas si éloigné...
Mais en revanche, les données semblent avoir une "bonne tête" (pas d'aberration, répartition régulière, il n'y a que le groupe B qui est un peu "bancal" au sens où un quart des individus sont à 100% malgré leur déficience supposée, mais rien de "méchant")...

Au final (à confirmer) : un test paramétrique me parait tout à fait applicable.

A suivre...

Posté par
ma22
re : comparaison d'écarts-types 07-03-13 à 20:32

Je reprends tes questions et y réponds:

1. Les praxies unilatérales et bilatérales correspondent en effet à des grandeurs, plus précisément renvoient à des items différents. Ce sont donc des scores distincts. Pour voir si la différence entre les deux groupes aux praxies bilatérales est significative par exemple, j'ai pris les résultats du groupe A et ceux du groupe A aux praxies bilatérales et j'ai appliqué un test statistique.

2. Les scores correspondent à des pourcentages (exprimés sous forme décimale), allant donc de 0 à 1. Ils correspondent aux résultats des enfants aux items permettant d'évaluer les praxies bi- ou unilatérales.

3. L'ordre des scores n'a effectivement pas d'importance.

4. et 5. Oui, j'ai sauté une ligne mais cela n'a pas d'importance (erreur de mise en page )

6. Praxies unilatérales au test de Mann et Whitney: p-value=1.5945506028423E-5 (désolée, j'avais du faire une erreur en rentrant mes données).

Groupe A = 32 enfants
Groupe B = 30 enfants

Merci et bonne soirée

Posté par
LeDino
re : comparaison d'écarts-types 08-03-13 à 18:19

Citation :
L'épreuve avec les résultats sous forme d'écarts à la norme a été abandonnée car elle permettait juste de voir si les résultats des enfants était "pathologiques" par rapport à la norme ou non (il y avait un seuil en-dessous duquel on considérait le résultat comme pathologique par rapport à la norme).
OK.
Tu n'as donc pas vraiment "abandonné" les résultats de cette épreuve.
Tu les as juste utilisés différemment...
Si je comprends bien ta démarche, c'est en gros celle que je décrivais dans mon message du 27-12-12 à 02:18, où j'expliquais que si le score que tu utilises est supposé suivre une loi connue (par exemple une loi normale, mais pas forcément), tu peux facilement situer un individu du groupe B par rapport à cette référence, et donc situer chaque portion du groupe B par rapport à la distribution de référence.

Ca peut ressembler à :  "40% des individus du groupe B sont en deça du percentile 5% de la population de référence (c'est à dire du score non dépassé par seulement 5% de la population de référence)... Si le seuil de 5% est appelée limite inférieure de la "norme", alors, 40% des individus du groupe B sont en dessous de la "norme". Ce qui est manfestement beaucoup.

Ici : tu maîtrises la logique qu'il y a derrière et tu es capable de faire tes interprétations toute seule...

Citation :
Donc aucun intérêt de calculer les moyennes des groupes d'enfants: j'ai compté combien d'enfant se situaient en-dessous de ce seuil dans chaque groupe.
OK, voilà qui confirme ...

Citation :
Le "score brut" correspond au score obtenu par les enfants (qu'on distingue parfois de note standard), mais on n'utilise pas de notes standards dans les épreuves que j'ai faites passer ici donc nous pouvons garder le terme de "score").
OK.
Ca n'a pas d'importance en général, parce que de toutes manières, les TESTS staitsistiques sont conçus ensuite pour "standardiser" (centrer et réduire) la variable Z du test.

Citation :
J'ai utilisé un test paramétrique (le test T de Student) comme tu me l'avais conseillé. Par contre, je n'ai pas réussi à le faire moi-même sur Excel car rien que pour le test de Student, Excel propose 5 formules différentes, et ouvre ensuite une fenêtre à laquelle je ne comprends rien...  J'ai donc utilisé le site internet dont je t'avais parlé.
Je comprends et effectivement ce n'est pas toujours simple de faire un test, car il y a effectivment des paramètres à préciser.

Mais d'un autre coté, en te référant à un site qui t'a simplifié les choix, tu ne peux pas être certaine que ces choix "facilités" sont les bons. Peut-être que le site est ben fait et qu'il pose les bonnes questions pour te guider... mais peut-être pas.

Quels degrés de liberté mettre ?
Test unilatéral ou bilatéral ?
La variance est-elle connue ou faut-il la calculer ?
Est-elle la même pour les deux populations comparées ?
... autant de questions pas vraiment "simples".
... mais auxquelles tu n peux pas vrament échapper malheureusement.

Un test statistique est conçu pour être simple d'emploi et pour répondre efficacement à une question clairement formulée. Mais il repose sur un dispositif global complet et tout un raisonnement relativement sophistiqué.
Bien utilisé, le test permet facilement et rapidement, de trouver une p-value qui te permettra de prendre une décision pertinente et en phase avec le seul de confiance que tu te fixes.
Mais la relative "simplicité d'utilisation" du test, cache souvent sa complexité intrinsèque.

T'expliquer en détail dans quel cas on met telle ou telle option, c'est délicat... ça reviendrait à refaire le cours complet de statistique des tests... Je ne serais d'ailleurs même pas bien placé pour ça (je ne suis pas prof, et je ne suis pas praticien régulier de ces techniques).

En revanche, je peux te donner quelques repères "simples" que tu ferais bien de mettre en application par toi même pour mieux comprendre a logique des tests, et aussi pour avoir une première référence à laquelle te raccrocher quand tu es perdue.

Je t'enverrai dans un post ultérieur un premier test élémentaire de type comparaison de moyenne "dans le cas idéal", c'est à dire avec des populations normales, de variance connue.

Lorsque les hypothèses "idéales" sont vérifiées, ce test est vraiment simple : il utilise la loi normale.
Lorsque les hypothèses ne sont pas bien vérifiées, le test n'est en théorie pas applicable.
Toutefois, en pratique, tu peux toujours le calculer, mais en considérant la p-value du test comme un "minorant" de la "vraie" p-value.
Au moins tu disposes déjà d'un premier point de repère et d'un premier garde-fou.

Dans un second temps, je te montrerai comment exploiter le même test avec la loi de Student à n-degrés de liberté.
On verra d'ailleurs que la différence n'est pas si grande (sur tes données à toi)...

Et si j'ai le temps, je te montrerai le Test de W&M sur tes données.
Tu peux même le refaire toi même. C'est un peu de calcul, mais c'est jouable (tu n'as pas des milliers de données), au moins sur un exemple.

Citation :
Résultats des tests statistiques:
Praxies BI :
Test de Student :          p-value = 0.030988...
Test de Mann & Whitney :  p-value < 0.01   (combien précisément ?)

Praxies UNI :
Test de Student :           p-value = 5.891 E-6
Test de Mann & Whitney :   p-value = 1.595 E-5
Le M&W pour le Praxis BI est surprenant : il semble faible par rapport au Student.
Peux-tu vérifier ?

Citation :
Je me posais la question concernant Z, car j'ai du mal à voir à quoi cela correspond: tu m'as dit qu'il s'agit d'une variable qui est supposée suivre une loi normale, mais concrètement, à quoi cela correspond dans mon étude? Mon maître de mémoire m'a en effet renvoyé des résultats statistiques dans lesquels il donne la p-value et Z, mais je en sais pas quoi faire de ce Z...
Quand on applique un test statistique, on exploite en général les travaux d'un stateux qui est passé avant nous et qui a formalisé et mis en théorie une situation donnée, similaire à celle qui nous intéresse.

Ces tests sont tous construits avec l'idée d'exploiter un ensemble précis d'hypothèses, permettant (après calculs et raisonnements...) d'affirmer que telle variable Z doit suivre telle loi avec tels paramètres.

En général, on s'arrange pour standardiser cette variable :  si elle a une moyenne 'm' et un écart-type 's', on calcule quelque chose comme Z = (x-m)/s pour avoir un Z centré (moyenne nulle) et réduit (écart-type = 1).

Ensuite, quand comme on connait la loi suivie par Z (grace au travail du statisticien émérite qui s'est tapé tout le boulot pour nous ...), on n'a plus qu'à regarder dans la table de la loi correspondante, quelle valeur de probabilité correspond à tel valeur de Z calculée sur notre test.

Par exemple, si Z=2, et que la loi de Z est N(0,1) on regarde juste dans une table de la loi normale standard pour y trouver : P(Z<2) ~ 97,7%.
La p-value sera dans ce cas 1-P(Z<2) = 2,3% (pour un test unilatéral).
Et si ton seuil de confiance est de 95%, alors la p-value étant < 5%, ici tu peux conclure et rejeter l'hypothèse que Z suit une loi N(0,1) vu que sa valeur est trop grande pour que ce soit plausible...
... Mais si tu rejettes l'hypothèse que Z est N(0,1), comme c'était une conséquence de ton hypothèse de départ, cela veut dire que celle-ci est à rejeter également. Ca tombe bien : c'est à ça que sert le test !

Donc tu vas pouvoir rejeter l'hypothèse de départ, qui ressemble à quelque chose comme "l'écart de moyenne entre mes deux populations est-il nul ?"...

Citation :
D'après ce contexte, penses-tu que je dois calculer les écarts-type, et comment ?
Question incompréhensible et probablement hors sujet.
Les tests que tu appliques calculent tous des écarts-types, c'est implicite dans la méthode...

La recommandation de ta copine ("faudrait p't'être calculer les déviations standards"...) est comme un chewing-gum collé à ta chaussure .
Ou tu l'appelles pour lui demander ce qu'elle voulait dire, ou tu passes à autre chose...

Posté par
ma22
re : comparaison d'écarts-types 09-03-13 à 10:31

Effectivement, je n'ai pas abandonné les résultats de l'épreuve qui étaient donnés sous forme d'écarts à la moyenne, mais je les ai utilisés différemment. En fait, ce test propose un intervalle de confiance (les résultats se situant dans une certaine fourchette sont considérés comme "normaux", alors que les résultats se situant en-dessous sont considérés comme déviants). C'est beaucoup plus simple, et c'est ce que l'on rencontre souvent dans la pratique orthophonique donc cela me parle plus

Les praxies bilatérales et unilatérales ne constituent qu'un seul point que je veux observer, parmi 6 hypothèses initiales, donc cela fait quand même pas mal de données. Et là où ça se complique, c'est que certaines de ces hypothèses se vérifient parfois à partir de plusieurs épreuves: par exemple, j'utilise deux épreuves pour évaluer les praxies bi- et unilatérales. Je dois donc croiser les données. Par ailleurs, seule deux épreuves sur quatre sont étalonnées, mais ne suivent pas forcément une loi normale; une épreuve propose un intervalle de confiance, l'autre non... enfin, c'est un peu le bazar quoi!

J'ai refait le test de Mann et Whitney pour les praxies BI et j'ai trouvé p=0.1142... Même quand il s'agit de rentrer les données, je ne suis pas douée! Je ne sais pas ce que j'ai fait pour trouver p<0.01 la première fois.

Je vais laisser tomber cette histoire d'écart-types/déviation standard et on verra bien. Ce qui compte je pense, c'est de savoir si les différences observées entre les deux groupes sont significatives.

Merci pour ton aide (il y a du travail avec moi)!



Vous devez être membre accéder à ce service...

Pas encore inscrit ?

1 compte par personne, multi-compte interdit !

Ou identifiez-vous :


Rester sur la page

Inscription gratuite

Fiches en rapport

parmi 1741 fiches de maths

Désolé, votre version d'Internet Explorer est plus que périmée ! Merci de le mettre à jour ou de télécharger Firefox ou Google Chrome pour utiliser le site. Votre ordinateur vous remerciera !