Quel test statistique choisir ???

 Niveau doctoratPartager :
			        
Quel test statistique choisir ???
Posté par 
aminebio  28-02-14 à 19:32
Bonjour tout l monde 

Je suis doctorant en biologie (donc rien à voir avec les math). Je souhaiterai savoir quel test statistique dois-je utiliser dans ces deux cas de figure :

A - étude comparative entre 4  lots d'animaux  (6 animaux / lot) concernant les paramètres biochimiques.

Dans ce cas de figure on aura pour chaque animal un seul résultat correspondant. par exemple: on mesure la glycémie de chaque animal, donc pour chaque animal on aura une seule donné (car on ne peut pas avoir plusieurs valeurs glycémiques à  la fois).

B - étude comparative entre 4  lots d'animaux  (6 animaux / lot) concernant l'histologie. et c'est la que je me perds en quelque sorte, car pour chaque animal j'aurai une dizaine de résultats. exemple : on  doit estimer en moyenne pour chaque animal le nombre de kystes hydatiques. dans ce cas la on aura pour chaque animal plusieurs données (car on retrouve chez le même animale plusieurs kystes).

Voici un petit schéma pour résumer les deux exemples :

Prière de bien vouloir m'orienter..

Cordialement 

 Posté par 
verdurinre : Quel test statistique choisir ???  28-02-14 à 20:44
Bonsoir,

j'espère que ton directeur de thèse connaît quelques statisticiens, qui pourraient t'orienter vers des doctorants en statistiques.

Tel que tu le donnes ici ton problème est très mal posé.

Dans le cas le plus simple, le cas A, on ne sait pas ce que tu veux comparer : 

est-ce des moyennes, des variances, les maxima de chaque groupe ?

Et il y a une autre question importante : as tu une idée sur la distributions des données ?
 Posté par 
aminebiore : Quel test statistique choisir ???  28-02-14 à 22:23
Bonsoir Verdurin

Merci de me l'avoir rappeler, car ce que je dois comparer ce sont des moyennes de quatre échantillons indépendants, suivant une distribution normale.

merci d'avance

 Posté par 
verdurinre : Quel test statistique choisir ???  28-02-14 à 22:27
Dans ce cas un test de Student semble approprié pour des comparaison 2 à 2 sur les groupes.

Une comparaison globale dépasse mes compétences, qui sont assez faibles.
 Posté par 
nombrilistre : Quel test statistique choisir ???  28-02-14 à 22:43
Telles que tu nous présentes les choses, je ne vois pas de différence entre A et B, si ce n'est qu'en A tu as une variable et en B des variables. Toutes quantitatives. Les variables quantitatives de B peuvent tout à fait être traitées indépendamment les unes des autres.

Pour les variables quantitatives, tu peux faire la classique comparaison de moyennes après vérification de la normalité et de l'homogénéité des variances. Si tu as un témoin et que tu ne compares pas les deux autres traitements entre eux, c'est Dunnett. Si tu compares tous les traitements entre eux, c'est le t-test (ou test de Student).

Si les hypothèse de normalité ou d'homogénéité ne sont pas vérifiées ==> test non-paramétrique. Je connais moins bien, mais en regardant Mann-Whitney-Wilcoxon dans wikipédia, tu devrais trouver ce qu'il faut que tu fasses.

Si tu fais des notations sur une échelle arbitraire, là parcontre, ça se complique. La comparaison de moyenne est toujours possible, mais ça n'a plus trop de sens (imagines que tu notes avec des lettres par exemple ^^).

Le problème quand un biologiste va voir un statisticien, c'est que le statisticien ne comprend rien à ce que lui explique le biologiste. Donc, le statisticien fait à sa sauce puisque le biologiste est incapable de corriger le tir et c'est un carnage. L'exception, c'est quand on a un biologiste qui touche en stats dans l'équipe. Mais c'est très très rare.
 Posté par 
aminebiore : Quel test statistique choisir ???  28-02-14 à 22:43
vous savez, pour mon mémoire de Master j'avais fait une étude clinique prospective en utilisant le test de Student. J'ai entrepris la même démarche pour mes travaux de recherche en cours, mais y'avait un article scientifique qui m'a un peu laissé perplexe quand j'ai vu qu'ils avaient utilisé le test de Newman-Keuls...

ci joint le lien de l'article en question :

http://heart.bmj.com/content/79/1/78.full.pdf+html?sid=3a85996a-effd-4a33-afb4-f414285635be

merci
 Posté par 
nombrilistre : Quel test statistique choisir ???  28-02-14 à 22:46
Ah oui, une petite question pour te torturer un peu l'esprit. Es-tu certains que tes rats (que tu considères comme tes répétitions) sont indépendants les uns des autres ?
 Posté par 
nombrilistre : Quel test statistique choisir ???  28-02-14 à 22:49
Newman-Keuls, comme Bonferonni et compagnie, c'est quand tu fais beaucoup de comparaisons de moyenne. Quand tu fais une comparaison de moyenne classique entre deux traitements, tu prends un risque de 5% d'identifier à tort une différence. Quand tu fais 10 comparaisons, tu prends ce risque dix fois. La probabilité d'identifier à tort au moins une différence est donc de 1-0.95^10 = 40%. Newman-Keuls permet de rester globalement à 5%. Tu peux utiliser ce test si tu le souhaites.
 Posté par 
verdurinre : Quel test statistique choisir ???  28-02-14 à 22:51
Je vais pleurer tout seul dans mon coin.
 Posté par 
aminebiore : Quel test statistique choisir ???  28-02-14 à 22:56
bonsoir nombrilist,

Merci pour votre réponse. Comme vous l'avez deviné, moi et les stat' on n'est pas très copains copains...bref. En ce qui concerne ma manip', j'ai 4 groupes de rats différents avec dans chaque groupe un effectif donné (n), j'étudie l'effet de deux molécules biologiques différentes (a et b) sur mes rats. sachant que le groupe 1 = témoin, groupe 2= traitement a, groupe 3 =  traitement b, groupe 4= placebo.

 Posté par 
aminebiore : Quel test statistique choisir ???  28-02-14 à 23:08
Ne pleurez pas verdurin...c'est moi qui devrais pleurer pour tout l'argent que j'ai dépensé en prenant des cours de math'...mais sans succès. 

J'ai fait de mon mieux pour arriver à résoudre au moins un exo de math mais...y'a pas moyen. 
 Posté par 
nombrilistre : Quel test statistique choisir ???  28-02-14 à 23:19
D'accord. Si tu veux comparer tous les groupes entre eux, Newman-Keuls me paraît approprié. Verdurin a répondu vérification de normalité / test de student / attention à l'approche globale. Je n'ai pas tellement dit plus. D'autant plus que Newman Keuls est en réalité Student-Newman-Keuls (SNK).

Enfin, je terminerai en disant que les statistiques expérimentales ne sont pas du tout des mathématiques comme les autres. Surtout quand c'est appliqué à la biologie. Disons que ces méthodes sont les moins pires que l'on ait trouvé pour trancher des résultats de tests biologiques de façon standardisée et objective.
 Posté par 
nombrilistre : Quel test statistique choisir ???  28-02-14 à 23:27
Au fait, par curiosité, tes rats étaient maintenus séparément ou en groupe ?
 Posté par 
aminebiore : Quel test statistique choisir ???  28-02-14 à 23:28
merci nombrilist

Pour être plus explicite (veuillez pardonnez ma maladresse statistique), je voudrais comparer les groupes d'animaux 2 par 2, dans ce cas le test t de Student est applicable si j'ai bien compris.
 Posté par 
aminebiore : Quel test statistique choisir ???  28-02-14 à 23:35
j'aurai dans ce cas la six comparaisons : 

 Posté par 
aminebiore : Quel test statistique choisir ???  28-02-14 à 23:38

Pour l'info, les rats sont maintenus dans des cages individuelles.
 Posté par 
LeDinore : Quel test statistique choisir ???  01-03-14 à 01:10
Je ne comprends pas qu'on puisse entreprendre un doctorat en biologie sans se former un minimum en statistique.

Si ton doctorat repose sur des compétences autres, mets ces compétences en avant et fait l'impasse sur les statistiques.

Mais si les statistiques sont importantes pour ton étude, comment veux-tu être autonome et dire des choses sensées si tu ne maîtrise pas les outils que tu t'apprêtes à employer ?

Les statistiques par correspondance, pour des sujets importants ça devrait être interdit par la loi. Sérieux .
 Posté par 
LeDinore : Quel test statistique choisir ???  01-03-14 à 01:19
Citation :
Pour être plus explicite (veuillez pardonnez ma maladresse statistique), je voudrais comparer les groupes d'animaux 2 par 2.
Tu vois ça par exemple, tu aurais du le préciser dès le début... Enfin bref.

J'espère que tes groupes sont très différenciés.

Et que le test servira juste "à faire joli"... et pas à prendre une décision importante dans une "plage de décision critique"...

Si les distributions ont une bonne tête de cloche comme il faut et qu'elle sont bien dissociées d'un groupe à l'autre... c'est d'abord ça qui compte et qu'il faut mettre en avant de façon descriptive.

Si par exemple tu as un groupe A avec mA=10 sA=1,2 et un groupe B avec mB=18 et sB=1,3 tu peux effectivement faire mumuse avec un test de comparaison de moyennes sans prendre un gros risque de te tromper de décision...
 Posté par 
LeDinore : Quel test statistique choisir ???  01-03-14 à 01:27
Mais si ça se joue au pied à coulisse avec des moyennes proches au regard des écart-types... tu ne pourras pas conclure sérieusement.

Donc en résumé, soit tes données donnent des résultats flagrants et le test enfoncera une porte ouverte.

Soit les décisions sont serrées, et il vaut mieux demander l'aide d'un spécialiste, qu'il faudra informer au préalable de tous les aspects du protocole.

Dernier point : j'espère que tu es au début, en phase de conception du plan d'expérience. Tu devrais savoir comment tu vas analyser tes données avant même de mener l'expérience à bien. Je suppose que tu le sais, mais bon...
 Posté par 
aminebiore : Quel test statistique choisir ???  01-03-14 à 01:50
merci pour votre réponse LeDino

J'ai bien saisi votre résonnement : reçu 5/5 
 Posté par 
nombrilistre : Quel test statistique choisir ???  01-03-14 à 07:38
LeDino, je suis d'accord avec tout ce que tu dis, mais ça reste la théorie. Dans la pratique, si on devait concevoir le plan d'expérience avec le nombre de répétitions nécessaires pour être presque certains de mettre en évidence une différence si il y en a une, il faudrait utiliser 30 rats par traitements, ce qui n'est évidemment pas concevable.

Et si tu savais le nombre d'incapables qu'il y a en stats en biologie... ça pique les yeux. Au moins, aminebio se pose des questions et c'est louable. Je connais plein de chercheurs confirmés qui t'auraient fait des t-test comme des automates sans réfléchir. J'en connais aussi plein qui font n'importe quoi, genre ANOVA pas significative, mais c'est pas grave on fait quand même les comparaisons de moyennes. Enfin, il y a peu de formation statistique de qualité pour les biologistes, car soit elles sont données par des biologistes et comme je l'ai dit, très peu sont compétents et c'est souvent un grand malheur, soit elles sont données par des matheux et là c'est un désastre. Je le sais, j'ai vécu les deux.

Aminebio: utilise le SNK. Le Student seul n'est pas assez conservateur. Tu fais quand même 6 comparaisons de moyennes.
 Posté par 
nombrilistre : Quel test statistique choisir ???  01-03-14 à 07:53
aminebio, je t'ai demandé si tes rats étaient séparés car beaucoup de chercheurs en biologie oublient que des réplicats expérimentaux (ici tes rats) doivent être indépendants les uns des autres. Autrement dit, la physiologie de l'un ne doit pas être liée à la physiologie d'un autre. Par exemple, quand tu as plusieurs rats dans une cage, tu as des relations sociales qui se mettent en place, avec dominants, dominés, etc. Donc, leurs physiologies sont liées. On voit alors bien que les résultats ne veulent plus rien dire. Statistiquement, l'ANOVA ne peut plus être appliquée. D'ailleurs, autre question: as-tu bien fait attention au sexe de tes rats ?

Une autre erreur que font fréquemment les biologistes aussi, c'est de ne pas faire attention à comment ils répartissent les cages dans la pièce. Dans ton cas, tu as 24 cages. L'erreur à ne pas faire, c'est de rassembler les 6 cages de chaque traitement chacune de leur côté. En effet, si tu fais cela, imagine par exemple qu'un groupe soit plus près de la porte que les autres. Alors ceux-là, à chaque fois qu'un utilisateur arrivera, ils seront un peu plus stressés que les autres. Et tu attribueras une différence au traitement alors que c'est simplement une différence d'emplacement ! Idem si ils sont répartis sur plusieurs étages. Certains te verront en entier tandis que d'autres ne verront que tes pieds. Pas top !

Si aucun gradient biaisant les résultats dans la pièce n'est connu, alors il faut d'abord fixer les 24 emplacements de cage et ensuite attribuer aléatoirement un traitement à chaque cage. C'est ce qu'on appelle la randomisation. C'est la moins pire des méthodes en absence de tout renseignement sur des gradients.
 Posté par 
nombrilistre : Quel test statistique choisir ???  01-03-14 à 08:01
Note: je viens de lire un protocole standardisé OCDE (les protocoles qu'ils utilisent pour le test des produits chimiques et probablement des médicaments). Eux, ils rassemblent les rats dans les cages ! Comme quoi en biologie on peut à peu près tout faire et justifier tout et son contraire ^^.
 Posté par 
aminebiore : Quel test statistique choisir ???  01-03-14 à 19:59
nombrilist, encore une fois merci pour vos explications 

Vous avez l'air de savoir aussi bien que moi les difficultés et les contraintes de l'expérimentation. C'est bien beau de vouloir tout faire à la perfection; mais devant la complexité de la situation on fait moins le héro...en fin. Pour l'info aussi, je mène mon étude sur des rats de sexe mâle seulement, pour éviter les fluctuations hormonales qu'on retrouve chez les femelles et qui pourraient éventuellement influer sur les résultats...et si on commence à citer chaque inconvénient entravant notre démarche expérimentale et bien : on peu dire à Dios au sciences du vivant. Parfois il faut voir au de la des limites imposées par les sciences exactes §§§.

Vous savez, parfois on doit "enterrer" notre côté fantaisiste et avoir une vision limitée mais concrète sur les choses. C'est en tout  cas mon avis personnel.
 Posté par 
LeDinore : Quel test statistique choisir ???  01-03-14 à 20:22
Citation :
Parfois il faut voir au de la des limites imposées par les sciences exactes §§§.
Oui mais dans ce cas, tu dois avoir l'honnêteté de ne pas leur faire dire plus qu'elles ne le doivent .
 Posté par 
LeDinore : Quel test statistique choisir ???  01-03-14 à 20:57
Plan d'étude possible (pour le premier protocole)...

L'objectif est d'appliquer un test de STUDENT de comparaison de moyenne.

C'est le plus simple. Il est approprié pour de faibles échantillons moyennant deux hypothèses : normalité des mesures et homogénéité des variances.

1. Vérifier pour chaque lot si les mesures sont distribuées conformément à la loi normale

Pour évaluer la NORMALITE... au choix : 

1.1 Test de Shapiro-Wilk (il vaut mieux être spécialiste, car le test est assez pointu).

1.2 Graphique QQ-Plot (Quantile-Quantile) qui doit donner une droite (test visuel, très présentable dans un rapport). 

Beaucoup plus facile à réaliser, par exemple sur tableur.

S'il n'y a pas normalité, il faut en principe passer à un test plus complexe, basé sur la corrélation de rangs (test de Mann Whitney). Réservé au spécialistes.

2. Vérifier l'homogénéité des variances entre les groupes

Si la normalité ne peut pas être rejetée, cela simplifie l'étude, car alors un test de STUDENT de comparaison de moyenne est réalisable sur des populations de tailles réduites (comme ici)... à condition de supposer (ou de prouver) qu'il y a égalité des variances entre les groupes comparés.

Donc pour faire les choses correctement, il faut au minimum calculer et comparer les variances sur chaque lot, voire mieux : faire un test de FISHER de comparaison de variances.

Si malheureusement les variances intra groupe s'avèrent trop différentes entre elles : il faut appliquer un test de Cochran. Réservé aux spécialistes.
 Posté par 
nombrilistre : Quel test statistique choisir ???  01-03-14 à 21:48
Ma foi c'est très bien résumé. Clair, net et sans bavure. J'ai même appris des trucs ^^.

Aminebio, oui je connais les affres de la biologie expérimentale. Je suis passé par là aussi. Je me suis battu avec de nombreux chercheurs pour que leurs plans expérimentaux ressemblent à quelque chose. Trop souvent en vain, malheureusement... Heureusement qu'il y en a comme toi qui se remettent en question et s'en posent (des questions). C'est très bien déjà de n'avoir bossé que sur un seul sexe et un seul rat par cage. Si tu savais le nombre de chercheurs que ça n'aurait pas gêné de mélanger mâles et femelles !
 Posté par 
aminebiore : Quel test statistique choisir ???  07-03-14 à 23:18
merci à  vous tous les gars, merci pour vos réponses éclairées. J'avoue que cela m'a été très utile 
 Posté par 
LeDinore : Quel test statistique choisir ???  08-03-14 à 13:53
Citation :
J'avoue que cela m'a été très utile.

Tant mieux  !

Les hypothèses requises pour un test de STUDENT de comparaison de moyennes étaient-elle finalement remplies (normalité des mesures et homogénéité des variance) ?

As-tu pu réaliser les tests et conclure statistiquement ?

As-tu pu faire vérifier ton travail par un spécialiste ?
 Posté par 
aminebiore : Quel test statistique choisir ???  28-04-14 à 19:05
Merci bien (navré pour la réponse tardive) j'étais en quelque sorte "déconnecté du monde moderne pour un petit moment"

Oui Le Dino, il s'agissait bien du test de student. Dieu soit loué (bien que ça risque de déplaire à certains athées) 

Merci @ vous les gars !!!
  Posté par 
LeDinore : Quel test statistique choisir ???  28-04-14 à 19:29
Citation :
Dieu soit loué 

... (bien que ça risque de déplaire à certains athées)

Tout dépend du prix auquel tu loues ...

Mais en réalité, Dieu n'y est probablement pas pour grand chose...
Il est fréquent qu'on puisse appliquer un test de Student.

En pratique l'hypothèse de normalité est souvent vérifiée (au moins approximativement), surtout si la grandeur mesurée dépend d'un grand nombre de facteurs d'effets additifs (en raison du TCL : Théorème Centrale Limite, qui dit qu'une somme infinie de variables aléatoires tend en loi vers la loi normale).

Et si les populations des lots ont été tirées au sort au sein d'une même population mère, et à moins que le traitement ne réduise ou augmente la variance, alors celle-ci a peu de raisons de changer très significativement d'un groupe à l'autre...

Donc Student est souvent applicable...

Parfois les hypothèses ne sont pas parfaitement respectées...

Mais si la p-value est très inférieure au seuil critique, cela peut faciliter la prise de décision quand même.