Bonjour tout l monde
Je suis doctorant en biologie (donc rien à voir avec les math). Je souhaiterai savoir quel test statistique dois-je utiliser dans ces deux cas de figure :
A - étude comparative entre 4 lots d'animaux (6 animaux / lot) concernant les paramètres biochimiques.
Dans ce cas de figure on aura pour chaque animal un seul résultat correspondant. par exemple: on mesure la glycémie de chaque animal, donc pour chaque animal on aura une seule donné (car on ne peut pas avoir plusieurs valeurs glycémiques à la fois).
B - étude comparative entre 4 lots d'animaux (6 animaux / lot) concernant l'histologie. et c'est la que je me perds en quelque sorte, car pour chaque animal j'aurai une dizaine de résultats. exemple : on doit estimer en moyenne pour chaque animal le nombre de kystes hydatiques. dans ce cas la on aura pour chaque animal plusieurs données (car on retrouve chez le même animale plusieurs kystes).
Voici un petit schéma pour résumer les deux exemples :
Prière de bien vouloir m'orienter..
Cordialement
Bonsoir,
j'espère que ton directeur de thèse connaît quelques statisticiens, qui pourraient t'orienter vers des doctorants en statistiques.
Tel que tu le donnes ici ton problème est très mal posé.
Dans le cas le plus simple, le cas A, on ne sait pas ce que tu veux comparer :
est-ce des moyennes, des variances, les maxima de chaque groupe ?
Et il y a une autre question importante : as tu une idée sur la distributions des données ?
Bonsoir Verdurin
Merci de me l'avoir rappeler, car ce que je dois comparer ce sont des moyennes de quatre échantillons indépendants, suivant une distribution normale.
merci d'avance
Dans ce cas un test de Student semble approprié pour des comparaison 2 à 2 sur les groupes.
Une comparaison globale dépasse mes compétences, qui sont assez faibles.
Telles que tu nous présentes les choses, je ne vois pas de différence entre A et B, si ce n'est qu'en A tu as une variable et en B des variables. Toutes quantitatives. Les variables quantitatives de B peuvent tout à fait être traitées indépendamment les unes des autres.
Pour les variables quantitatives, tu peux faire la classique comparaison de moyennes après vérification de la normalité et de l'homogénéité des variances. Si tu as un témoin et que tu ne compares pas les deux autres traitements entre eux, c'est Dunnett. Si tu compares tous les traitements entre eux, c'est le t-test (ou test de Student).
Si les hypothèse de normalité ou d'homogénéité ne sont pas vérifiées ==> test non-paramétrique. Je connais moins bien, mais en regardant Mann-Whitney-Wilcoxon dans wikipédia, tu devrais trouver ce qu'il faut que tu fasses.
Si tu fais des notations sur une échelle arbitraire, là parcontre, ça se complique. La comparaison de moyenne est toujours possible, mais ça n'a plus trop de sens (imagines que tu notes avec des lettres par exemple ^^).
Le problème quand un biologiste va voir un statisticien, c'est que le statisticien ne comprend rien à ce que lui explique le biologiste. Donc, le statisticien fait à sa sauce puisque le biologiste est incapable de corriger le tir et c'est un carnage. L'exception, c'est quand on a un biologiste qui touche en stats dans l'équipe. Mais c'est très très rare.
vous savez, pour mon mémoire de Master j'avais fait une étude clinique prospective en utilisant le test de Student. J'ai entrepris la même démarche pour mes travaux de recherche en cours, mais y'avait un article scientifique qui m'a un peu laissé perplexe quand j'ai vu qu'ils avaient utilisé le test de Newman-Keuls...
ci joint le lien de l'article en question :
http://heart.bmj.com/content/79/1/78.full.pdf+html?sid=3a85996a-effd-4a33-afb4-f414285635be
merci
Ah oui, une petite question pour te torturer un peu l'esprit. Es-tu certains que tes rats (que tu considères comme tes répétitions) sont indépendants les uns des autres ?
Newman-Keuls, comme Bonferonni et compagnie, c'est quand tu fais beaucoup de comparaisons de moyenne. Quand tu fais une comparaison de moyenne classique entre deux traitements, tu prends un risque de 5% d'identifier à tort une différence. Quand tu fais 10 comparaisons, tu prends ce risque dix fois. La probabilité d'identifier à tort au moins une différence est donc de 1-0.95^10 = 40%. Newman-Keuls permet de rester globalement à 5%. Tu peux utiliser ce test si tu le souhaites.
bonsoir nombrilist,
Merci pour votre réponse. Comme vous l'avez deviné, moi et les stat' on n'est pas très copains copains...bref. En ce qui concerne ma manip', j'ai 4 groupes de rats différents avec dans chaque groupe un effectif donné (n), j'étudie l'effet de deux molécules biologiques différentes (a et b) sur mes rats. sachant que le groupe 1 = témoin, groupe 2= traitement a, groupe 3 = traitement b, groupe 4= placebo.
Ne pleurez pas verdurin...c'est moi qui devrais pleurer pour tout l'argent que j'ai dépensé en prenant des cours de math'...mais sans succès.
J'ai fait de mon mieux pour arriver à résoudre au moins un exo de math mais...y'a pas moyen.
D'accord. Si tu veux comparer tous les groupes entre eux, Newman-Keuls me paraît approprié. Verdurin a répondu vérification de normalité / test de student / attention à l'approche globale. Je n'ai pas tellement dit plus. D'autant plus que Newman Keuls est en réalité Student-Newman-Keuls (SNK).
Enfin, je terminerai en disant que les statistiques expérimentales ne sont pas du tout des mathématiques comme les autres. Surtout quand c'est appliqué à la biologie. Disons que ces méthodes sont les moins pires que l'on ait trouvé pour trancher des résultats de tests biologiques de façon standardisée et objective.
merci nombrilist
Pour être plus explicite (veuillez pardonnez ma maladresse statistique), je voudrais comparer les groupes d'animaux 2 par 2, dans ce cas le test t de Student est applicable si j'ai bien compris.
Je ne comprends pas qu'on puisse entreprendre un doctorat en biologie sans se former un minimum en statistique.
Si ton doctorat repose sur des compétences autres, mets ces compétences en avant et fait l'impasse sur les statistiques.
Mais si les statistiques sont importantes pour ton étude, comment veux-tu être autonome et dire des choses sensées si tu ne maîtrise pas les outils que tu t'apprêtes à employer ?
Les statistiques par correspondance, pour des sujets importants ça devrait être interdit par la loi. Sérieux
.
Mais si ça se joue au pied à coulisse avec des moyennes proches au regard des écart-types... tu ne pourras pas conclure sérieusement.
Donc en résumé, soit tes données donnent des résultats flagrants et le test enfoncera une porte ouverte.
Soit les décisions sont serrées, et il vaut mieux demander l'aide d'un spécialiste, qu'il faudra informer au préalable de tous les aspects du protocole.
Dernier point : j'espère que tu es au début, en phase de conception du plan d'expérience. Tu devrais savoir comment tu vas analyser tes données avant même de mener l'expérience à bien. Je suppose que tu le sais, mais bon...
LeDino, je suis d'accord avec tout ce que tu dis, mais ça reste la théorie. Dans la pratique, si on devait concevoir le plan d'expérience avec le nombre de répétitions nécessaires pour être presque certains de mettre en évidence une différence si il y en a une, il faudrait utiliser 30 rats par traitements, ce qui n'est évidemment pas concevable.
Et si tu savais le nombre d'incapables qu'il y a en stats en biologie... ça pique les yeux. Au moins, aminebio se pose des questions et c'est louable. Je connais plein de chercheurs confirmés qui t'auraient fait des t-test comme des automates sans réfléchir. J'en connais aussi plein qui font n'importe quoi, genre ANOVA pas significative, mais c'est pas grave on fait quand même les comparaisons de moyennes. Enfin, il y a peu de formation statistique de qualité pour les biologistes, car soit elles sont données par des biologistes et comme je l'ai dit, très peu sont compétents et c'est souvent un grand malheur, soit elles sont données par des matheux et là c'est un désastre. Je le sais, j'ai vécu les deux.
Aminebio: utilise le SNK. Le Student seul n'est pas assez conservateur. Tu fais quand même 6 comparaisons de moyennes.
aminebio, je t'ai demandé si tes rats étaient séparés car beaucoup de chercheurs en biologie oublient que des réplicats expérimentaux (ici tes rats) doivent être indépendants les uns des autres. Autrement dit, la physiologie de l'un ne doit pas être liée à la physiologie d'un autre. Par exemple, quand tu as plusieurs rats dans une cage, tu as des relations sociales qui se mettent en place, avec dominants, dominés, etc. Donc, leurs physiologies sont liées. On voit alors bien que les résultats ne veulent plus rien dire. Statistiquement, l'ANOVA ne peut plus être appliquée. D'ailleurs, autre question: as-tu bien fait attention au sexe de tes rats ?
Une autre erreur que font fréquemment les biologistes aussi, c'est de ne pas faire attention à comment ils répartissent les cages dans la pièce. Dans ton cas, tu as 24 cages. L'erreur à ne pas faire, c'est de rassembler les 6 cages de chaque traitement chacune de leur côté. En effet, si tu fais cela, imagine par exemple qu'un groupe soit plus près de la porte que les autres. Alors ceux-là, à chaque fois qu'un utilisateur arrivera, ils seront un peu plus stressés que les autres. Et tu attribueras une différence au traitement alors que c'est simplement une différence d'emplacement ! Idem si ils sont répartis sur plusieurs étages. Certains te verront en entier tandis que d'autres ne verront que tes pieds. Pas top !
Si aucun gradient biaisant les résultats dans la pièce n'est connu, alors il faut d'abord fixer les 24 emplacements de cage et ensuite attribuer aléatoirement un traitement à chaque cage. C'est ce qu'on appelle la randomisation. C'est la moins pire des méthodes en absence de tout renseignement sur des gradients.
Note: je viens de lire un protocole standardisé OCDE (les protocoles qu'ils utilisent pour le test des produits chimiques et probablement des médicaments). Eux, ils rassemblent les rats dans les cages ! Comme quoi en biologie on peut à peu près tout faire et justifier tout et son contraire ^^.
nombrilist, encore une fois merci pour vos explications
Vous avez l'air de savoir aussi bien que moi les difficultés et les contraintes de l'expérimentation. C'est bien beau de vouloir tout faire à la perfection; mais devant la complexité de la situation on fait moins le héro...en fin. Pour l'info aussi, je mène mon étude sur des rats de sexe mâle seulement, pour éviter les fluctuations hormonales qu'on retrouve chez les femelles et qui pourraient éventuellement influer sur les résultats...et si on commence à citer chaque inconvénient entravant notre démarche expérimentale et bien : on peu dire à Dios au sciences du vivant. Parfois il faut voir au de la des limites imposées par les sciences exactes §§§.
Vous savez, parfois on doit "enterrer" notre côté fantaisiste et avoir une vision limitée mais concrète sur les choses. C'est en tout cas mon avis personnel.
.Plan d'étude possible (pour le premier protocole)...
L'objectif est d'appliquer un test de STUDENT de comparaison de moyenne.
C'est le plus simple. Il est approprié pour de faibles échantillons moyennant deux hypothèses : normalité des mesures et homogénéité des variances.
1. Vérifier pour chaque lot si les mesures sont distribuées conformément à la loi normale
Pour évaluer la NORMALITE... au choix :
1.1 Test de Shapiro-Wilk (il vaut mieux être spécialiste, car le test est assez pointu).
1.2 Graphique QQ-Plot (Quantile-Quantile) qui doit donner une droite (test visuel, très présentable dans un rapport).
Beaucoup plus facile à réaliser, par exemple sur tableur.
S'il n'y a pas normalité, il faut en principe passer à un test plus complexe, basé sur la corrélation de rangs (test de Mann Whitney). Réservé au spécialistes.
2. Vérifier l'homogénéité des variances entre les groupes
Si la normalité ne peut pas être rejetée, cela simplifie l'étude, car alors un test de STUDENT de comparaison de moyenne est réalisable sur des populations de tailles réduites (comme ici)... à condition de supposer (ou de prouver) qu'il y a égalité des variances entre les groupes comparés.
Donc pour faire les choses correctement, il faut au minimum calculer et comparer les variances sur chaque lot, voire mieux : faire un test de FISHER de comparaison de variances.
Si malheureusement les variances intra groupe s'avèrent trop différentes entre elles : il faut appliquer un test de Cochran. Réservé aux spécialistes.
Ma foi c'est très bien résumé. Clair, net et sans bavure. J'ai même appris des trucs ^^.
Aminebio, oui je connais les affres de la biologie expérimentale. Je suis passé par là aussi. Je me suis battu avec de nombreux chercheurs pour que leurs plans expérimentaux ressemblent à quelque chose. Trop souvent en vain, malheureusement... Heureusement qu'il y en a comme toi qui se remettent en question et s'en posent (des questions). C'est très bien déjà de n'avoir bossé que sur un seul sexe et un seul rat par cage. Si tu savais le nombre de chercheurs que ça n'aurait pas gêné de mélanger mâles et femelles !
!
Merci bien (navré pour la réponse tardive) j'étais en quelque sorte "déconnecté du monde moderne pour un petit moment"
Oui Le Dino, il s'agissait bien du test de student. Dieu soit loué (bien que ça risque de déplaire à certains athées)
Merci @ vous les gars !!!
...
Vous devez être membre accéder à ce service...
Pas encore inscrit ?
1 compte par personne, multi-compte interdit !
Ou identifiez-vous :