Test de Wilcoxon III et petit échantillon

 Niveau MasterPartager :
			        
Test de Wilcoxon III et petit échantillon
Posté par 
mademoselle  04-06-14 à 14:02
Bonjour,

Je réalise en ce moment des stats pour comparer des occupations du sol. Je vais expliquer un petit peu pour que ce soit plus clair. Je dispose des occupations du sol (forêt, prairie, culture,... 7 paramètres en tout) de 46 nids et sur ce deux années.

Je voudrais comparer chaque nid entre les deux années (nid 1 de 94 et nid 1 de 2011) en comparant donc chaque paramètre: forêt du nid 1 de 94 et forêt du nid 1 de 2011, prairie du nid 1 de 94 et prairie du nid 1 de 2011,...

J'ai choisi un test non paramétrique vu les résultats du test de normalité et vu que k=2 et échantillons appariés j'ai pris le test de Wilcoxon III. 

Le problème est que mes résultats sur R sont vraiment bizarres, j'ai des valeurs qui se répètent pour la p-value: 0.8339, 0.7874, 0.5896, plusieurs fois pour différents nids.

Etant donné que j'avais fait le même boulot mais dans le sens inverse (comparaison du paramètre forêt pour tous les nids d'une même année avec le paramètre forêt de l'autre année soit 46 valeurs à comparer), j'en déduis que ce sont peut-être mes pauvres 7 valeurs qui posent problème? Une histoire de n<30 peut-être? Vu que ici j'ai n=7.

Voilà, si vous pouviez m'éclairer ce serait super

Merci beaucoup!
 Posté par 
LeDinore : Test de Wilcoxon III et petit échantillon  04-06-14 à 14:50
Pas clair ton exposé...

Wilcoxon est utilisé comme solution de secours lorsque les conditions ne sont pas respectées pour Student (normalité, effectifs, égalité de variances).

Mais dans les deux cas, ce qu'on fait c'est une comparaison de moyennes entre deux groupes.

Je peux imaginer que le premier groupe c'est 1994 et le second 2011.

Mais quid des 7 paramètres dont tu parles ?

Mesurent-ils la même chose et les utilises-tu pour calculer une "moyenne annuelle" ?

Si c'est le cas, le sens de ces paramètres (forêt, prairie on s'en tape, et ta présentation est bizarre.

Si ce n'est pas le cas, alors je comprends mal ce que ton test est sensé évaluer comme hypothèse...

Là on a l'impression que tu disposes de 2 * 7 * 46 valeurs (2 années * 7 paramètres * 46 nids)...

... et que tu cherches à faire 46 tests...

Carrément bizarre !

En plus il est où la caractère aléatoire des 7 valeurs que tu moyennes  ?!?

Chimique ton truc...

carrément chelou même.

Citation :
... comparaison du paramètre forêt pour tous les nids d'une même année avec le paramètre forêt de l'autre année soit 46 valeurs à comparer

Ah ben là oui, on comprend mieux le test.

Tu moyennes le même paramètre, par exemple "forêt", sur 46 nids, supposés être aléatoirement représentatifs d'une "population de nids" que tu compares entre 1994 et 2011.

Là c'est OK.

Je crois que le succès de ta première analyse t'a un peu grisée et poussée à des grosses fantaisies  !
 Posté par 
mademosellere : Test de Wilcoxon III et petit échantillon  05-06-14 à 10:24
Déjà merci beaucoup de m'avoir répondu!

Oui Wilcoxon est utilisé lorsque les conditions ne sont pas respectées pour Student pour cela que je dois l'utiliser.

Ah oui je crois comprendre que j'ai fait un truc farfelu du coup ce coup ci .

Bon par contre je vais quand te réexpliquer mieux pour que tu me dises si quelque chose est faisable. Du coup je vais préciser le contexte (pas évident sans montrer la carto d'expliquer).

Sur le terrain où je vais il y a une espèce d'oiseau en voie de disparition. Sauf qu'en 94 il y avait 46 couples sur le site. Du coup pour voir si ce sont les changements d'occupations du sol (disparition des prairies, augmentation des cultures,...)qui en sont la cause j'ai cartographié les 46 nids en 1994 et en 2011.

Je me retrouve donc avec deux beaux tableaux avec pour chacun de mes nids, la surface de forêt, prairie, culture,... qu'il y a.

Après j'ai voulu voir si entre les deux années, pour l'ensemble des nids, il y avait des différences dans les surfaces de forêt (je compare donc forêt 94-forêt 2011, prairie 94 prairie 2011,... sans tenir compte des nids). C'est ce que j'ai fait et où les résultats correspondent à quelque chose.

Sauf que j'aimerais, dans l'autre sens, savoir si en prenant le nid n°1 de 94 et le nid de 2011 il y a des différences dans les occupations du sol. Du coup genre pour le nid 1 (puisque je dois faire chaque nid l'un après l'autre) je voudrais comparer la surface de forêt de 94 avec celle du nid 1 de 2011.

J'ai donc 46 calculs à faire ici.

Et sans pouvoir faire ça je ne peux pas savoir quels sont les anciens nids encore utilisables aujourd'hui par l'espèce et quels sont ceux qui en changeant d'occupation du sol ont induit son abandon du site (vu qu'elle revient tous les ans au même endroit).

Tu vois?

Et là, pour le nid 1 par exemple, bah je me retrouve avec deux échantillons appariés dont je voudrais comparer les 7 valeurs de surfaces entre les deux dates.

Comment faire alors?

J'espère que j'ai pu être clair

Merci!
 Posté par 
LeDinore : Test de Wilcoxon III et petit échantillon  06-06-14 à 01:22
Purée mademoselle, mais qu'est-ce que tu expliques mal !

C'est impossible de te suivre...

Et puis franchement, ton étude n'inspire pas une grande confiance...

Citation :
Sur le terrain où je vais il y a une espèce d'oiseau en voie de disparition. 

Sauf qu'en 94 il y avait 46 couples sur le site.
Pourquoi "sauf"  ?

Citation :
"Du coup pour voir si ce sont les changements d'occupations du sol (disparition des prairies, augmentation des cultures,...) qui en sont la cause"
Mais la cause de QUOI  ???

Citation :
 j'ai cartographié les 46 nids en 1994 et en 2011.
Ce qui veut dire quoi ? 

Tu les as repérés sur une carte en vue d'évaluer la nature des surfaces autour, c'est ça ?

Citation :
Je me retrouve donc avec deux beaux tableaux avec pour chacun de mes nids, la surface de forêt, prairie, culture,... qu'il y a.
Surface exprimée comment ? En pourcentage sur un périmètre environnant ? Parce que sinon ça n'a pas grand sens...

Citation :
Après j'ai voulu voir si entre les deux années, pour l'ensemble des nids, il y avait des différences dans les surfaces de forêt (je compare donc forêt 94-forêt 2011, prairie 94 prairie 2011,... sans tenir compte des nids).
Sans savoir ce que représentent ces surfaces c'est difficile de se faire une idée... mais admettons qu'il s'agisse de proportions.

Plus grave : ta comparaison entre deux époques elle te sert à quoi au juste ?

Tu regardes juste l'évolution des surfaces...

Pour quoi faire ?

Comment fais-tu un lien entre l'évolution des surfaces et ce qui arrive aux nids ???

Est-ce que tu sais seulement ce qui leur arrive à ces nids ???

Tu n'en parles pas  !!!

Citation :
C'est ce que j'ai fait et où les résultats correspondent à quelque chose.
Tu me fais peur...

Tu veux dire par là que tu as des p-value significatives et qu'avec ça tu es contente parce que ça "ressemble" à un "résultat".

Mais un résultat de quoi ?

Quelle est l'hypothèse  que tu fais dans ton test ?

Et surtout, elle est où la LOGIQUE de l'étude ?
Qu'est-ce que tu as mesuré en moyenne AVANT et APRES, que tu peux comparer ?

Juste l'évolution moyenne des surfaces ?

Quel lien avec les nids ???

J'ai l'impression que ta première analyse est vide de sens.

Avant de faire un test, il faudrait que tu fasses une synthèse descriptive de l'effet que tu penses avoir observé.

Et que tu formules une hypothèse. 

Ensuite et ensuite seulement tu peux tester ton hypothèse.

Là je n'en vois pas...

Citation :
Sauf que j'aimerais, dans l'autre sens, savoir si en prenant le nid n°1 de 94 et le nid de 2011 il y a des différences dans les occupations du sol.
Il y a surement des différences.

Mais elles sont sensées prouver QUOI ?

Citation :
Du coup genre pour le nid 1 (puisque je dois faire chaque nid l'un après l'autre) je voudrais comparer la surface de forêt de 94 avec celle du nid 1 de 2011. 

J'ai donc 46 calculs à faire ici.
J'avais bien compris.

Et là c'est quoi ton hypothèse  ?

Citation :
Et sans pouvoir faire ça je ne peux pas savoir quels sont les anciens nids encore utilisables aujourd'hui par l'espèce et quels sont ceux qui en changeant d'occupation du sol ont induit son abandon du site (vu qu'elle revient tous les ans au même endroit).
Mort de rire ! 

D'abord c'est carrément hallucinant que tu puisses espérer te faire comprendre en écrivant un truc pareil.

C'est quoi un "ancien nid encore utilisable"... dans ton étude ?

C'est une variable que tu n'as pas exposée ?

Mais le plus important c'est ceci : Est-ce que tu as de l'information sur les abandons de site ?

... parce que ça OUI ça aurait de l'intérêt et tu pourrais le CROISER utilement avec les évolutions de surface !!!
Mais tu ne dis RIEN sur l'abandon... donc tu n'as pas l'info ?

Et si tu n'as pas l'info... ben t'as que dalle.

T'as juste une étude sur la façon dont les surfaces évoluent autour de 46 nids paumés dans la nature... et dont tu ne sais rien sur l'évolution qui t'intéresse (l'abandon).

Citation :
Tu vois ? 
Ben non, je vois pas. Et je vois vraiment pas ce que tu espères voir toi.

Ou alors tu as omis d'expliquer des informations essentielles pour ton étude...

Citation :
Et là, pour le nid 1 par exemple, bah je me retrouve avec deux échantillons appariés dont je voudrais comparer les 7 valeurs de surfaces entre les deux dates.
Tu vois quand même bien que si tu n'as pas d'information sur l'abandon des nids, tu ne peux rien "apprendre" de tes données ? Non ?

Citation :
Comment faire alors ?
Recueillir des données qui établissent un lien.
 Posté par 
LeDinore : Test de Wilcoxon III et petit échantillon  06-06-14 à 01:38
Franchement, l'impression que ça donne, c'est que tout ce que tu as là, c'est juste une étude sur l'évolution des proportions de chaque type de surface autour de 46 nids dont on ne sait rien.

Dans ce cas tes faibles p-values (première analyse, celle qui te parait convaincante...) elles veulent juste dire qu'entre 1994 et 2011, les évolutions de surface observées (moyenne forêt avant et moyenne forêt après, et idem pour chaque surface), ne sont pas liées au hasard.

Mais de lien avec les nids : tu n'en as AUCUN.

Si tu estimes que ces 46 nids sont globalement "représentatifs" de l'espèce sur la région observée, et que tu sais par ailleurs que l'espèce décline sur cette région, tout ce que tu peux dire c'est constater que parallèlement et sur la même période, tu observes une évolution dans la répartition des surfaces et que cette évolution est statistiquement significative.

Y a t-il un lien ? Impossible à dire.

Sur la même période, le chômage a augmenté, le yen s'est dévalué, et le sida a progressé...

Y a t-il un lien pour autant ?

Si tu veux établir un lien, il te faut des nids qui perdurent et des nids abandonnés.

Dans ce cas, tu peux comparer chaque groupe selon les différences d'évolutions de surface observées. Ca oui, ça aurait du sens...
 Posté par 
mademosellere : Test de Wilcoxon III et petit échantillon  06-06-14 à 10:30
Déjà, les surfaces sont en m², je les ai calculé avec Qgis en cartographiant tous les nids sur un diamètre de 600m.

Un point sur le contexte: nous sommes dans le Ried, milieu prairial donc. 80% des prairies ont disparu en l'espace de 50 ans, au profit des cultures, dans ce milieu et avec elles les populations de certaines espèces avifaunistiques ont dégringolé. C'est le cas de l'espèce que j'étudie qui est philopatrique donc elle revient chaque année au MEME endroit. L'espèce est au bord de l'extinction (46 couples en 94, 9 aujourd'hui dans le secteur de Colmar à Strasbourg).

On m'a donné une carte avec la localisation précise des 46 couples présents en 1994 et c'est à partir de ça que j'ai bossé, j'ai aussi les sites précis des 9 couples encore présents aujourd'hui (pas les mêmes sites). Et donc je cherche à voir s'il y aurait un lien entre l'abandon de ces 46 sites et une diminution des prairies/augmentation des cultures sur ces sites.

Comme l'espèce revient chaque année au même endroit, une modification de l'occupation des sols et elle n'y revient pas.

Sauf que pour le moment, que 80% des prairies ont disparu sur le site entier ça a été montré, mais que dans les sites de l'espèce qu'il y a bien eu une disparition des prairies (significative) au profit des cultures ça il n'y a rien.

Donc pour les 46 nids abandonnés, je cherche à montrer s'il y a ou non des différences dans la carto entre 1994 et 2011 car s'il n'y en avait pas alors qu'ils ont quasi tous été abandonnés, c'est que le facteur de disparition est autre que ces prairies et ces cultures. 

Après j'ai aussi mes 9 nids actuels où je cartographie aussi et où je verrais s'il y a des surfaces de prairies importantes, comme dans les 46 nids abandonnés (si encore ça, je le vérifie du coup...). Mais voilà s'il n'y a pas de différence déjà pour les 46 nids abandonnés entre 94 et aujourd'hui, c'est que la cause n'est à priori pas là.

Je sais plus comment expliquer :'(
 Posté par 
mademosellere : Test de Wilcoxon III et petit échantillon  06-06-14 à 10:32
Je rectifie:

Donc pour les 46 nids abandonnés, je cherche à montrer s'il y a ou non des différences dans la carto entre 1994 et 2011 car s'il n'y en avait pas alors qu'ils ont TOUS été abandonnés, c'est que le facteur de disparition est autre que ces prairies et ces cultures. 
 Posté par 
LeDinore : Test de Wilcoxon III et petit échantillon  06-06-14 à 11:52
OK, ton message de 10h30 a du sens et il est BEAUCOUP plus clair.

Un détail : tu ne précises toujours pas que tes surfaces sont données en pourcentage, ou ce qui revient au même, sont calculées sur des périmètres exactement identiques avant et après (sinon tes chiffres ne veulent rien dire). Je te fais crédit d'avoir fait ça correctement. Donc OK.

Pour l'essentiel, ton message de 10h30 confirme exactement ce que j'ai dit à 1h22 et 1h38 : POUR L'INSTANT, tu n'as fait un test statistique QUE sur l'évolution des surfaces pour 46 nids "de même nature". Autrement dit, tu n'as AUCUN LIEN PROUVABLE (avec l'abandon) en l'état, quel que soit le résultat du test.

Ensuite, tu aurais du préciser que ces 46 nids étaient "particuliers" puisque "abandonnés", et que tu disposais d'un autre groupe de 9 nids "actifs".

Ce que je comprends de ta démarche, c'est que avant d'établir un lien éventuel entre abandon et évolution des surfaces, tu cherches à vérifier au minimum qu'il y a bien une évolution significative des surfaces.

Dans ce cas alors OUI, ce que tu as fait a un peu de sens, dans la mesure où tu prends ça pour un encouragement à poursuivre. Encore que tout bien réfléchi, s'il n'y a pas d'évolution significative des surfaces pour les 46 nids abandonnés, et qu'il y en a une pour les 9 nids abandonnés... alors ce serait un résultat spectaculaire et significatif en soi et qu'il faudrait de toutes façons passer à l'étape suivante. Donc cette étape intermédiaire ne sert pas à grand chose. mais admettons...

Les hypothèses testée statistiquement à ce stade sont : 

- "il n'y a pas d'évolution significative des surfaces de forêt" 

- "il n'y a pas d'évolution significative des surfaces de prairie"

- etc...

Et vu d'où je suis, et en te faisant confiance sur la façon dont tu as procédé, on peut supposer que tu as des très faibles p-values aux tests qui permettent de rejeter les hypothèses (au seuil de risque fixé...), et cela confirme qu'il y a bien des évolutions significatives. 

Ce premier point étant supposé établi, tu peut passer à la suite.

Mais ATTENTION !!! Pour l'instant tu n'as absolument pas prouvé le moindre lien entre l'abandon et l'évolution des forêts.

Tu as juste confirmé que les zones où se situaient les 46 nids abandonnés ont connu des évolutions de surfaces significatives.

Pour la suite, ce qu'il te faudrait c'est pouvoir comparer la façon dont les surfaces ont évolué entre tes deux groupes.

Groupe A = nids abandonnés,  effectif nA=9

Groupe B = nids persistants,  effectifs nB=46

A partir de là, tu peux prendre chaque type de surface (la surface de forêt, puis la surface de prairie, etc...), et pour ce type, tu fais une comparaison de moyenne de l'évolution de la surface considérée.

Bien évidemment, il faut que les surfaces dont on parle soit "comparables", ce qui ramène à la question de détail préliminaire que je t'ai posée. Mais en supposant que tu as des grandeurs comparables (disons des proportions pour êtres "surs"), alors tu peux faire un travail TRES INTERESSANT.

Pour chaque type de surface, si l'évolution entre 1994 et 2011 en moyenne a été différente pour le groupe B comparativement au groupe A, et que cette différence est statistiquement significative, ALORS LA OUI... tu auras trouvé un résultat qui améliore la connaissance.

Un dernier détail : 

A un moment donné, il serait peut-être judicieux d'observer l'évolution des surfaces non pas entre 1994 et 2011, mais sur une période un peu décalée avant : d'une part parce qu'il faut probablement un "délai" pour que l'évolution de surface ne provoque un abandon, et d'autre part parce que si les nids ont été pour la plupart abandonnés entre 1994 et 2005 par exemple, alors peu importe l'évolution éventuelle observée de 2005 à 2011. Mais bon c'est une considération assez secondaire, et il faut d'abord conclure sur ta démarche en cours.

--- 

Est-ce qu'avec ma reformulation tu t'y retrouves ?

Est-ce que c'est bien l'idée de ce que tu voulais faire ?

Si c'est bien ça, il te reste à mesurer les évolutions de surfaces des nids abandonnés (en grandeurs comparables).

Puis à faire une comparaison de moyenne des évolutions entre groupe A et groupe B, pour chaque type de surface.

Dis si c'est OK pour toi.

Pose des questions si besoin.

Et viens nous dire le résultat : c'est intéressant ...
 Posté par 
mademosellere : Test de Wilcoxon III et petit échantillon  10-06-14 à 10:40
Bonjour!

Désolée je m'étais absentée quelques jours.

Alors oui les surfaces sont calculées de manière que ce soit pour les nids abandonnés ou actifs, pour 94 et 2011. Chaque nid au total a 282600 m².

Ensuite, j'ai bien compris ce que tu m'as expliqué et je suis d'accord.

Je voudrais juste revenir sur une ou deux choses. Pour les nids abandonnés j'ai comparé les surfaces entre 94 et 2011 mais pour les nids actifs par contre, je ne crois pas que ça ait beaucoup d'intérêt. Etant donné qu'ils n'étaient pas utilisé avant, dire qu'il y a eu des évolutions de surface entre les deux années ne mène pas à grand chose. Enfin, je ne pense pas.

Pour les nids actifs ce qui m'intéresse c'est de savoir si les moyennes de surfaces (de prairies et de cultures surtout) sont différentes de celles des nids abandonnés en 2011 (donc lorsqu'ils n'étaient plus utilisés) d'une part et d'autre part si elles sont différentes des nids abandonnés mais en 94 lorsqu'ils étaient utilisés. L'idéal étant de réussir à démontrer que les surfaces de prairies sont pareils pour les nids actifs aujourd'hui et les nids abandonnés en 94 (donc lorsqu'ils étaient occupés) et que les surfaces de prairies des nids actifs aujourd'hui sont supérieures à celles des nids abandonnés en 2011.

On est toujours d'accord jusque là? C'est bien cela que tu entendais par les comparaisons de moyennes?

Du coup là je dois utiliser un test non paramétrique pour échantillons indépendants avec k=2? Avec un coup comparaison des surfaces de chaque occupation pour les nids abandonnés en 94 et les actifs en 2011 et ensuite les abandonnés en 2011 et actifs en 2011?

Merci beaucoup pour ton aide 
 Posté par 
LeDinore : Test de Wilcoxon III et petit échantillon  10-06-14 à 16:35
Techniquement :

Une comparaison de moyenne ici se fera entre le groupe A (actifs en 2011) et le groupe B (actifs en 1994 puis abandonnés en 2011).

Pour ces groupes tu compares une surface exprimée en proportion (mieux pour interpréter), en choisissant le ou les types de surfaces selon ta connaissance du sujet, parce que tu anticipes un "EFFET". Tu vas par exemple agréger les prairies et je ne sais quelle autre surface...

Tu auras donc :

mA et mB, les surface moyennes (qui seront des pourcentages) pour A et B.

sA et sB, les écart-types pour A et pour B.

nA et nB, les effectifs (nA=9 et nB=46).

Tu fais un histogramme de la variable surface (tous groupes mélangés), pour vérifier que tu as une répartition à peu près en cloche (même déformée, ça peut être OK). Si tu veux te faire plaisir tu fais un QQ-Plot voire un test de normalité (mais la façon de l'exploiter est délicate, alors bon...).

Tu vérifies que sA et sB sont proches.

Si les ratios sA/sB et sB/sA ne dépassent pas 1.5  ça peut suffire.

A partir de là, tu peux décider si un test t de Student peut s'appliquer. Sinon, Wilcoxon (non paramétrique).

Veilles à bien formuler l'hypothèse que tu fais.

Pas d'hypothèse = pas de test = pas de conclusion sur la "SIGNIFICATIVITE".

Si tu veux pouvoir AFFIRMER quelque chose au seuil de confiance que tu t'es fixée...

... il faut IMPERATIVEMENT formuler une hypothèse claire et correcte.

Sur le fond :

Je pressens qu'il y a une faille majeure dans ton analyse.

On voit bien la "cohérence" d'ensemble de ton raisonnement.

Mais il ne me parait pas suffisant pour formuler une hypothèse claire que les chiffres à ta disposition te permettraient de tester statistiquement.

A mon sens, si tu veux comparer A et B, il FAUT que tu saches pour A que les nids existaient déjà en 1994 !

Dans ce cas, alors OUI, tu as des hypothèses claires et testables : 

Par exemple : 

 : MB(1994)   ne se distingue pas de   MA(1994)

 : MB(2011)   ne se distingue pas de   MA(2011)

 : MB(1994) - MA(1994)   ne se distingue pas de   MB(2011) - MA(2011)

Ces hypothèses, si on peut les rejeter statistiquement, prouveraient que sur 9 + 46 nids actifs en 1994 (aléatoires et identiques par ailleurs), les 9 qui ont survécu présentent par rapport aux autres, une différence significative de surface, soit "au début", soit "à la fin", soit dans la "différenciation au fil du temps"...

Mais pour cela, il faut donc savoir si les 9 nids actifs en 2011 l'étaient déjà en 1994.

Car sinon, que prouverait l'étude ?

Ton idée à toi c'est en gros de tester deux hypothèses : 

 : MB(1994)   ne se distingue pas de   MA(2011)

Puis : 

 : MB(2011)   ne se distingue pas de   MA(2011)

... et tu souhaites "accepter"  et "rejeter" .

Admettons que çà fonctionne comme tu le souhaites.

Cela irait "dans le sens" de ce que tu veux prouver.

Mais je n'arrive pas à voir ce que ça prouverait fondamentalement et je doute que tu puisses tirer la conclusion que tu souhaites avec une significativité statistique.

Donc je crains que tu n'affirmes des choses avec démonstration statistique "apparente" à la clé...

... qui "conforterait", mais ne "prouverait pas vraiment en réalité" ce que tu veux prouver.
 Posté par 
LeDinore : Test de Wilcoxon III et petit échantillon  10-06-14 à 16:41
Citation :
L'idéal étant de réussir à démontrer que les surfaces de prairies sont pareils pour les nids actifs aujourd'hui et les nids abandonnés en 94 (donc lorsqu'ils étaient occupés) et que les surfaces de prairies des nids actifs aujourd'hui sont supérieures à celles des nids abandonnés en 2011

On voit bien l'idée.

Et tu dois pouvoir prouver ça (voir mon message précédent).

Mais je crains que ce que ça "prouve" sur "l'effet surface" est beaucoup moins fort que ce que tu sembles croire (en terme de "preuve").

Si les 9 nids actifs en 2011 existaient déjà en 1994, alors là oui, la preuve est directe et sans équivoque.
Mais sinon, tu as juste un "indice"... une piste intéressante. mais à mon sens pas un protocole statistique clair qui te permette d'aboutir à une conclusion probabiliste sur l'effet recherché.
 Posté par 
mademosellere : Test de Wilcoxon III et petit échantillon  11-06-14 à 10:00
Ca se complexifie...

Non les nids actuels n'étaient pas là en 1994, ils sont très proches des nids abandonnés, voir il chevauche une partie, mais ils ne sont pas au même endroit.

Et ça c'est du à un autre problème: la fréquentation. Etant donné que l'espèce revient chaque année au même endroit normalement, l'apparition de nouveaux sites est probablement due au fait que:

lorsque les couples s'installent, ils vont là où c'est le plus favorable, techniquement, les sites abandonnés étaient favorables d'où l'installation des couples à cet endroit chaque année. Mais si, lors du survol de la zone, il y a dérangement (une personne qui se ballade dans la prairie près du site où ils voulaient aller, un chien qui se ballade,...), alors ils changent de site. Mais ça c'est le problème de fréquentation que j'étudie à part. 

C'est un facteur qui s'ajoute à celui des changements d'occupation du sol.

Donc de toute manière mes résultats seront à prendre avec des pincettes... Parce que ce que je vais démontrer (ou pas) va avec la fréquentation...

C'est pas vraiment évident...
 Posté par 
mademosellere : Test de Wilcoxon III et petit échantillon  11-06-14 à 11:14
J'ai fait l'histogramme. Et... ça ne ressemble pas franchement à une cloche. Comme j'ai beaucoup de 0 je les ai même viré pour voir ce que ça donne (sinon on ne voit rien).

J'espère que c'est bien ça que je devais faire au moins. Est ce qu'on peut considérer que c'est une cloche?

(J'ai laissé les valeurs en m², j'ai besoin d'avoir les valeurs des surfaces pour la suite et de refaire la conversion dans l'autre sens c'est vraiment pas pratique).

 Posté par 
LeDinore : Test de Wilcoxon III et petit échantillon  11-06-14 à 12:48
C'est l'histogramme de quoi ?

Quelle variable ?

Une surface type ?

J'ai l'impression qu'il y a trop d'observations...

Tu n'as pas mélangé toutes les surfaces au moins ?

Et aussi mélangé les années ?

Et puis il faut donner également l'histogramme avec les modalités de surface à zéro.

Même si les avoir exclues momentanément pour "voir" est une bonne idée... il faut tous les points de l'étude. Sauf si tu as une raison de les exclure de l'analyse.
 Posté par 
LeDinore : Test de Wilcoxon III et petit échantillon  11-06-14 à 12:50
Si tu as mélangé les surfaces c'est n'importe quoi...

Tu dois construire UNE variable de surface supposée explicative.

Ou éventuellement DES variables si tu as plusieurs candidates (étudiées séparément, ou agrégées, ou éventuellement en "interaction" mais à voir plus tard : c'est plus complexe).
 Posté par 
LeDinore : Test de Wilcoxon III et petit échantillon  12-06-14 à 17:47
Bonjour mademoselle,

Ton étude pose une difficulté conceptuelle qui est complexe à expliquer...

... mais que tu dois comprendre, si tu veux produire une étude qui a du sens et qui n'affirme pas plus que ce qu'elle est en droit d'affirmer.

Ton idée de départ te conduit à te demander si la proportion de surface d'un certain type (par exemple la prairie, ou l'addition de la prairie et d'un autre type de surface, à toi de le dire...), qu'on appellera "surface supposée explicative" ou "surface supposée influençante", ou plus simplement "surface"... peut effectivement influencer la perpétuation de nids (ou à l'inverse : leur abandon).

On pourrait alors résumer ta thèse, et donc ton questionnement par la formulation :

 : La "surface" a une influence sur le phénomène de "nidification" (perpétuation ou abandon des nids).

En statistique, quand on veut prouver  ,  on formule son contraire  ,  qu'on essaie de réfuter comme peu plausible. En faisant ça, on "prouve"    qu'on peut alors affirmer à un seuil de confiance fixé.

Pour que cette conclusion ait un sens statistique, c'est à dire un seuil de confiance attaché à l'affirmation, il faut qu'un certain nombre de conditions soient réunies. Pour faire simple, ces conditions sont que ce que tu mesures et compares, puisse être rattaché à une expérience aléatoire sur laquelle un calcul probabiliste peut être fait. Ce calcul il est réalisé "clé en mains" par les tests statistiques que de brillants mathématiciens ont mis au point pour nous... et il peut être calculé de façon un peu automatique par les outils modernes.

Cette simplicité d'accès à une boîte à outils de tests statistiques tout prêts, facilite considérablement le travail du statisticien. Mais le piège devient alors d'appliquer des outils sans comprendre ce qu'ils mesurent, et d'en tirer des conclusions très affirmatives avec la fausse garantie apparente de p-values aguicheuses.

Pour que le test ait un sens, il ne suffit pas que des chiffres injectés dans une moulinette "boîte noire" produisent d'autres chiffres supposés exprimer une vérité scientifique indiscutable. Il faut d'abord que la question formulée par le test soit traductible en une expérience aléatoire dont on puisse évaluer la plausibilité. Si on ne se plie pas à cette obligation, alors on peut toujours faire une étude, produire des résultats, et même les commenter... mais on ne peut en aucun cas lancer une affirmation en prétendant qu'elle est prouvée au seuil de confiance fixé.

--- 

Pour illustrer ça je vais d'abord évoquer ce que serait une "étude idéale", à savoir une étude qui pose une question précise (ou un ensemble de questions...) et à laquelle on puisse répondre par un test (ou plusieurs...) qui apporte une "preuve" statistique en réponse à la question posée.

Imaginons que tu t'intéresses à un territoire donné.

Tu commences par sélectionner aléatoirement un échantillon de points sur ce territoires. Autour de chaque point, tu détermines une zone circulaire de rayon 300 mètres, et donc de surface approximative : SZone ~ 3.14*300² ~ 282 600 m²

Ensuite pour chaque zone de l'échantillon, tu évalues d'une part le phénomène observé et d'autre part le phénomène supposé explicatif. Imaginons que la surface de prairies SP soit supposée déterminante dans la nidification : tu mesureras cette surface pour chaque zone et la retiendras comme variable explicative candidate. Et imaginons que tu puisses rechercher sur chaque zone, la présence (ou absence) de nid actif, ou pourquoi pas mieux : le nombre de nids actifs.

Dans un tel cas, tu aurais à un instant donné N zones avec à la fois l'information sur la surface SP de cette zone et l'information NIDS de cette même zone. Tu pourrais alors faire une représentation graphique de NIDS en fonction de SP. Si NIDS est quantitative (= nombre de nids sur la zone), et que le "nuage de points" résultant a une "forme" apparente, alors tu as mis en évidence un lien probable, et il y aura sûrement un test statistique qui le prouvera (à un seuil fixé). Si NIDS est qualitative binaire (présence OUI ou NON d'un nid actif sur la zone), et que les distributions de SP différent quand on compare les histogrammes pour les OUI et pour les NON... alors idem : il y a un test qui permettra d'affirmer statistiquement ce qu'on observe graphiquement.

Dans le cas ou NIDS est une variable quantitative avec un nombre de nids (à supposer qu'on ait régulièrement plusieurs nids actifs par zone...) ce test sera par exemple un test de corrélation ou de régression linéaire. Si le lien existe mais n'est pas linéaire (effet plafond, effet de retournement...), il faudra peut-être transformer la variable ou faire une régression linéaire.

Dans le cas ou NIDS est juste une variable binaire (OUI présence, NON absence), et toujours à supposer qu'il y a suffisamment de OUI et de NON pour faire un test, alors tu peux faire par exemple un test de comparaison de moyennes, en mesurant si la moyenne SP du groupe des OUI est la même que celle du groupe des NON.

Dans chaque cas : un test statistique permettra d'émettre une conclusion "probabiliste" (affirmation au seuil de confiance fixé), parce qu'ici on a clairement une expérience aléatoire facile à mettre en évidence :  lorsqu'au départ de l'étude on a tiré au sort l'échantillon de zones, chacune d'elle avait une probabilité    supposée commune à chaque zone (toutes choses égales par ailleurs), d'héberger un nid actif, dans le cas où l'hypothèse    est vérifiée. Et de ce fait, grâce au test on peut évaluer si le résultat de cette expérience aléatoire est plausible au regard des hypothèses et de ce que dit la théorie qui sous-tend le test (telle statistique U doit suivre telle loi avec tels degrés de libertés, etc...).

---

Dans le cas de ton étude... j'imagine bien qu'on ne peut pas procéder comme dans le cas "idéal" que j'ai proposé. Il faut de façon générale tenir compte de la réalité accessible et observable. Et trouver un "protocole" qui fournisse des mesures analysables, représentatives et comparables, et qui puissent correspondre à une expérience aléatoire, au moins intellectuellement parlant.

Dans le protocole que tu appliques toi (et que tu n'as pas intégralement décrit...), je sens bien ce qui t'a guidé, mais je ne vois pas ce qui fonde la construction d'hypothèses testables qui apporte une preuve quantifiable à ta thèse. 

Ce qui t'a guidé c'est en gros de dire (je parle pour toi) :

- "J'ai 46 nids actifs en 1994 (je les appelle groupe B), qui deviennent tous abandonnés en 2011. 

J'ai 9 autres nids en 2011 (je les appelle groupe A), qui n'existaient pas en 1994, et qui sont actifs en 2011."

- "Si j'observe SP au moment où les nids sont actifs, à savoir SP-B(1994) comparée à SP-A(2011) et que je ne vois pas de différence significative, MAIS que lorsque je compare SP-B(2011) avec SP-B(1994), j'observe qu'il y a eu une évolution de SP..."

- "... Alors cela m'inclinera à penser que cette évolution de SP peut être la cause de l'abandon".

Mais tout le problème ici... c'est qu'il n'y a pas de façon (en tout cas je n'en vois pas) qui permette de formuler une hypothèse adossée à une expérience aléatoire et qui permette d'aboutir à une conclusion quantifiable.

Tu observes juste un phénomène intéressant et remarquable, mais jusqu'ici tu ne sais (ni moi) pas le traduire en hypothèse quantifiable statistiquement.

L'étude restera "observatoire" ou "exploratrice" et suggèrera une voie de recherche. Mais en aucun cas en l'état elle ne me semble autoriser à émettre une affirmation quantifiable.

Cette appréciation n'est que personnelle, et il y a probablement d'autres éléments à prendre en compte et que je ne connais pas (notamment sur ce qui est connu en termes de mécanismes de nidification, de fréquentation et de comportement des espèces étudiées)... donc mon appréciation n'est pas "définitive" et ne doit pas t'arrêter. Mais elle doit te mettre en garde contre la tentation de faire des tests sans les comprendre et d'en tirer des conclusions non fondées. Et elle doit t'encourager à trouver les informations et les données, ainsi qu'un protocole et une formulation, qui enfin te permettront de réaliser un test valable.
 Posté par 
mademosellere : Test de Wilcoxon III et petit échantillon  13-06-14 à 14:33
Déjà merci beaucoup pour toutes ces explications.

Ensuite, je vais faire court du coup, mais comme j'ai eu pas mal d'autres trucs à faire (super les dégradations de panneaux une semaine après les avoir posés...) je n'ai pas eu le temps de me replonger dans les stats.

Comme je reviens mardi, je répondrais donc à tout ça et continuerai les stats à ce moment là.

Encore merci en tout cas 
 Posté par 
LeDinore : Test de Wilcoxon III et petit échantillon  13-06-14 à 15:00
Bon courage  !
 Posté par 
LeDinore : Test de Wilcoxon III et petit échantillon  13-06-14 à 17:32
Ce qui empêche d'appliquer facilement un raisonnement statistique dans ton étude... c'est principalement le fait que la façon dont les 46 nids abandonnés et les 9 nids actifs ont été "choisis" comme objets d'étude, n'apparait pas clairement.

Prenons un exemple délibérément "tiré par les cheveux" : 

Supposons que les 9 nids actifs en 2011 aient été choisis précisément parce qu'ils avaient des surfaces assez approchantes des surfaces observées en 1994 sur les 46 nids actifs d'alors (et depuis abandonnés). Un tel choix pourrait avoir par exemple été fait par quelqu'un qui veut ensuite observer ce qui se passera sur ces 9 nids "similaires" au plan de la surface...

Toi tu récupères ces nids pour ton étude, et les zones qui vont avec. Tu démontres que les surfaces sont similaires avec celles des 46 nids en 1994 (la belle affaire puisqu'ils ont été choisis par quelqu'un pour ça...). Et comme tu t'intéresses à l'évolution des surfaces (c'est ton sujet), tu prouves qu'il y en a une sur les 46 nids abandonnés. Mais alors dans ce cas précis, les 9 nids actifs ne servent strictement à rien ! Il n'ont RIEN à faire dans l'étude statistique. Il ne peuvent pas servir à prouver quoi que ce soit, sans autre information.

Autre exemple radicalement différent : 

Imaginons que les 46 nids correspondent à TOUS les nids qu'on a été capables de recenser à l'époque en 1994 sur un territoire donné.

Et que les 9 nids correspondent à TOUS les nids qu'on a été capables de recenser en 2011 sur ce même territoire, en mettant en œuvre les mêmes moyens.

La première conclusion c'est qu'il y a une diminution très importante (-80%).

La deuxième, c'est que "curieusement", les nids de 2011 ont été développés dans des sites dont la structure des surfaces est similaire (à supposer que tu prouves ce résultat), alors que les surfaces des 46 nids abandonnés (comme par hasard) ont évolué.

On voit bien ici que l'observation est "plus forte" et porte potentiellement une information. Mais pour pouvoir mesurer statistiquement la force de ce lien, il faut pouvoir se rapprocher d'une expérience aléatoire qui permette une telle mesure.

Par exemple réfléchir en partant de la façon dont les oiseaux font leur choix... ce qui suppose de réfléchir à "l'offre" de zones qui leur est proposée à différents moments. Mais ton étude ne contient pas en l'état d'information qui le permette (en tout cas par rapport à ce que tu en as dit pour l'instant). Pour pouvoir établir un raisonnement statistique, il faudrait vraiment clarifier le choix des nids dans l'étude d'une part, et par les oiseaux d'autre part (en fonction de "l'offre de zones disponibles")...
 Posté par 
mademosellere : Test de Wilcoxon III et petit échantillon  18-06-14 à 09:33
Pourquoi peuvent-ils ne pas revenir au même endroit? Dans le cas où il y a dérangement là où ils étaient l'année d'avant (genre un chien se ballade dans la prairie 

où ils vont toujours), ils changent de site. 

Le problème est qu'il n'y a plus énormément de sites potentiellement favorables (d'une part il faut des prairies et il faut un milieu ouvert avec peu d'arbres 

sinon la corneille s'y met et les bouffe). Lorsque qu'ils cherchent, ils veulent retourner au même endroit mais tout d'abord ils survolent et regardent. Si pas de 

fréquentation ils s'installent, sinon ils vont ailleurs mais du coup dans un site moins favorable potentiellement. Et si là encore dérangement ils vont encore partir 

pour un site potentiellement encore moins favorable. 

On imagine que le site utilisé depuis 10 ans par un couple l'est parce que l'occupation du sol lui convient et si une année il part forcément c'est 

qu'il y a quelque chose d'exceptionnel (comme un chien qui se ballade). Tu vois le truc?

Finalement il y a des sites qui ont été abandonnés parce que les surfaces au sol ne conviennent plus (nichent pas dans les cultures comme je l'ai dit) mais ils peuvent

avoir changé parce que fréquentation. Ou pire ils peuvent avoir disparu parce que le couple est mort vu qu'il n'y a plus de renouvellement de population (les jeunes 

meurent ou il n'y en a pas) et auquel cas la disparition du couple n'a rien à voir avec la disparition des prairies.

Mon étude est donc... à la limite du farfelu quand on sait tout ça mais les facteurs sont là et il faut bien faire quelque chose avec (ça parait idiot à dire...).

Maintenant pour la partie statistiques:

Je mets du coup à jour un peu ce que je disais vu que de mijoter tout ça ça me fait penser à quelques nouveaux points.

En comparant SP-B (94) et SP-B (2011), le fait de ne pas constater de différence peut donc ne rien vouloir dire. En fait il faudrait que je difféncie les nids où 

il y a modification du sol entre les deux dates (donc où entre 94 et 2011, les surfaces au sol du site n'ont pas de manière significative changées) de ceux où les 

différentes surfaces ont changés. 

J'explique: si le nid 1 (groupe B) n'a pas de différence significative d'occupation du sol entre 94 et 2011, son abandon est lié soit à une surfréquentation soit à une 

mort du couple. Mais cela demande de comparer les nids un après l'autre et non plus seulement les surfaces (SP-B (94) et SP-B (2011)). Seuls les nids concernés par le

changement d'occupation du sol devrait être inclus dans le test, non? 

J'aurai donc juste les nids où il y a eut un changement d'occupation entre les deux dates (changement significatif du moins) et pour ces nids il faudra que je teste

les hypothèses H0 et H1 citées prédemment. On pourra du coup enlever une bonne partie du facteur fréquentation pour les nids abandonnés. Par contre pour les nids actuels,

il va falloir faire avec ce facteur.

Finalement le fait d'avoir autant de facteurs est compliqué... Un jour je pense un truc le lendemain je me dis non c'est faux je dois le prendre dans un autre sens. Que 

penses-tu de ce raisonnement?

Mais si tu es d'accord, alors il faudrait que je compare chaque nid entre les deux dates. Genre:

id	nid1	nid1bis	

foret	30105	31257	

prairie	244264	239012	

culture	0	0	

route	2835	7763	

urbain	0	0		

eau	5396	4568	

friche	0	0

Avec nid1= nid 1 abandonné en 94 et nid1bis=nid 1 abandonné en 2011.

Il faudrait alors comparer avec un test pour échantillons appariés les valeurs de forêt, prairie,... pour voir si pareil ou pas et ainsi éliminer tous les nids dont la 

disparition est liée à un autre facteur que celui de l'occupation du sol. Et ensuite tester s'il y a bien une différence entre les surfaces totales de prairies entre

les deux années. 

Est ce que c'est compréhensible?

A côté de ça pour la normalité: j'avais calculé les p-values pour chaque occupation du sol. Pourquoi n'est-il pas possible de faire comme j'ai vu en cours: regarder la p-value et ensuite l'équivariance? Je n'ai pas compris ce point là.

Merci encore
  Posté par 
LeDinore : Test de Wilcoxon III et petit échantillon  19-06-14 à 23:18
Citation :
Finalement il y a des sites qui ont été abandonnés parce que les surfaces au sol ne conviennent plus (nichent pas dans les cultures comme je l'ai dit) mais ils peuvent avoir changé parce que fréquentation.
OK. C'est clair.

Mais les 9 couples de 2011 ont-ils un lien avec ceux de 1994 ?

S'agit-il des mêmes ?

Cela changerait pas mal de choses.

Citation :
Ou pire ils peuvent avoir disparu parce que le couple est mort vu qu'il n'y a plus de renouvellement de population (les jeunes meurent ou il n'y en a pas) et auquel cas la disparition du couple n'a rien à voir avec la disparition des prairies.
En particulier, si l'espérance de vie d'un couple est par exemple de quinze ans et que tu observes des nids occupés en 1994, puis 17 ans après... normal qu'il n'y ait pas de survivant...

Citation :
Mon étude est donc... à la limite du farfelu quand on sait tout ça mais les facteurs sont là et il faut bien faire quelque chose avec (ça parait idiot à dire...).
Quand il y  a des facteurs multiples on essaie de les "fixer", en étudiant les données par groupes de facteurs homogènes.

Si on ne peut pas, on se met en situation d'avoir une influence des différents facteurs qui se répartit de façon aléatoire sur l'ensemble des données, de sorte que lorsqu'on sépare deux groupes (A et B) caractérisant un facteur spécifique étudié, ces deux groupes présentent une différence liée à ce facteur, suffisamment sensible pour être détectable malgré le "bruit" apporté par les autres facteurs.

Citation :
En comparant SP-B (94) et SP-B (2011), le fait de ne pas constater de différence peut donc ne rien vouloir dire.
Est-ce le cas ?

Tu n'as pas confirmé si tu avais montré que les surfaces ne différaient pas significativement.

Et en l'occurrence tu te trompes peut-être.

A savoir que si tu t'intéresses aux choix possibles pour les oiseaux et que tu montres que en général les surfaces n'évoluent pas dans le sens supposé les arranger... alors dans ce cas, leur choix se réduit d'année en année.

Or dans ce cas, si les 9 couples constituent "tout ce qui reste" sur le territoire étudié, alors force est de constater qu'ils se sont évertués à chercher des sites "conformes" à leurs attentes en termes de surface, alors même que ceux-ci se raréfient. Donc en réfléchissant aux choix qui s'offrent aux oiseaux, il y a éventuellement matière à appliquer un raisonnement statistique.

Citation :
En fait il faudrait que je différencie les nids où il y a modification du sol entre les deux dates (donc où entre 94 et 2011, les surfaces au sol du site n'ont pas de manière significative changées) de ceux où les différentes surfaces ont changés.

J'explique: si le nid 1 (groupe B) n'a pas de différence significative d'occupation du sol entre 94 et 2011, son abandon est lié soit à une sur-fréquentation soit à une mort du couple.
En fait tu sais déjà ce que tu dois conclure en terme de causalité.

Je vois mal ce que les données que tu as présentées jusqu'ici apporteraient pour confirmer ou infirmer.

Citation :
Mais cela demande de comparer les nids un après l'autre et non plus seulement les surfaces (SP-B (94) et SP-B (2011)).
Que te reste-t-il à comparer dans ce cas ?

Ta seule info c'est le changement de sol.

Si tu isoles les nids qui n'ont pas changé de sol... qu'Est-ce qui te reste à comparer ?

Citation :
Seuls les nids concernés par le changement d'occupation du sol devrait être inclus dans le test, non ?
Quel test ?

Je te rappelle que pour faire un test, il faut poser une hypothèse claire.

Dis-moi quelle hypothèse tu fais, et je pourrai peut-être te dire si elle est testable.

Là personnellement je ne vois pas d'hypothèse utile à ton étude.

Citation :
J'aurai donc juste les nids où il y a eu un changement d'occupation entre les deux dates (changement significatif du moins) et pour ces nids il faudra que je teste les hypothèses H0 et H1 citées précédemment. On pourra du coup enlever une bonne partie du facteur fréquentation pour les nids abandonnés. 
Sauf que je ne vois pas du tout à quelles hypothèses tu penses ?

Qu'est-ce que tu veux comparer sur les nids où il y a eu changement de sol ?

Tu as d'autres données à comparer ???

Comparer les sols n'aurait plus de sens puisque tu as isolé les nids qui n'ont pas les mêmes sols... tu vas forcément trouver qu'il y a une différence de sol !

C'est un serpent qui se mord la queue si tu fais ça...

Citation :
Finalement le fait d'avoir autant de facteurs est compliqué... Un jour je pense un truc le lendemain je me dis non c'est faux je dois le prendre dans un autre sens. Que penses-tu de ce raisonnement ?
Tu connais tellement ton sujet que tu cogites sur des relations possibles, des liens supposés, des explications plausibles...

Mais ce faisant tu ne fais pas de statistique.

Ce qui ne me surprend pas : je te dis depuis le début que tes données, pour ce que tu en as présenté jusqu'ici, ne se prête pas en l'état à un raisonnement statistique.

Citation :
Mais si tu es d'accord, alors il faudrait que je compare chaque nid entre les deux dates. Genre: 

id nid1 nid1bis 

foret 30105 31257 

prairie 244264 239012 

culture 0 0 

route 2835 7763 

urbain 0 0 

eau 5396 4568 

friche 0 0 

Avec nid1= nid 1 abandonné en 94 et nid1bis=nid 1 abandonné en 2011. 
Rien compris  !

Il y avait des nids abandonnés en 1994 ?

Je croyais qu'il n'y avait que des nids actifs (46) en 1994...

Citation :
Il faudrait alors comparer avec un test pour échantillons appariés les valeurs de forêt, prairie,... pour voir si pareil ou pas et ainsi éliminer tous les nids dont la disparition est liée à un autre facteur que celui de l'occupation du sol. Et ensuite tester s'il y a bien une différence entre les surfaces totales de prairies entre les deux années. 

Est ce que c'est compréhensible?
Parfaitement incompréhensible.

C'est peut-être fondé... mais ça n'a pas de sens par rapport à tout ce que tu as expliqué jusque là.

Quand tu dis que tu veux "comparer"... il faudrait préciser QUOI comparer...

L'impression que tu donnes, c'est de déjà savoir ce que tu veux prouver, et que tu cherches désespérément un test statistique qui te permettrait de l'affirmer. Pour l'instant, en l'état... je ne vois RIEN qui te permette de tester une hypothèse qui ait du sens, avec ce que tu as dit jusqu'ici...

Citation :
A côté de ça pour la normalité: j'avais calculé les p-values pour chaque occupation du sol. Pourquoi n'est-il pas possible de faire comme j'ai vu en cours: regarder la p-value et ensuite l'équivariance ? Je n'ai pas compris ce point là.
Je ne sais pas vraiment ce que tu as fait.

En général, on vérifie l'équivariance AVANT pour savoir si un test t de Student est applicable.

Mais la vérifier après n'est pas si grave.

Dans ton rapport il vaut quand même mieux faire la vérification avant.