Bonjour,
Je réalise en ce moment des stats pour comparer des occupations du sol. Je vais expliquer un petit peu pour que ce soit plus clair. Je dispose des occupations du sol (forêt, prairie, culture,... 7 paramètres en tout) de 46 nids et sur ce deux années.
Je voudrais comparer chaque nid entre les deux années (nid 1 de 94 et nid 1 de 2011) en comparant donc chaque paramètre: forêt du nid 1 de 94 et forêt du nid 1 de 2011, prairie du nid 1 de 94 et prairie du nid 1 de 2011,...
J'ai choisi un test non paramétrique vu les résultats du test de normalité et vu que k=2 et échantillons appariés j'ai pris le test de Wilcoxon III.
Le problème est que mes résultats sur R sont vraiment bizarres, j'ai des valeurs qui se répètent pour la p-value: 0.8339, 0.7874, 0.5896, plusieurs fois pour différents nids.
Etant donné que j'avais fait le même boulot mais dans le sens inverse (comparaison du paramètre forêt pour tous les nids d'une même année avec le paramètre forêt de l'autre année soit 46 valeurs à comparer), j'en déduis que ce sont peut-être mes pauvres 7 valeurs qui posent problème? Une histoire de n<30 peut-être? Vu que ici j'ai n=7.
Voilà, si vous pouviez m'éclairer ce serait super
Merci beaucoup!
Pas clair ton exposé...
Wilcoxon est utilisé comme solution de secours lorsque les conditions ne sont pas respectées pour Student (normalité, effectifs, égalité de variances).
Mais dans les deux cas, ce qu'on fait c'est une comparaison de moyennes entre deux groupes.
Je peux imaginer que le premier groupe c'est 1994 et le second 2011.
Mais quid des 7 paramètres dont tu parles ?
Mesurent-ils la même chose et les utilises-tu pour calculer une "moyenne annuelle" ?
Si c'est le cas, le sens de ces paramètres (forêt, prairie on s'en tape, et ta présentation est bizarre.
Si ce n'est pas le cas, alors je comprends mal ce que ton test est sensé évaluer comme hypothèse...
Là on a l'impression que tu disposes de 2 * 7 * 46 valeurs (2 années * 7 paramètres * 46 nids)...
... et que tu cherches à faire 46 tests...
Carrément bizarre !
En plus il est où la caractère aléatoire des 7 valeurs que tu moyennes
?!?
Chimique ton truc...
carrément chelou même.
!Déjà merci beaucoup de m'avoir répondu!
Oui Wilcoxon est utilisé lorsque les conditions ne sont pas respectées pour Student pour cela que je dois l'utiliser.
Ah oui je crois comprendre que j'ai fait un truc farfelu du coup ce coup ci
.
Bon par contre je vais quand te réexpliquer mieux pour que tu me dises si quelque chose est faisable. Du coup je vais préciser le contexte (pas évident sans montrer la carto d'expliquer).
Sur le terrain où je vais il y a une espèce d'oiseau en voie de disparition. Sauf qu'en 94 il y avait 46 couples sur le site. Du coup pour voir si ce sont les changements d'occupations du sol (disparition des prairies, augmentation des cultures,...)qui en sont la cause j'ai cartographié les 46 nids en 1994 et en 2011.
Je me retrouve donc avec deux beaux tableaux avec pour chacun de mes nids, la surface de forêt, prairie, culture,... qu'il y a.
Après j'ai voulu voir si entre les deux années, pour l'ensemble des nids, il y avait des différences dans les surfaces de forêt (je compare donc forêt 94-forêt 2011, prairie 94 prairie 2011,... sans tenir compte des nids). C'est ce que j'ai fait et où les résultats correspondent à quelque chose.
Sauf que j'aimerais, dans l'autre sens, savoir si en prenant le nid n°1 de 94 et le nid de 2011 il y a des différences dans les occupations du sol. Du coup genre pour le nid 1 (puisque je dois faire chaque nid l'un après l'autre) je voudrais comparer la surface de forêt de 94 avec celle du nid 1 de 2011.
J'ai donc 46 calculs à faire ici.
Et sans pouvoir faire ça je ne peux pas savoir quels sont les anciens nids encore utilisables aujourd'hui par l'espèce et quels sont ceux qui en changeant d'occupation du sol ont induit son abandon du site (vu qu'elle revient tous les ans au même endroit).
Tu vois?
Et là, pour le nid 1 par exemple, bah je me retrouve avec deux échantillons appariés dont je voudrais comparer les 7 valeurs de surfaces entre les deux dates.
Comment faire alors?
J'espère que j'ai pu être clair
Merci!
Purée mademoselle, mais qu'est-ce que tu expliques mal !
C'est impossible de te suivre...
Et puis franchement, ton étude n'inspire pas une grande confiance...
?
???
!!!
Franchement, l'impression que ça donne, c'est que tout ce que tu as là, c'est juste une étude sur l'évolution des proportions de chaque type de surface autour de 46 nids dont on ne sait rien.
Dans ce cas tes faibles p-values (première analyse, celle qui te parait convaincante...) elles veulent juste dire qu'entre 1994 et 2011, les évolutions de surface observées (moyenne forêt avant et moyenne forêt après, et idem pour chaque surface), ne sont pas liées au hasard.
Mais de lien avec les nids : tu n'en as AUCUN.
Si tu estimes que ces 46 nids sont globalement "représentatifs" de l'espèce sur la région observée, et que tu sais par ailleurs que l'espèce décline sur cette région, tout ce que tu peux dire c'est constater que parallèlement et sur la même période, tu observes une évolution dans la répartition des surfaces et que cette évolution est statistiquement significative.
Y a t-il un lien ? Impossible à dire.
Sur la même période, le chômage a augmenté, le yen s'est dévalué, et le sida a progressé...
Y a t-il un lien pour autant ?
Si tu veux établir un lien, il te faut des nids qui perdurent et des nids abandonnés.
Dans ce cas, tu peux comparer chaque groupe selon les différences d'évolutions de surface observées. Ca oui, ça aurait du sens...
Déjà, les surfaces sont en m², je les ai calculé avec Qgis en cartographiant tous les nids sur un diamètre de 600m.
Un point sur le contexte: nous sommes dans le Ried, milieu prairial donc. 80% des prairies ont disparu en l'espace de 50 ans, au profit des cultures, dans ce milieu et avec elles les populations de certaines espèces avifaunistiques ont dégringolé. C'est le cas de l'espèce que j'étudie qui est philopatrique donc elle revient chaque année au MEME endroit. L'espèce est au bord de l'extinction (46 couples en 94, 9 aujourd'hui dans le secteur de Colmar à Strasbourg).
On m'a donné une carte avec la localisation précise des 46 couples présents en 1994 et c'est à partir de ça que j'ai bossé, j'ai aussi les sites précis des 9 couples encore présents aujourd'hui (pas les mêmes sites). Et donc je cherche à voir s'il y aurait un lien entre l'abandon de ces 46 sites et une diminution des prairies/augmentation des cultures sur ces sites.
Comme l'espèce revient chaque année au même endroit, une modification de l'occupation des sols et elle n'y revient pas.
Sauf que pour le moment, que 80% des prairies ont disparu sur le site entier ça a été montré, mais que dans les sites de l'espèce qu'il y a bien eu une disparition des prairies (significative) au profit des cultures ça il n'y a rien.
Donc pour les 46 nids abandonnés, je cherche à montrer s'il y a ou non des différences dans la carto entre 1994 et 2011 car s'il n'y en avait pas alors qu'ils ont quasi tous été abandonnés, c'est que le facteur de disparition est autre que ces prairies et ces cultures.
Après j'ai aussi mes 9 nids actuels où je cartographie aussi et où je verrais s'il y a des surfaces de prairies importantes, comme dans les 46 nids abandonnés (si encore ça, je le vérifie du coup...). Mais voilà s'il n'y a pas de différence déjà pour les 46 nids abandonnés entre 94 et aujourd'hui, c'est que la cause n'est à priori pas là.
Je sais plus comment expliquer :'(
Je rectifie:
Donc pour les 46 nids abandonnés, je cherche à montrer s'il y a ou non des différences dans la carto entre 1994 et 2011 car s'il n'y en avait pas alors qu'ils ont TOUS été abandonnés, c'est que le facteur de disparition est autre que ces prairies et ces cultures.
OK, ton message de 10h30 a du sens et il est BEAUCOUP plus clair.
Un détail : tu ne précises toujours pas que tes surfaces sont données en pourcentage, ou ce qui revient au même, sont calculées sur des périmètres exactement identiques avant et après (sinon tes chiffres ne veulent rien dire). Je te fais crédit d'avoir fait ça correctement. Donc OK.
Pour l'essentiel, ton message de 10h30 confirme exactement ce que j'ai dit à 1h22 et 1h38 : POUR L'INSTANT, tu n'as fait un test statistique QUE sur l'évolution des surfaces pour 46 nids "de même nature". Autrement dit, tu n'as AUCUN LIEN PROUVABLE (avec l'abandon) en l'état, quel que soit le résultat du test.
Ensuite, tu aurais du préciser que ces 46 nids étaient "particuliers" puisque "abandonnés", et que tu disposais d'un autre groupe de 9 nids "actifs".
Ce que je comprends de ta démarche, c'est que avant d'établir un lien éventuel entre abandon et évolution des surfaces, tu cherches à vérifier au minimum qu'il y a bien une évolution significative des surfaces.
Dans ce cas alors OUI, ce que tu as fait a un peu de sens, dans la mesure où tu prends ça pour un encouragement à poursuivre. Encore que tout bien réfléchi, s'il n'y a pas d'évolution significative des surfaces pour les 46 nids abandonnés, et qu'il y en a une pour les 9 nids abandonnés... alors ce serait un résultat spectaculaire et significatif en soi et qu'il faudrait de toutes façons passer à l'étape suivante. Donc cette étape intermédiaire ne sert pas à grand chose. mais admettons...
Les hypothèses testée statistiquement à ce stade sont :
- "il n'y a pas d'évolution significative des surfaces de forêt"
- "il n'y a pas d'évolution significative des surfaces de prairie"
- etc...
Et vu d'où je suis, et en te faisant confiance sur la façon dont tu as procédé, on peut supposer que tu as des très faibles p-values aux tests qui permettent de rejeter les hypothèses (au seuil de risque fixé...), et cela confirme qu'il y a bien des évolutions significatives.
Ce premier point étant supposé établi, tu peut passer à la suite.
Mais ATTENTION !!! Pour l'instant tu n'as absolument pas prouvé le moindre lien entre l'abandon et l'évolution des forêts.
Tu as juste confirmé que les zones où se situaient les 46 nids abandonnés ont connu des évolutions de surfaces significatives.
Pour la suite, ce qu'il te faudrait c'est pouvoir comparer la façon dont les surfaces ont évolué entre tes deux groupes.
Groupe A = nids abandonnés, effectif nA=9
Groupe B = nids persistants, effectifs nB=46
A partir de là, tu peux prendre chaque type de surface (la surface de forêt, puis la surface de prairie, etc...), et pour ce type, tu fais une comparaison de moyenne de l'évolution de la surface considérée.
Bien évidemment, il faut que les surfaces dont on parle soit "comparables", ce qui ramène à la question de détail préliminaire que je t'ai posée. Mais en supposant que tu as des grandeurs comparables (disons des proportions pour êtres "surs"), alors tu peux faire un travail TRES INTERESSANT.
Pour chaque type de surface, si l'évolution entre 1994 et 2011 en moyenne a été différente pour le groupe B comparativement au groupe A, et que cette différence est statistiquement significative, ALORS LA OUI... tu auras trouvé un résultat qui améliore la connaissance.
Un dernier détail :
A un moment donné, il serait peut-être judicieux d'observer l'évolution des surfaces non pas entre 1994 et 2011, mais sur une période un peu décalée avant : d'une part parce qu'il faut probablement un "délai" pour que l'évolution de surface ne provoque un abandon, et d'autre part parce que si les nids ont été pour la plupart abandonnés entre 1994 et 2005 par exemple, alors peu importe l'évolution éventuelle observée de 2005 à 2011. Mais bon c'est une considération assez secondaire, et il faut d'abord conclure sur ta démarche en cours.
---
Est-ce qu'avec ma reformulation tu t'y retrouves ?
Est-ce que c'est bien l'idée de ce que tu voulais faire ?
Si c'est bien ça, il te reste à mesurer les évolutions de surfaces des nids abandonnés (en grandeurs comparables).
Puis à faire une comparaison de moyenne des évolutions entre groupe A et groupe B, pour chaque type de surface.
Dis si c'est OK pour toi.
Pose des questions si besoin.
Et viens nous dire le résultat : c'est intéressant
...
Bonjour!
Désolée je m'étais absentée quelques jours.
Alors oui les surfaces sont calculées de manière que ce soit pour les nids abandonnés ou actifs, pour 94 et 2011. Chaque nid au total a 282600 m².
Ensuite, j'ai bien compris ce que tu m'as expliqué et je suis d'accord.
Je voudrais juste revenir sur une ou deux choses. Pour les nids abandonnés j'ai comparé les surfaces entre 94 et 2011 mais pour les nids actifs par contre, je ne crois pas que ça ait beaucoup d'intérêt. Etant donné qu'ils n'étaient pas utilisé avant, dire qu'il y a eu des évolutions de surface entre les deux années ne mène pas à grand chose. Enfin, je ne pense pas.
Pour les nids actifs ce qui m'intéresse c'est de savoir si les moyennes de surfaces (de prairies et de cultures surtout) sont différentes de celles des nids abandonnés en 2011 (donc lorsqu'ils n'étaient plus utilisés) d'une part et d'autre part si elles sont différentes des nids abandonnés mais en 94 lorsqu'ils étaient utilisés. L'idéal étant de réussir à démontrer que les surfaces de prairies sont pareils pour les nids actifs aujourd'hui et les nids abandonnés en 94 (donc lorsqu'ils étaient occupés) et que les surfaces de prairies des nids actifs aujourd'hui sont supérieures à celles des nids abandonnés en 2011.
On est toujours d'accord jusque là? C'est bien cela que tu entendais par les comparaisons de moyennes?
Du coup là je dois utiliser un test non paramétrique pour échantillons indépendants avec k=2? Avec un coup comparaison des surfaces de chaque occupation pour les nids abandonnés en 94 et les actifs en 2011 et ensuite les abandonnés en 2011 et actifs en 2011?
Merci beaucoup pour ton aide 
Techniquement :
Une comparaison de moyenne ici se fera entre le groupe A (actifs en 2011) et le groupe B (actifs en 1994 puis abandonnés en 2011).
Pour ces groupes tu compares une surface exprimée en proportion (mieux pour interpréter), en choisissant le ou les types de surfaces selon ta connaissance du sujet, parce que tu anticipes un "EFFET". Tu vas par exemple agréger les prairies et je ne sais quelle autre surface...
Tu auras donc :
mA et mB, les surface moyennes (qui seront des pourcentages) pour A et B.
sA et sB, les écart-types pour A et pour B.
nA et nB, les effectifs (nA=9 et nB=46).
Tu fais un histogramme de la variable surface (tous groupes mélangés), pour vérifier que tu as une répartition à peu près en cloche (même déformée, ça peut être OK). Si tu veux te faire plaisir tu fais un QQ-Plot voire un test de normalité (mais la façon de l'exploiter est délicate, alors bon...).
Tu vérifies que sA et sB sont proches.
Si les ratios sA/sB et sB/sA ne dépassent pas 1.5 ça peut suffire.
A partir de là, tu peux décider si un test t de Student peut s'appliquer. Sinon, Wilcoxon (non paramétrique).
Veilles à bien formuler l'hypothèse que tu fais.
Pas d'hypothèse = pas de test = pas de conclusion sur la "SIGNIFICATIVITE".
Si tu veux pouvoir AFFIRMER quelque chose au seuil de confiance que tu t'es fixée...
... il faut IMPERATIVEMENT formuler une hypothèse claire et correcte.
Sur le fond :
Je pressens qu'il y a une faille majeure dans ton analyse.
On voit bien la "cohérence" d'ensemble de ton raisonnement.
Mais il ne me parait pas suffisant pour formuler une hypothèse claire que les chiffres à ta disposition te permettraient de tester statistiquement.
A mon sens, si tu veux comparer A et B, il FAUT que tu saches pour A que les nids existaient déjà en 1994 !
Dans ce cas, alors OUI, tu as des hypothèses claires et testables :
Par exemple :
: MB(1994) ne se distingue pas de MA(1994)
: MB(2011) ne se distingue pas de MA(2011)
: MB(1994) - MA(1994) ne se distingue pas de MB(2011) - MA(2011)
Ces hypothèses, si on peut les rejeter statistiquement, prouveraient que sur 9 + 46 nids actifs en 1994 (aléatoires et identiques par ailleurs), les 9 qui ont survécu présentent par rapport aux autres, une différence significative de surface, soit "au début", soit "à la fin", soit dans la "différenciation au fil du temps"...
Mais pour cela, il faut donc savoir si les 9 nids actifs en 2011 l'étaient déjà en 1994.
Car sinon, que prouverait l'étude ?
Ton idée à toi c'est en gros de tester deux hypothèses :
: MB(1994) ne se distingue pas de MA(2011)
Puis :
: MB(2011) ne se distingue pas de MA(2011)
... et tu souhaites "accepter" et "rejeter"
.
Admettons que çà fonctionne comme tu le souhaites.
Cela irait "dans le sens" de ce que tu veux prouver.
Mais je n'arrive pas à voir ce que ça prouverait fondamentalement et je doute que tu puisses tirer la conclusion que tu souhaites avec une significativité statistique.
Donc je crains que tu n'affirmes des choses avec démonstration statistique "apparente" à la clé...
... qui "conforterait", mais ne "prouverait pas vraiment en réalité" ce que tu veux prouver.
Ca se complexifie...
Non les nids actuels n'étaient pas là en 1994, ils sont très proches des nids abandonnés, voir il chevauche une partie, mais ils ne sont pas au même endroit.
Et ça c'est du à un autre problème: la fréquentation. Etant donné que l'espèce revient chaque année au même endroit normalement, l'apparition de nouveaux sites est probablement due au fait que:
lorsque les couples s'installent, ils vont là où c'est le plus favorable, techniquement, les sites abandonnés étaient favorables d'où l'installation des couples à cet endroit chaque année. Mais si, lors du survol de la zone, il y a dérangement (une personne qui se ballade dans la prairie près du site où ils voulaient aller, un chien qui se ballade,...), alors ils changent de site. Mais ça c'est le problème de fréquentation que j'étudie à part.
C'est un facteur qui s'ajoute à celui des changements d'occupation du sol.
Donc de toute manière mes résultats seront à prendre avec des pincettes... Parce que ce que je vais démontrer (ou pas) va avec la fréquentation...
C'est pas vraiment évident...
J'ai fait l'histogramme. Et... ça ne ressemble pas franchement à une cloche. Comme j'ai beaucoup de 0 je les ai même viré pour voir ce que ça donne (sinon on ne voit rien).
J'espère que c'est bien ça que je devais faire au moins. Est ce qu'on peut considérer que c'est une cloche?
(J'ai laissé les valeurs en m², j'ai besoin d'avoir les valeurs des surfaces pour la suite et de refaire la conversion dans l'autre sens c'est vraiment pas pratique).

C'est l'histogramme de quoi ?
Quelle variable ?
Une surface type ?
J'ai l'impression qu'il y a trop d'observations...
Tu n'as pas mélangé toutes les surfaces au moins ?
Et aussi mélangé les années ?
Et puis il faut donner également l'histogramme avec les modalités de surface à zéro.
Même si les avoir exclues momentanément pour "voir" est une bonne idée... il faut tous les points de l'étude. Sauf si tu as une raison de les exclure de l'analyse.
Si tu as mélangé les surfaces c'est n'importe quoi...
Tu dois construire UNE variable de surface supposée explicative.
Ou éventuellement DES variables si tu as plusieurs candidates (étudiées séparément, ou agrégées, ou éventuellement en "interaction" mais à voir plus tard : c'est plus complexe).
Bonjour mademoselle,
Ton étude pose une difficulté conceptuelle qui est complexe à expliquer...
... mais que tu dois comprendre, si tu veux produire une étude qui a du sens et qui n'affirme pas plus que ce qu'elle est en droit d'affirmer.
Ton idée de départ te conduit à te demander si la proportion de surface d'un certain type (par exemple la prairie, ou l'addition de la prairie et d'un autre type de surface, à toi de le dire...), qu'on appellera "surface supposée explicative" ou "surface supposée influençante", ou plus simplement "surface"... peut effectivement influencer la perpétuation de nids (ou à l'inverse : leur abandon).
On pourrait alors résumer ta thèse, et donc ton questionnement par la formulation :
: La "surface" a une influence sur le phénomène de "nidification" (perpétuation ou abandon des nids).
En statistique, quand on veut prouver , on formule son contraire
, qu'on essaie de réfuter comme peu plausible. En faisant ça, on "prouve"
qu'on peut alors affirmer à un seuil de confiance fixé.
Pour que cette conclusion ait un sens statistique, c'est à dire un seuil de confiance attaché à l'affirmation, il faut qu'un certain nombre de conditions soient réunies. Pour faire simple, ces conditions sont que ce que tu mesures et compares, puisse être rattaché à une expérience aléatoire sur laquelle un calcul probabiliste peut être fait. Ce calcul il est réalisé "clé en mains" par les tests statistiques que de brillants mathématiciens ont mis au point pour nous... et il peut être calculé de façon un peu automatique par les outils modernes.
Cette simplicité d'accès à une boîte à outils de tests statistiques tout prêts, facilite considérablement le travail du statisticien. Mais le piège devient alors d'appliquer des outils sans comprendre ce qu'ils mesurent, et d'en tirer des conclusions très affirmatives avec la fausse garantie apparente de p-values aguicheuses.
Pour que le test ait un sens, il ne suffit pas que des chiffres injectés dans une moulinette "boîte noire" produisent d'autres chiffres supposés exprimer une vérité scientifique indiscutable. Il faut d'abord que la question formulée par le test soit traductible en une expérience aléatoire dont on puisse évaluer la plausibilité. Si on ne se plie pas à cette obligation, alors on peut toujours faire une étude, produire des résultats, et même les commenter... mais on ne peut en aucun cas lancer une affirmation en prétendant qu'elle est prouvée au seuil de confiance fixé.
---
Pour illustrer ça je vais d'abord évoquer ce que serait une "étude idéale", à savoir une étude qui pose une question précise (ou un ensemble de questions...) et à laquelle on puisse répondre par un test (ou plusieurs...) qui apporte une "preuve" statistique en réponse à la question posée.
Imaginons que tu t'intéresses à un territoire donné.
Tu commences par sélectionner aléatoirement un échantillon de points sur ce territoires. Autour de chaque point, tu détermines une zone circulaire de rayon 300 mètres, et donc de surface approximative : SZone ~ 3.14*300² ~ 282 600 m²
Ensuite pour chaque zone de l'échantillon, tu évalues d'une part le phénomène observé et d'autre part le phénomène supposé explicatif. Imaginons que la surface de prairies SP soit supposée déterminante dans la nidification : tu mesureras cette surface pour chaque zone et la retiendras comme variable explicative candidate. Et imaginons que tu puisses rechercher sur chaque zone, la présence (ou absence) de nid actif, ou pourquoi pas mieux : le nombre de nids actifs.
Dans un tel cas, tu aurais à un instant donné N zones avec à la fois l'information sur la surface SP de cette zone et l'information NIDS de cette même zone. Tu pourrais alors faire une représentation graphique de NIDS en fonction de SP. Si NIDS est quantitative (= nombre de nids sur la zone), et que le "nuage de points" résultant a une "forme" apparente, alors tu as mis en évidence un lien probable, et il y aura sûrement un test statistique qui le prouvera (à un seuil fixé). Si NIDS est qualitative binaire (présence OUI ou NON d'un nid actif sur la zone), et que les distributions de SP différent quand on compare les histogrammes pour les OUI et pour les NON... alors idem : il y a un test qui permettra d'affirmer statistiquement ce qu'on observe graphiquement.
Dans le cas ou NIDS est une variable quantitative avec un nombre de nids (à supposer qu'on ait régulièrement plusieurs nids actifs par zone...) ce test sera par exemple un test de corrélation ou de régression linéaire. Si le lien existe mais n'est pas linéaire (effet plafond, effet de retournement...), il faudra peut-être transformer la variable ou faire une régression linéaire.
Dans le cas ou NIDS est juste une variable binaire (OUI présence, NON absence), et toujours à supposer qu'il y a suffisamment de OUI et de NON pour faire un test, alors tu peux faire par exemple un test de comparaison de moyennes, en mesurant si la moyenne SP du groupe des OUI est la même que celle du groupe des NON.
Dans chaque cas : un test statistique permettra d'émettre une conclusion "probabiliste" (affirmation au seuil de confiance fixé), parce qu'ici on a clairement une expérience aléatoire facile à mettre en évidence : lorsqu'au départ de l'étude on a tiré au sort l'échantillon de zones, chacune d'elle avait une probabilité supposée commune à chaque zone (toutes choses égales par ailleurs), d'héberger un nid actif, dans le cas où l'hypothèse
est vérifiée. Et de ce fait, grâce au test on peut évaluer si le résultat de cette expérience aléatoire est plausible au regard des hypothèses et de ce que dit la théorie qui sous-tend le test (telle statistique U doit suivre telle loi avec tels degrés de libertés, etc...).
---
Dans le cas de ton étude... j'imagine bien qu'on ne peut pas procéder comme dans le cas "idéal" que j'ai proposé. Il faut de façon générale tenir compte de la réalité accessible et observable. Et trouver un "protocole" qui fournisse des mesures analysables, représentatives et comparables, et qui puissent correspondre à une expérience aléatoire, au moins intellectuellement parlant.
Dans le protocole que tu appliques toi (et que tu n'as pas intégralement décrit...), je sens bien ce qui t'a guidé, mais je ne vois pas ce qui fonde la construction d'hypothèses testables qui apporte une preuve quantifiable à ta thèse.
Ce qui t'a guidé c'est en gros de dire (je parle pour toi) :
- "J'ai 46 nids actifs en 1994 (je les appelle groupe B), qui deviennent tous abandonnés en 2011.
J'ai 9 autres nids en 2011 (je les appelle groupe A), qui n'existaient pas en 1994, et qui sont actifs en 2011."
- "Si j'observe SP au moment où les nids sont actifs, à savoir SP-B(1994) comparée à SP-A(2011) et que je ne vois pas de différence significative, MAIS que lorsque je compare SP-B(2011) avec SP-B(1994), j'observe qu'il y a eu une évolution de SP..."
- "... Alors cela m'inclinera à penser que cette évolution de SP peut être la cause de l'abandon".
Mais tout le problème ici... c'est qu'il n'y a pas de façon (en tout cas je n'en vois pas) qui permette de formuler une hypothèse adossée à une expérience aléatoire et qui permette d'aboutir à une conclusion quantifiable.
Tu observes juste un phénomène intéressant et remarquable, mais jusqu'ici tu ne sais (ni moi) pas le traduire en hypothèse quantifiable statistiquement.
L'étude restera "observatoire" ou "exploratrice" et suggèrera une voie de recherche. Mais en aucun cas en l'état elle ne me semble autoriser à émettre une affirmation quantifiable.
Cette appréciation n'est que personnelle, et il y a probablement d'autres éléments à prendre en compte et que je ne connais pas (notamment sur ce qui est connu en termes de mécanismes de nidification, de fréquentation et de comportement des espèces étudiées)... donc mon appréciation n'est pas "définitive" et ne doit pas t'arrêter. Mais elle doit te mettre en garde contre la tentation de faire des tests sans les comprendre et d'en tirer des conclusions non fondées. Et elle doit t'encourager à trouver les informations et les données, ainsi qu'un protocole et une formulation, qui enfin te permettront de réaliser un test valable.
Déjà merci beaucoup pour toutes ces explications.
Ensuite, je vais faire court du coup, mais comme j'ai eu pas mal d'autres trucs à faire (super les dégradations de panneaux une semaine après les avoir posés...) je n'ai pas eu le temps de me replonger dans les stats.
Comme je reviens mardi, je répondrais donc à tout ça et continuerai les stats à ce moment là.
Encore merci en tout cas 
Ce qui empêche d'appliquer facilement un raisonnement statistique dans ton étude... c'est principalement le fait que la façon dont les 46 nids abandonnés et les 9 nids actifs ont été "choisis" comme objets d'étude, n'apparait pas clairement.
Prenons un exemple délibérément "tiré par les cheveux" :
Supposons que les 9 nids actifs en 2011 aient été choisis précisément parce qu'ils avaient des surfaces assez approchantes des surfaces observées en 1994 sur les 46 nids actifs d'alors (et depuis abandonnés). Un tel choix pourrait avoir par exemple été fait par quelqu'un qui veut ensuite observer ce qui se passera sur ces 9 nids "similaires" au plan de la surface...
Toi tu récupères ces nids pour ton étude, et les zones qui vont avec. Tu démontres que les surfaces sont similaires avec celles des 46 nids en 1994 (la belle affaire puisqu'ils ont été choisis par quelqu'un pour ça...). Et comme tu t'intéresses à l'évolution des surfaces (c'est ton sujet), tu prouves qu'il y en a une sur les 46 nids abandonnés. Mais alors dans ce cas précis, les 9 nids actifs ne servent strictement à rien ! Il n'ont RIEN à faire dans l'étude statistique. Il ne peuvent pas servir à prouver quoi que ce soit, sans autre information.
Autre exemple radicalement différent :
Imaginons que les 46 nids correspondent à TOUS les nids qu'on a été capables de recenser à l'époque en 1994 sur un territoire donné.
Et que les 9 nids correspondent à TOUS les nids qu'on a été capables de recenser en 2011 sur ce même territoire, en mettant en œuvre les mêmes moyens.
La première conclusion c'est qu'il y a une diminution très importante (-80%).
La deuxième, c'est que "curieusement", les nids de 2011 ont été développés dans des sites dont la structure des surfaces est similaire (à supposer que tu prouves ce résultat), alors que les surfaces des 46 nids abandonnés (comme par hasard) ont évolué.
On voit bien ici que l'observation est "plus forte" et porte potentiellement une information. Mais pour pouvoir mesurer statistiquement la force de ce lien, il faut pouvoir se rapprocher d'une expérience aléatoire qui permette une telle mesure.
Par exemple réfléchir en partant de la façon dont les oiseaux font leur choix... ce qui suppose de réfléchir à "l'offre" de zones qui leur est proposée à différents moments. Mais ton étude ne contient pas en l'état d'information qui le permette (en tout cas par rapport à ce que tu en as dit pour l'instant). Pour pouvoir établir un raisonnement statistique, il faudrait vraiment clarifier le choix des nids dans l'étude d'une part, et par les oiseaux d'autre part (en fonction de "l'offre de zones disponibles")...
Pourquoi peuvent-ils ne pas revenir au même endroit? Dans le cas où il y a dérangement là où ils étaient l'année d'avant (genre un chien se ballade dans la prairie
où ils vont toujours), ils changent de site.
Le problème est qu'il n'y a plus énormément de sites potentiellement favorables (d'une part il faut des prairies et il faut un milieu ouvert avec peu d'arbres
sinon la corneille s'y met et les bouffe). Lorsque qu'ils cherchent, ils veulent retourner au même endroit mais tout d'abord ils survolent et regardent. Si pas de
fréquentation ils s'installent, sinon ils vont ailleurs mais du coup dans un site moins favorable potentiellement. Et si là encore dérangement ils vont encore partir
pour un site potentiellement encore moins favorable.
On imagine que le site utilisé depuis 10 ans par un couple l'est parce que l'occupation du sol lui convient et si une année il part forcément c'est
qu'il y a quelque chose d'exceptionnel (comme un chien qui se ballade). Tu vois le truc?
Finalement il y a des sites qui ont été abandonnés parce que les surfaces au sol ne conviennent plus (nichent pas dans les cultures comme je l'ai dit) mais ils peuvent
avoir changé parce que fréquentation. Ou pire ils peuvent avoir disparu parce que le couple est mort vu qu'il n'y a plus de renouvellement de population (les jeunes
meurent ou il n'y en a pas) et auquel cas la disparition du couple n'a rien à voir avec la disparition des prairies.
Mon étude est donc... à la limite du farfelu quand on sait tout ça mais les facteurs sont là et il faut bien faire quelque chose avec (ça parait idiot à dire...).
Maintenant pour la partie statistiques:
Je mets du coup à jour un peu ce que je disais vu que de mijoter tout ça ça me fait penser à quelques nouveaux points.
En comparant SP-B (94) et SP-B (2011), le fait de ne pas constater de différence peut donc ne rien vouloir dire. En fait il faudrait que je difféncie les nids où
il y a modification du sol entre les deux dates (donc où entre 94 et 2011, les surfaces au sol du site n'ont pas de manière significative changées) de ceux où les
différentes surfaces ont changés.
J'explique: si le nid 1 (groupe B) n'a pas de différence significative d'occupation du sol entre 94 et 2011, son abandon est lié soit à une surfréquentation soit à une
mort du couple. Mais cela demande de comparer les nids un après l'autre et non plus seulement les surfaces (SP-B (94) et SP-B (2011)). Seuls les nids concernés par le
changement d'occupation du sol devrait être inclus dans le test, non?
J'aurai donc juste les nids où il y a eut un changement d'occupation entre les deux dates (changement significatif du moins) et pour ces nids il faudra que je teste
les hypothèses H0 et H1 citées prédemment. On pourra du coup enlever une bonne partie du facteur fréquentation pour les nids abandonnés. Par contre pour les nids actuels,
il va falloir faire avec ce facteur.
Finalement le fait d'avoir autant de facteurs est compliqué... Un jour je pense un truc le lendemain je me dis non c'est faux je dois le prendre dans un autre sens. Que
penses-tu de ce raisonnement?
Mais si tu es d'accord, alors il faudrait que je compare chaque nid entre les deux dates. Genre:
id nid1 nid1bis
foret 30105 31257
prairie 244264 239012
culture 0 0
route 2835 7763
urbain 0 0
eau 5396 4568
friche 0 0
Avec nid1= nid 1 abandonné en 94 et nid1bis=nid 1 abandonné en 2011.
Il faudrait alors comparer avec un test pour échantillons appariés les valeurs de forêt, prairie,... pour voir si pareil ou pas et ainsi éliminer tous les nids dont la
disparition est liée à un autre facteur que celui de l'occupation du sol. Et ensuite tester s'il y a bien une différence entre les surfaces totales de prairies entre
les deux années.
Est ce que c'est compréhensible?
A côté de ça pour la normalité: j'avais calculé les p-values pour chaque occupation du sol. Pourquoi n'est-il pas possible de faire comme j'ai vu en cours: regarder la p-value et ensuite l'équivariance? Je n'ai pas compris ce point là.
Merci encore
!
Vous devez être membre accéder à ce service...
Pas encore inscrit ?
1 compte par personne, multi-compte interdit !
Ou identifiez-vous :