Inscription / Connexion Nouveau Sujet
Niveau terminale
Partager :

dénombrement appliqué recapture par photo-identification

Posté par
AlgA
04-06-12 à 12:32

Bonjour,

Je suis sur un pb d'application des méthodes de dénombrement à la probabilité de recapture par photo-identification dans un groupe d'animaux que l'on voit à deux reprises.
Le groupe compte N individus (c'est le nombre de boules). A la première rencontre j'identifie K individus (ce sont mes K boules rouges). A la seconde rencontre, j'identifie P individus (ce sont mes P tirages simultanés), et parmi les P individus, il y en a J qui ont été identifiés à la première rencontre (on appelle ça des recaptures, en zoologie).

Mon problème peut se décliner en deux questions:
1) (hypo: P < K): probabilité que les P tirages soient des individus recapturés (donc des boules rouges)
2) (hypo: P < K): probabilité que parmi les P, il y en ait J recapturés et le reste n'a pas encore été identifié (donc J boules rouges et P-J boules blanches)

Mes souvenirs de première (vieux de 35 ans) et ce forum m'ont permis de trouver la réponse à la question (1): c'est le rapport des Combinaisons C p,k / C p,n, me semble-t-il ...
Pour la question 2, faut-il que je fasse une probabilité par ET en dénombrant séparément les K boules rougest et les (P-K) boules blanches et en faisant la multiplication des deux probas ?

Merci pour votre lumière

PS: c'est pour tout les lycéens qui imaginent que les probas c'est seulement au BAC qu'on les rencontre (LOL)

Posté par
LeDino
re : dénombrement appliqué recapture par photo-identification 04-06-12 à 14:18

Bonjour AlgA,

Ton cas numéro 1 n'est qu'un cas particulier du cas numéro 2.
Sauf erreur, la probabilité P(j) d'avoir j recapturés est :

P(j) = C j,k * C p-j,n-k / C p,n

En effet, tu as en tout C p,n manières de tirer p individus parmi n possibles.
Et tu as C j,k manières de choisir les j retirés parmi k possibles,
à croiser avec les C p-j,n-k manières de choisir les (p-j) autres parmi les (n-k) non identifiés.

Tu peux vérifier que pour j=p (cas n°1), la formule donne bien :
P(p) = C p,k * C p-p,n-k / C p,n = C p,k / C p,n

Tu peux aussi vérifier que la somme des probabilités de tous les cas vaut bien 1 (pour chaque cas : J varie donc de 0 à p).
Pour celà il faut que la somme des P(j)j=0,p valle 1.

Calcul de la somme des P(j) :
S = Somme j=0,p [ C j,k * C p-j,n-k / C p,n ]
Or : Somme j=0,p [ C j,k * C p-j,n-k ] = C p-j+j,n-k+k = C p,n
(identité de Vandermonde)

Donc la somme cherchée vaut bien 1, ce qui semble confirmer la validité de la formule.

NB: pour que tout ça ait un sens, il faut naturellement que le processus de recapture soit totalement aléatoire et équiprobable. Peut-être y a-t-il des animaux qui se laissent plus difficilement attraper deux fois... et réciproquement, peut-être que certains animaux se laissent plus facilement prendre que d'autres...

Posté par
AlgA
suite 04-06-12 à 14:48

Bonjour Le Dino,

Merci beaucoup pour ta réponse que je vais analyser et digérer.

Pour ta remarque sur les équiprobabilités de recapture elle est totalement justifiée. Il est certainement inexact que des animaux (ici des dauphins de Risso en Méditerranée) ont des probabilités égales d'être rephotographiés.
Je crois que l'on peut accéder à ces réalités d'hétérogénéité par des "approches bayesiennes". Pour le moment (je ne suis pas un spécialiste de la capture-recapture), je suis juste à la recherche d'un "modèle simplifié" permettant de recadrer les choses en première approche. C'est pour donner une idée à une stagiaire étudiante de master 1, qui en sait moins que moi, et qui est en train d'analyser nos recaptures.

Je tiendrai bien sûr compte de tes réserves.

AlGa

PS: pour la petite histoire, mes trois enfants qui ont fait des prépas il y a peu ne m'ont pas aidé à résoudre le pb. C'est dommage, le dénombrement c'est marrant, mais il y a des gamins qui le craignent.

Posté par
LeDino
re : dénombrement appliqué recapture par photo-identification 04-06-12 à 17:21

C'est pas parce que j'ai fait prépa que je me suis lancé dans le calcul...
C'est parce que je joue au poker ...
En pédagogie, la récompense est le meilleur stimulant de l'apprentissage .

Une remarque :
Si le nombre déjà capturé (k) est petit par rapport à la taille de la population (N), de même que le nombre de photos prises (p), alors il y a une manière plus simple d'approcher le calcul, en considérant qu'il s'agit d'une loi binomiale à p tirages de probabilité q=k/N.

En gros, la question est de savoir la probabilité de rephotographier j dauphins lorsque tu en tires p dans une population de N, avec à chaque fois environ q=k/N chances de tomber sur un dauphin déjà photographié.

Et dans ce cas :  P(j) = C p,j * q^j * (1-q)^(p-j)
Avec q=k/N

Par exemple, pour N=1000, k=100, p=30, cette formule est une très bonne approximation de la précédente.

La formule est peut-être plus simple à comprendre et à appliquer.
Elle peut également présenter un autre avantage, en permettant éventuellement d'introduire un paramètre qui matérialiserait la propension d'un dauphin à se faire rephotographier.

Par exemple en posant une probabilité "corrigée" :
q' = alpha.q = alpha.(k/N)

En remplaçant q par q' dans la formule, et à supposer qu'un historique de données permette d'évaluer les proportions de recaptures... il serait possible de quantifier le coefficient alpha.

Un sujet déjà pris aurait ainsi alpha plus de chances de se faire prendre à nouveau qu'un sujet pris au hasard... L'observation de plusieurs cycles permettrait de valider que cet alpha est constant...

C'est juste un exemple de piste, après il faut bosser la question plus sérieusement...

Bon courage ...

Posté par
AlgA
re : dénombrement appliqué recapture par photo-identification 04-06-12 à 17:45

Merci beaucoup Le Dino,

Oui la binomiale, c'est aussi ce qu'il y avait dans mon memento de poche.
Alors du coup, avec deux modèles, c'est deux matinées de calme pour bien assimiler les solutions. Le bonheur ...
Je reviendrai sur le "post" si j'ai des choses intéressantes à ajouter.

AlgA

Posté par
LeDino
re : dénombrement appliqué recapture par photo-identification 04-06-12 à 19:14

Le fait d'avoir deux modèles proches offre les avantages suivants :

1. Cela permet de vérifier qu'il n'y a pas d'erreur dans la programmation de la formule (par exemple sur tableur, en comparant les deux colonnes...).

2. Cela permet de se rassurer sur la validité de la première formule (donnée par un dénombrement toujours un peu périlleux...) en la recoupant par une formule approchée, que le bon sens permet mieux de comprendre.

NB : toujours vérifier que la somme des cas a une probabilité égale à 1 (dans les limites du possible, parce que si p=200,000 ça fait un peu beaucoup, même sur un tableur... mais je doute qu'autant de dauphins se fassent tirer le portrait ).

Bon courage.



Vous devez être membre accéder à ce service...

Pas encore inscrit ?

1 compte par personne, multi-compte interdit !

Ou identifiez-vous :


Rester sur la page

Inscription gratuite

Fiches en rapport

parmi 1675 fiches de maths

Désolé, votre version d'Internet Explorer est plus que périmée ! Merci de le mettre à jour ou de télécharger Firefox ou Google Chrome pour utiliser le site. Votre ordinateur vous remerciera !