Citation :
Candida glabrata : 0 décès sur 11
Autres Candida : 32 décès sur 76
J'obtiens avec la même méthode p = 0.007
donc si je fixe le seuil de confiance à 95%, je peux affirmer que le décès est dépendant de l'espèce de Candida?
Ou alors le fait que le nombre d'une cellule soit "0" rend inutilisable ce test ?
A priori ton test est correct. Je trouve la même valeur de p. Ta décision de rejet est juste, au seuil que tu t'es fixé (95%).
Donc a priori je dirais comme toi que sur ce jeu de données, la chute de décès sur glabrata est anormale statistiquement, et n'est donc probablement pas le seul fait du hasard.
N'oublies pas que tu dois toujours fixer ce seuil avant de faire le test.
Ici tu avais de la marge : un seuil à 99% aurait conduit aussi au rejet de l'indépendance.
Il n'est pas correct "d'adapter" ton seuil de décision pour que la conclusion penche du coté "qui t'arrange" en fonction de la p-value...
Mais sinon, en dehors de cet éventuel détail (que tu sembles avoir respecté dans la logique...), je pense que le test est correct au plan statistique.
La valeur zéro dans une cellule n'est pas un problème en soi : au contraire celà accrédite que Glabrata a tendance à protéger du décès...
Après, la question est aussi de savoir quelles sont les pratiques "métier" du domaine dans lequel tu interviens.
Peut-être qu'un seuil de confiance meilleur est exigé...
Peut-être que des effectifs minimums sont requis...
Ainsi, si tu considères par exemple que des erreurs de relevés sont possibles, alors les résultats de ton étude sont bien plus sensibles à un changement d'une unité que si les effectifs étaient doubles ou triples...
Par exemple, si tu passes de 0 décès sur 11 à 1 sur 11, la p-value est multipliée par 5,
et une décision au seuil de 99% ne serait par exemple plus possible...
Avec des effectifs doubles, tu n'aurais pas ce souci...
A voir peut-être avec ton tuteur ou avec des spécialistes du domaine étudié...