Bonjour.
On a une population de N individus à qui on veut poser M questions. La réponse à une question est uniquement oui (1) ou non (0). Une fois qu'on a posé toutes les questions, on fait un bilan par individu. Si l'individu a répondu oui (1) au moins une fois alors on pose 1 dans le bilan. Si l'individu a répondu non (0) à toutes les questions, on pose 0. Voici un exemple dans un tableau avec 6 individus et 4 questions :
Individus
| 1 2 3 4 5 6
---|------------
1 | 0 1 0 0 1 0
2 | 1 0 0 1 1 0
3 | 1 1 0 1 1 0
4 | 0 1 0 1 1 0
----------------
Bilan | 1 1 0 1 1 0
Le nombre d'individus est en général grand (~10000) et le nombre de questions assez grand (~100). Sachant que poser une question coûte cher, on ne peut poser toutes les questions à tous les individus. On cherche donc à estimer la proportion de 0 et de 1 dans la ligne de bilan en minimisant le nombre de questions posées.
Une solution possible est de prendre un échantillon d'individus, et de leur poser les questions en s'arrêtant dès leur premier oui. Seuls les individus répondant non à toutes les questions coûteront cher.
Cependant, cette solution n'est pas assez satisfaisante. Y a-t-il moyen par exemple de se limiter à un nombre maximum de questions par individu, même s'il n'ont pas encore répondu oui ?
Merci pour vos suggestions.