Échantillonage

 Niveau secondePartager :
			        
Échantillonage 
Posté par 
ValeC  17-05-16 à 00:27
Personne dans ma classe à compris ce devoir maison, pouvez-vous nous aider s'il vous plaît ?

Lors d'une enquête effectuée par le CEREQ ( Centre d'étude sur les

qualifications) sur 3800 jeunes ( âgés en moyenne de 21 ans) sortis du système éducatif avec pour niveau de formation BAC +2 ou plus en 2001 , on décompte 2 250 filles contres 1550 garçons. 

On considère par ailleurs qu'en 2001, parmi les jeunes âgés de 21 ans, il y a 50% de filles et 50% de garçons.

Un statisticien conclut alors que le hasard ne peut pas «raisonnablement »expliquer à lui seul la sous représentation des garçons dans les jeunes sortis du

système éducatif avec au moins BAC+2.

 Purquoi le statisticien a-t-il raison ? 

Répondre à la question à l'aide d'un rapport écrit.

Décrire les raisonnements suivis et présenter vos résultats de façon claire

grâce à notamment des graphiques.
 Posté par 
LeDinore : Échantillonage   17-05-16 à 02:44
Bonsoir,

Ce serait mieux qu'un professeur donne son avis, mais l'exercice me parait un peu délicat à traiter pour un niveau seconde.

Le raisonnement est typiquement le suivant :

Si la sortie avec un diplôme du supérieur à l'âge de 21 ans (événement qu'on notera DS21 dans la suite) est indépendante du sexe, alors on devrait avoir la même proportion de garçons parmi les DS21 que dans la population générale des 21 ans. Donc 50%.

Si l'enquête porte sur  n = 3800  jeunes tirés au hasard parmi les DS21,  alors l'intervalle de fluctuation au seuil de 95% de la fréquence de garçons dans l'échantillon devrait être approximativement :  

IDF95(f)  =  [ p - 1/racine(n) ; p + 1/racine(n) ]  =  [ 48.3% ; 51.7% ]

Avec  p = 1/2  et n = 3800

Or, la proportion de garçons observée dans l'enquête est de  f = 1550/3800 = 40.8%.

Elle est donc largement en dehors de l'intervalle de fluctuation attendu.

Cette répartition ne peut donc pas raisonnablement être imputée au hasard.

Le statisticien dira que l'hypothèse d'indépendance entre le sexe et la sortie du système éducatif à 21 ans avec un diplôme du supérieur doit être rejetée au seuil de confiance 95%.

---

Pour ma part, je trouve l'exercice délicat pour un niveau seconde car il faut en principe expliquer ce que j'ai affirmé en introduction : 

Indépendance :

Si la sortie avec un diplôme du supérieur à l'âge de 21 ans (DS21) est indépendante du sexe, alors on devrait avoir la même proportion de garçons parmi les DS21 que dans la population générale des 21 ans

Cette affirmation est assez intuitive, mais en principe elle doit être prouvée, comme ceci :

Si  G et DS21 sont indépendants, alors :  

        P(G et DS21) = P(G) * P(DS1)

        P(F et DS21) = P(F) * P(DS1)

        P(G et DS21) / P(F et DS21) = P(G) / P(F) = 1             ::   car P(G) = P(F)

        ==>  P(G et DS21) = P(F et DS21) = 1/2 = p                ::   car la somme des deux vaut 1
 Posté par 
ValeCre : Échantillonage   20-05-16 à 00:23
Bonsoir, merci pour votre précieuse aide. Je ferais donc part à mon professeur de mathématiques de la difficulté de ce travail. Grâce à votre explication j'ai compris la logique du devoir. 
 Posté par 
LeDinore : Échantillonage   20-05-16 à 00:42
Bonsoir,

Ce n'est pas le travail à réaliser qui est difficile : il suffit de calculer un simple intervalle de fluctuation de fréquence centré sur  p=0.50  et  avec n=3800.

Ce qui est délicat selon moi, c'est de reconstituer le raisonnement complet du statisticien pour identifier ces paramètres, en particulier la valeur de p. Il semble "intuitif" de choisir p=0,50 mais c'est en réalité quelque chose qu'il faudrait justifier...
 Posté par 
Yzzre : Échantillonage   20-05-16 à 17:40
Salut LeDino , 

Je lis toujours avec intérêt tes interventions au sujet d'exos concernant les satistiques, et donc j'en profite pour étaler mon incultance et mon incompéture :

Je ne comprends pas ta remarque au sujet du p = 0,5 choisi.

Si on considère que la répartition H/F dans la société Française est de 1/2 - 1/2 , et que l'on veut "comparer" la répartition H/F parmi les DS21 étudiés, il me semble logique de prendre ce p = 0,5.

Peux-tu préciser ce qui est gênant là-dedans ?

Merci par avance     
 Posté par 
Yzzre : Échantillonage   20-05-16 à 17:44
Bon, je viens de relire tranquillement, et j'ai compris ce que tu voulais dire.
 Posté par 
LeDinore : Échantillonage   20-05-16 à 18:08
Si on calcule l'IDF de la fréquence de l'échantillon, avec  p=0.5  et  n=3800

... et qu'on constate que la fréquence observée est largement en dehors de cet IDF

... on prouve alors clairement que la proportion de garçons au sein de la population DS21 

... ne peut pas être la même que celle de la population globale (p=0.5).

Je suppose que c'est ce qu'on attend de l'élève ici.

Mais pourquoi est-ce précisément cette hypothèse (p=0.5) qu'il est judicieux de poser ?

Et que représente-t-elle en soi ?

Selon moi, s'il y a indépendance entre DS21 et le SEXE, alors P(G et DS21) doit être égale à 0.5  (ce qui se démontre assez simplement comme je l'ai fait plus haut...). 

Donc quand on teste  p=0.5,  c'est en fait l'indépendance entre DS21 et le SEXE qu'on teste.

Pour moi c'est ce qui justifie qu'on fasse cette hypothèse.

Même si l'intuition nous dit que c'est ce qu'il faut faire... je trouve que c'est mieux de raccrocher cette intuition à un argument tangible.

Mais je sais que je vais probablement trop loin. Et si l'élève a compris intuitivement qu'il devait tester  p=0,5  c'est déjà formidable.
 Posté par 
LeDinore : Échantillonage   20-05-16 à 18:15
Lorsqu'un problème requiert un test d'hypothèse, j'essaie toujours d'imaginer l'expérience aléatoire qui supporte ce test. C'est un très bon moyen d'identifier clairement ce qui est connu et ce qui ne l'est pas lors de l'expérience... et de vérifier si quelque chose manque ou cloche...

--- 

Cela dit ma remarque est difficilement explicable à un élève de seconde.

Disons que j'aurais juste trouvé préférable que l'énoncé évacue ce petit tracas en mettant les points sur les "i" par lui même, par exemple comme ceci :

- " peut-on considérer que la proportion de garçons au sein des DS21 est la même que celle au sein de la population générale ?".
 Posté par 
Yzzre : Échantillonage   20-05-16 à 18:53
Oui, en fait c'est ce qui n'est que suggéré dans la phrase : "Un statisticien conclut alors que le hasard ne peut pas «raisonnablement »expliquer à lui seul la sous représentation des garçons dans les jeunes sortis du système éducatif avec au moins BAC+2" : cela suppose donc qu'une "représentation correcte" serait de 50/50.

C'est bien ça ?
  Posté par 
LeDinore : Échantillonage   20-05-16 à 19:04
Oui c'est bien ça : ce n'est que suggéré mais non dit.

Et c'est de plus maladroit parce que la "sous représentation" à expliquer est celle de l'échantillon (la seule sous représentation qui soit connue) et ce n'est pas dit ainsi.

Mais bon ce n'est pas grand chose.
Ce topic

Imprimer
Réduire / Agrandir
Pour plus d'options, connectez vous !
Fiches de maths

Statistiques et probabilités en seconde
12 fiches de mathématiques sur "statistiques et probabilités" en seconde disponibles.
Rechercher
Espace membre
Zone membre
Pas de compte ?
Je m'inscris
4 visiteurs
Changer d'île
Cours et Exercices de maths
Forum de maths
college
lycee
Outils de maths
Pages les plus populaires
Seuls les membres peuvent poster sur le forum !

Ce topic

Fiches de maths