Bonjour à tous,
Je suis en train de réfléchir sur la résolution d'une problématique statistique et j'aurai besoin d'un petit coup de main.
Du coup, je vous expose mon problème.
Je souhaiterai trouver le moyen d'estimer des valeurs d'une série statistique en connaissant la moyenne et l'écart-type de la série.
Je vous donne un exemple ci-dessous, d'une série statistique sur les âges des personnes travaillant dans une entreprise.
L'entreprise possède 20 salariés dont l'âge moyen est de 33,05 et l'écart type = 8,941182072.
Je connais l'âge de 16 personnes (30,35,32,31,18,25,29,50,36,44,32,26,20,24,46,45,?,?,?,?).
Mon objectif est de trouver les valeurs possibles pour les 4 valeurs en utilisant la formule du calcul de la moyenne et de l'écart type. Et du coup, est-ce qu'il serait possible de formuler une équation pour retrouver l'âge des 4 personnes ?
Sachant que l'âge est une variable quantitative discrète, je devrai arrondir les résultats pour avoir des entiers.
Du coup, est-ce que vous pouvez m'aider à écrire cette équation ?
Merci d'avance pour votre aide.
salut
il suffit d'écrire les formules donnant la moyenne et la variance .. en notant a, b, c et d les valeurs manquantes ...
puis réfléchir sachant qu'on a deux équations et quatre inconnues ...
Salut Carpediem,
Merci pour ta réponse. Je suis rouillé sur la résolution de système, donc si tu pouvais m'accompagner pour réussir à résoudre mon exemple.
Donc ma première équation est obtenu à partir de la formule d'une moyenne :
1) 523+a+b+c+d = 661
523 correspond à la somme des valeurs connues. Et le 661 c'est en multipliant la moyenne obtenue par le nombre d'individu total.
2) Pour la deuxième équation, j'ai plus de mal à l'écrire.
Si je reprends la formule de l'écart-type ça nous donne ça :
1/20*(30-33.05)2+(35-33.05)2...+(a-33.05)2+(b-33.05)2+(c-33.05)2+(d-33.05)2=8,941182072
Du coup, je bloque à cette étape pour simplifier cette équation de l'écart-type.
Je suis désolé pour l'écriture des équations, j'ai du mal avec le forum, je ne sais pas utiliser les signes. Du coup, il y a peut-être des erreurs sur la formulation.
Encore merci de ton aide
déjà élève au carré pour te simplifier la vie et te débarrasser de cette racine carrée
ensuite tu devrais ordonner la série des ages que tu connais pour y voir plus clair ....
Du coup, comme tu m'as indiqué j'ai élevé au carré pour me débarasser de la racine. Je fais également passer la fraction 1/20 de l'autre côté et j'obtient ceci :
1355,54+(a-33.05)2+(b-33.05)2+(c-33.05)2+(d-33.05)2=1598,894737
1355,54 correspond au carré de la somme des écarts des valeurs connues à la moyenne.
1598,894737 c'est l'écart type au carré multiplié par 20.
Je fais passer les constantes d'un côté pour obtenir ceci :
(a-33.05)2+(b-33.05)2+(c-33.05)2+(d-33.05)2=243,354736893085
Ensuite, j'ai essayé de ramplacer le membre d'une equation par un autre en utilisant la première équation :
Par exemple b=661-523-a-c-d=138-a-c-d
Mais là je suis complètement bloqué. Comme j'ai des expressions que je ne reconnais pas, je n'arrive pas à développer.
Est-ce que tu pourrais m'aider ?
oui c'est l'idée
mais puisque tu as deux équations et quatre inconnues tu peux exprimer l'une des inconnues par exemple d en fonction des trois autres grace à la première équation :
d = 138 - a - b - c
que tu remplaces dans la deuxième équation ...
et maintenant tu as une infinité de solutions :
(a - 33,05)^2 + (b - 33,05)^2 + (c - 33,05)^2 + (124,95 - a - b - c)^2 = 243, 35 ...
tu choisis pour a et b des valeur quelconques .... ou presque puisque tu as une somme de carrés donc de nombres positifs de somme 243, ... et il te reste une inconnue c dans une équation du second degré ...
Je vois, je suis obligé de choisir 2 valeurs pour a et b.
Je pensais qu'on pouvait trouver les 4 valeurs sans avoir à en choisir deux au hasard.
Quand tu as autant d'équations que d'inconnues, et que tu cherches des Réels, il y a en principe une seule solution.
Quand tu as moins d'équations que d'inconnues, et que tu cherches des réels, il y a en principe une infinité de solution.
Mais ici, tu cherches des entiers. Et ça, ça peut te sauver.
Quand tu vas choisir arbitrairement des valeurs entières pour a et b, il y a toutes les chances que c et d ne soient pas entiers. Et il va y avoir très peu de combinaisons qui donnent le résultat voulu, avec (a,b,c,d) entiers tous les 4.
Mais la démarche reste la même. Tu choisis a et b, puis tu calcules c et d. Et tu retiens la solution uniquement si c et d sont entiers.
ensuite il faut réfléchir ...
salut,
pour la serie
[30,35,32,31,18,25,29,50,36,44,32,26,20,24,46,45,25,33,39,41.0]
il me semble que l'ecart-type est
8.71478628539
c'est l'ecart-type estime qui vaut
8.94118207186
Je pensais vraiment que ce serait la seule solution ... planté !
Comment on tâtonne.
Il faut un tableur, sinon, c'est très vite pénible.
On met les 20 valeurs (les 16 connues, + 4 plus ou moins au hasard) et on met 2 formules, une qui calcule la moyenne et l'autre qui calcule l'écart-type.
Faire en sorte que la moyenne tombe juste, c'est très facile.
Pour faire en sorte que l'ecart-type tombe juste, on tâtonne. Si on a un écart-type trop faible, on diminue de 1 une des valeurs 'petites' et on augmente de 1 une des grandes valeurs. et si on a un écart-type trop grand, on fait l'inverse.
On trouve très vite une solution, s'il y en a une.
Mais , l'expérience l'a prouvé, on n'a aucune certitude sur le fait que cette solution soit la seule ou non.
alb12 a très certainement utilisé des moyens plus systématiques pour trouver ses 4 solutions. Au lieu de prendre 10 minutes, avec du tâtonnement, ça lui a pris 15 minutes pour avoir toutes les combinaisons.
j'ai simplement recherche les quadruplets (a,b,c,d) verifiant par exemple 20<=a<=b<=c<=d<=70
Ici avec une fonction en Xcas et en français.
fonction Resolution()
local L,a,b,c,d,D,m,s;
L:=[];
pour a de 20 jusque 70 faire
pour b de a jusque 70 faire
pour c de b jusque 70 faire
pour d de c jusque 70 faire
D:=[30.0,35,32,31,18,25,29,50,36,44,32,26,20,24,46,45,a,b,c,d];
m:=moyenne(D);
s:=ecart_type_population(D);
si m==33.05 et abs(s-8.941182072)<=10^-9 alors
L.append([a,b,c,d]);
fsi
fpour
fpour
fpour
fpour
retourne L
ffonction:;
Oulala je suis perdu par rapport à la programmation.
Dans un premier temps, il faut que j'arrive à résoudre à la main la deuxième équation (celle de l'écart-type) en prenant deux valeurs qu'on vous avez trouvé.
Par exemple :
a= 25 et b=33
Si je remplace ces valeurs dans la 2ème équation, j'obtiens ceci :
(29-33.05)2+(33-33.05)2+(c-33.05)2+(124,95-25-33-c)2 = 243,35
En calculant avec les valeurs ça me donne : 64.8025+0.0025+(c-33.05)2+(66,95-c)2=243,35
Ensuite je pense que je dois me louper quelques part, ça remonte à longtemps pour moi la résolution d'équation. Je dois utiliser les identités remarquables (a-b)2 pour développer les 2 termes (c-33.05)2+(66,95-c)2 ?
Merci pour votre aide, et désolé de vous embêter par rapport à une résolution d'équation qui doit être simple pour vous.
Franchement en post bac on a mieux à faire que resoudre des equations du second degre
Par exemple apprendre les bases de la programmation.
La fonction que j'ai donnee au dessus est du niveau seconde/premiere.
Vraisemblablement je n'y arrive pas à résoudre l'équation et ce malgré le fait de prendre 2 valeurs pour a et b. 
C'est un problème de résolution que je rencontre.
Que ce soit en prenant en compte l'écart type ou l'écart type estimé, je n'arrive pas à développer correctement les termes de l'équation.
Desole pour le retard
avec a=25 et b=33 la moyenne est (c+d+581.0)/20
si cette moyenne est egale à 33.05 alors d=80-c
Commence par corriger cette erreur.
Reprenons du coup, effectivement il y a des erreurs par rapport à ce que j'avais écrit.
Du coup,
Pour a = 25 et b =33
d = 138-25-33 = 80
Ensuite, j'avais écrit ceci
(29-33.05)2+(33-33.05)2+(c-33.05)2+(124,95-25-33-c-33,05)2 = 243,35....
D'ailleurs ce n'est pas 29 mais 25 donc je corrige,
(25-33.05)2+(33-33.05)2+(c-33.05)2+(138-25-33-c-33,05)2 = 243,35...
Je devrais obtenir :
64.8025+0.0025+(c-33.05)2+(46,95-c)2=243,35
64.805 + c2 - 66.1c + 33.052 + 46,952 - 93,9c + c2 = 243,35....
Est-ce que c'est de cette façon qu'on développe ?
Merci de ton aide
je resous ton equation avec Xcas:
solve(64.8025+0.0025+(c-33.05)^2+(46.95-c)^2=243.35,c)
j'obtiens
list[33.5992187977,46.4007812023]
donc tu as encore au moins une erreur dans ton equation
J'obtiens cette équation :
2c2-160c+3118.05526
Je trouve 2 solutions pour c mais ce ne sont pas des valeurs entières.
Ça parait simple et pourtant je n'arrive pas à résoudre cette équation.
les solutions de cette equation sont list[33.5990336667,46.4009663333]
donc cette equation n'est pas la bonne inutile de chercher à la resoudre
Voilà mon calcul :
Equation 1 :
a=25 et b = 33
donc d = 138-25-33-c = 80-c
Equation 2 :
Je connais 18 valeurs dont je calcule l'écart à la moyenne élevé au carré.
(30-33.05)2+(35-33.05)2+(32-33.05)2....+(25-33.05)2+(33-33.05)2=1420,345
Il me reste les deux membres à développer :
(c-33.05)2+(80-c-33.05)2
En développant j'obtiens ceci :
c2 - 66.1c + 1092.3025 + 2204.3025 - 93.9c + c2
Je regroupe les termes :
2c2 - 160c + 3296.605
Je rajoute la somme des écarts de tout à l'heure :
2c2 - 160c + 3296.605 + 1420.345
Et il me reste la partie avec l'écart-type qui est à l'origine de l'équation ce qui donne :
2c2 - 160c + 3296.605 + 1420.345 = 8,9411820722*20
Pour au final obtenir :
2c2 - 160c + 3296.605 + 1420.345 - 1598.89474 = 0
2c2 - 160c + 3118.05526 = 0
Excellent ! Tres bien !
On va pouvoir conclure
Attention: il ne faut pas multiplier par 20 mais par 19 car c'est l'ecart-type estime qui est donne dans l'enonce
Le reste me semble juste.
Encore un petit effort 
En effet ça change tout. Je prenais l'écart-type de la population au lieu de l'écart type estimé.
Donc ça me donne l'équation finale :
2c2 - 160c + 3198 = 0
Et j'obtiens 2 valeurs possibles 41 et 39.
Je retrouve bien le résultat voulu.
Ce qui me reste à faire, c'est d'essayer de programmer la résolution avec excel VBA (par exemple).
Dans ton programme, tu as encadré les valeurs de a,b,c,d entre 20 et 70.
Qu'est ce qui t'a permis de prendre ces bornes ?
Encore merci pour ton aide.
en tout cas c'est totalement stupide de prendre un écart type estimé d'une population de 20 employés dans la statistique est mené sur les 20 employés
c'est un autre pb que d'une population de taille N on extrait un échantillon de taille n dont une statistique donne une moyenne et un écart type m et s et qu'on veuille faire une estimation sur la population totale ...
et à tout le moins ça devrait être précisé dans l'énoncé ...
Vous devez être membre accéder à ce service...
Pas encore inscrit ?
1 compte par personne, multi-compte interdit !
Ou identifiez-vous :