Inscription / Connexion Nouveau Sujet
Niveau IUT/DUT
Partager :

Statistique - Estimation des valeurs d'une série

Posté par
foxhound92
28-11-19 à 15:28

Bonjour à tous,

Je suis en train de réfléchir sur la résolution d'une problématique statistique et j'aurai besoin d'un petit coup de main.

Du coup, je vous expose mon problème.

Je souhaiterai trouver le moyen d'estimer des valeurs d'une série statistique en connaissant la moyenne et l'écart-type de la série.

Je vous donne un exemple ci-dessous, d'une série statistique sur les âges des personnes travaillant dans une entreprise.

L'entreprise possède 20 salariés dont l'âge moyen est de 33,05 et l'écart type = 8,941182072.

Je connais l'âge de 16 personnes (30,35,32,31,18,25,29,50,36,44,32,26,20,24,46,45,?,?,?,?).

Mon objectif est de trouver les valeurs possibles pour les 4 valeurs en utilisant la formule du calcul de la moyenne et de l'écart type. Et du coup, est-ce qu'il serait possible de formuler une équation pour retrouver l'âge des 4 personnes ?

Sachant que l'âge est une variable quantitative discrète, je devrai arrondir les résultats pour avoir des entiers.

Du coup, est-ce que vous pouvez m'aider à écrire cette équation ?

Merci d'avance pour votre aide.

Posté par
carpediem
re : Statistique - Estimation des valeurs d'une série 28-11-19 à 18:42

salut

il suffit d'écrire les formules donnant la moyenne et la variance .. en notant a, b, c et d les valeurs manquantes ...

puis réfléchir sachant qu'on a deux équations et quatre inconnues ...

Posté par
foxhound92
re : Statistique - Estimation des valeurs d'une série 29-11-19 à 12:38

Salut Carpediem,

Merci pour ta réponse. Je suis rouillé sur la résolution de système, donc si tu pouvais m'accompagner pour réussir à résoudre mon exemple.

Donc ma première équation est obtenu à partir de la formule d'une moyenne :

1) 523+a+b+c+d = 661

523 correspond à la somme des valeurs connues. Et le 661 c'est en multipliant la moyenne obtenue par le nombre d'individu total.

2) Pour la deuxième équation, j'ai plus de mal à l'écrire.
Si je reprends la formule de l'écart-type ça nous donne ça :
1/20*(30-33.05)2+(35-33.05)2...+(a-33.05)2+(b-33.05)2+(c-33.05)2+(d-33.05)2=8,941182072

Du coup, je bloque à cette étape pour simplifier cette équation de l'écart-type.

Je suis désolé pour l'écriture des équations, j'ai du mal avec le forum, je ne sais pas utiliser les signes. Du coup, il y a peut-être des erreurs sur la formulation.

Encore merci de ton aide

Posté par
carpediem
re : Statistique - Estimation des valeurs d'une série 29-11-19 à 21:22

déjà élève au carré pour te simplifier la vie et te débarrasser de cette racine carrée

ensuite tu devrais ordonner la série des ages que tu connais pour y voir plus clair ....

Posté par
foxhound92
re : Statistique - Estimation des valeurs d'une série 30-11-19 à 15:54

Du coup, comme tu m'as indiqué j'ai élevé au carré pour me débarasser de la racine. Je fais également passer la fraction 1/20 de l'autre côté et j'obtient ceci :

1355,54+(a-33.05)2+(b-33.05)2+(c-33.05)2+(d-33.05)2=1598,894737

1355,54 correspond au carré de la somme des écarts des valeurs connues à la moyenne.
1598,894737 c'est l'écart type au carré multiplié par 20.

Je fais passer les constantes d'un côté pour obtenir ceci :
(a-33.05)2+(b-33.05)2+(c-33.05)2+(d-33.05)2=243,354736893085

Ensuite, j'ai essayé de ramplacer le membre d'une equation par un autre en utilisant la première équation :

Par exemple b=661-523-a-c-d=138-a-c-d

Mais là je suis complètement bloqué. Comme j'ai des expressions que je ne reconnais pas, je n'arrive pas à développer.

Est-ce que tu pourrais m'aider ?

Posté par
carpediem
re : Statistique - Estimation des valeurs d'une série 30-11-19 à 16:42

oui c'est l'idée

mais puisque tu as deux équations et quatre inconnues tu peux exprimer l'une des inconnues par exemple d en fonction des trois autres grace à la première équation :

d = 138 - a - b - c

que tu remplaces dans la deuxième équation ...

et maintenant tu as une infinité de solutions :

(a - 33,05)^2 + (b - 33,05)^2 + (c - 33,05)^2 + (124,95 - a - b - c)^2 = 243, 35 ...

tu choisis pour a et b des valeur quelconques .... ou presque puisque tu as une somme de carrés donc de nombres positifs de somme 243, ... et il te reste une inconnue c dans une équation du second degré ...

Posté par
foxhound92
re : Statistique - Estimation des valeurs d'une série 01-12-19 à 17:41

Je vois, je suis obligé de choisir 2 valeurs pour a et b.

Je pensais qu'on pouvait trouver les 4 valeurs  sans avoir à en choisir deux au hasard.

Posté par
ty59847
re : Statistique - Estimation des valeurs d'une série 01-12-19 à 17:53

Quand tu as autant d'équations que d'inconnues, et que tu cherches des Réels, il y a en principe une seule solution.
Quand tu as moins d'équations que d'inconnues, et que tu cherches des réels, il y a en principe une infinité de solution.
Mais ici, tu cherches des entiers. Et ça, ça peut te sauver.
Quand tu vas choisir arbitrairement des valeurs entières pour a et b, il y a toutes les chances que c et d ne soient pas entiers. Et il va y avoir très peu de combinaisons qui donnent le résultat voulu, avec (a,b,c,d) entiers tous les 4.

Mais la démarche reste la même. Tu choisis a et b, puis tu calcules c et d. Et tu retiens la solution uniquement si c et d sont entiers.

Posté par
carpediem
re : Statistique - Estimation des valeurs d'une série 01-12-19 à 17:59

ensuite il faut réfléchir ...

carpediem @ 29-11-2019 à 21:22


ensuite tu devrais ordonner la série des ages que tu connais pour y voir plus clair ....
et y intercaler la moyenne ... pour voir apparaître une contrainte supplémentaire sur a, b, c et d ...

enfin à voir ...

Posté par
ty59847
re : Statistique - Estimation des valeurs d'une série 01-12-19 à 18:18

Après tâtonnements : 25,33,39,41.  Et c'est certainement la seule combinaison.

Posté par
alb12
re : Statistique - Estimation des valeurs d'une série 01-12-19 à 21:48

salut,
Plus simple
envoyer un mail aux 20 salaries pour leur demander leur age

Posté par
foxhound92
re : Statistique - Estimation des valeurs d'une série 02-12-19 à 12:05

ty59847 @ 01-12-2019 à 18:18

Après tâtonnements : 25,33,39,41.  Et c'est certainement la seule combinaison.


C'est exactement ça !!!!

Mais du coup, est-ce que c'est possible que tu m'expliques la démarche, c'est à dire : après tâtonnements ?

Ce que tu as trouvé est juste impressionnant, s'il existe une solution qui permet de retrouver à chaque fois les résultats entiers qui permettent de retomber sur la moyenne et l'écart-type, ça serait énorme.

Posté par
carpediem
re : Statistique - Estimation des valeurs d'une série 02-12-19 à 12:07

la méthode : un algo et tester : principe du tâtonnement bourrin ... mais codifié en algo ...

Posté par
foxhound92
re : Statistique - Estimation des valeurs d'une série 02-12-19 à 17:15

Je ne suis même pas sur de savoir résoudre l'équation en prenant les 2 valeurs que tu as trouvé.

Posté par
alb12
re : Statistique - Estimation des valeurs d'une série 02-12-19 à 18:51

salut,
pour la serie
[30,35,32,31,18,25,29,50,36,44,32,26,20,24,46,45,25,33,39,41.0]
il me semble que l'ecart-type est
8.71478628539
c'est l'ecart-type estime qui vaut
8.94118207186

Posté par
alb12
re : Statistique - Estimation des valeurs d'une série 02-12-19 à 21:16

il me semble que le pb a au moins 4 solutions


 \\ \begin{array}{cccc}
 \\ 24 & 36 & 38 & 40 \\
 \\ 25 & 33 & 39 & 41 \\
 \\ 28 & 30 & 36 & 44 \\
 \\ 29 & 31 & 33 & 45
 \\ \end{array}
 \\

Posté par
ty59847
re : Statistique - Estimation des valeurs d'une série 03-12-19 à 00:18

Je pensais vraiment que ce serait la seule solution ... planté !
Comment on tâtonne.
Il faut un tableur, sinon, c'est très vite pénible.
On met les 20 valeurs (les 16 connues, + 4 plus ou moins au hasard) et on met 2 formules, une qui calcule la moyenne et l'autre qui calcule l'écart-type.
Faire en sorte que la moyenne tombe juste, c'est très facile.
Pour faire en sorte que l'ecart-type tombe juste, on tâtonne. Si on a un écart-type trop faible, on diminue de 1 une des valeurs 'petites' et on augmente de 1 une des grandes valeurs. et si on a un écart-type trop grand, on fait l'inverse.
On trouve très vite une solution, s'il y en a une.
Mais , l'expérience l'a prouvé, on n'a aucune certitude sur le fait que cette solution soit la seule ou non.
alb12 a très certainement utilisé des moyens plus systématiques pour trouver ses 4 solutions. Au lieu de prendre 10 minutes, avec du tâtonnement, ça lui a pris 15 minutes pour avoir toutes les combinaisons.

Posté par
alb12
re : Statistique - Estimation des valeurs d'une série 03-12-19 à 08:54

j'ai simplement recherche les quadruplets (a,b,c,d) verifiant par exemple 20<=a<=b<=c<=d<=70
Ici avec une fonction en Xcas et en français.


fonction Resolution()
  local L,a,b,c,d,D,m,s;
  L:=[]; 
  pour a de 20 jusque 70 faire
    pour b de a jusque 70 faire
      pour c de b jusque 70 faire
        pour d de c jusque 70 faire
          D:=[30.0,35,32,31,18,25,29,50,36,44,32,26,20,24,46,45,a,b,c,d];
          m:=moyenne(D);
          s:=ecart_type_population(D);
          si m==33.05 et abs(s-8.941182072)<=10^-9 alors
            L.append([a,b,c,d]);
          fsi
        fpour
      fpour
    fpour
  fpour
  retourne L
ffonction:;

Posté par
foxhound92
re : Statistique - Estimation des valeurs d'une série 03-12-19 à 11:18

Oulala je suis perdu par rapport à la programmation.

Dans un premier temps, il faut que j'arrive à résoudre à la main la deuxième équation (celle de l'écart-type) en prenant deux valeurs qu'on vous avez trouvé.

Par exemple :
a= 25 et b=33
Si je remplace ces valeurs dans la 2ème équation, j'obtiens ceci :
(29-33.05)2+(33-33.05)2+(c-33.05)2+(124,95-25-33-c)2 = 243,35

En calculant avec les valeurs ça me donne : 64.8025+0.0025+(c-33.05)2+(66,95-c)2=243,35

Ensuite je pense que je dois me louper quelques part, ça remonte à longtemps pour moi la résolution d'équation. Je dois utiliser les identités remarquables (a-b)2 pour développer les 2 termes (c-33.05)2+(66,95-c)2  ?

Merci pour votre aide, et désolé de vous embêter par rapport à une résolution d'équation qui doit être simple pour vous.

Posté par
alb12
re : Statistique - Estimation des valeurs d'une série 03-12-19 à 11:38

Franchement en post bac on a mieux à faire que resoudre des equations du second degre
Par exemple apprendre les bases de la programmation.
La fonction que j'ai donnee au dessus est du niveau seconde/premiere.

Posté par
foxhound92
re : Statistique - Estimation des valeurs d'une série 04-12-19 à 11:41

Vraisemblablement  je n'y arrive pas à résoudre l'équation et ce malgré le fait de prendre 2 valeurs pour a et b.

Posté par
alb12
re : Statistique - Estimation des valeurs d'une série 04-12-19 à 13:11

alb12 @ 02-12-2019 à 18:51

salut,
pour la serie
[30,35,32,31,18,25,29,50,36,44,32,26,20,24,46,45,25,33,39,41.0]
il me semble que l'ecart-type est
8.71478628539
c'est l'ecart-type estime qui vaut
8.94118207186

Posté par
foxhound92
re : Statistique - Estimation des valeurs d'une série 04-12-19 à 17:12

C'est un problème de résolution que je rencontre.

Que ce soit en prenant en compte l'écart type ou l'écart type estimé, je n'arrive pas à développer correctement les termes de l'équation.

Posté par
alb12
re : Statistique - Estimation des valeurs d'une série 07-12-19 à 15:40

Desole pour le retard
avec a=25 et b=33 la moyenne est (c+d+581.0)/20
si cette moyenne est egale à 33.05 alors d=80-c
Commence par corriger cette erreur.

Posté par
foxhound92
re : Statistique - Estimation des valeurs d'une série 09-12-19 à 14:24

Reprenons du coup, effectivement il y a des erreurs par rapport à ce que j'avais écrit.

Du coup,
Pour a = 25 et b =33
d = 138-25-33 = 80

Ensuite, j'avais écrit ceci
(29-33.05)2+(33-33.05)2+(c-33.05)2+(124,95-25-33-c-33,05)2 = 243,35....
D'ailleurs ce n'est pas 29 mais 25 donc je corrige,

(25-33.05)2+(33-33.05)2+(c-33.05)2+(138-25-33-c-33,05)2 = 243,35...

Je devrais obtenir :
64.8025+0.0025+(c-33.05)2+(46,95-c)2=243,35

64.805  +  c2 - 66.1c + 33.052 + 46,952 - 93,9c + c2 = 243,35....

Est-ce que c'est de cette façon qu'on développe ?

Merci de ton aide

Posté par
carpediem
re : Statistique - Estimation des valeurs d'une série 09-12-19 à 15:00

oui ...

Posté par
alb12
re : Statistique - Estimation des valeurs d'une série 09-12-19 à 15:06

je resous ton equation avec Xcas:
solve(64.8025+0.0025+(c-33.05)^2+(46.95-c)^2=243.35,c)
j'obtiens
list[33.5992187977,46.4007812023]
donc tu as encore au moins une erreur dans ton equation

Posté par
foxhound92
re : Statistique - Estimation des valeurs d'une série 10-12-19 à 11:17

J'obtiens cette équation :

2c2-160c+3118.05526

Je trouve 2 solutions pour c mais ce ne sont pas des valeurs entières.

Ça parait simple et pourtant je n'arrive pas à résoudre cette équation.

Posté par
alb12
re : Statistique - Estimation des valeurs d'une série 10-12-19 à 11:23

les solutions de cette equation sont list[33.5990336667,46.4009663333]
donc cette equation n'est pas la bonne inutile de chercher à la resoudre

Posté par
alb12
re : Statistique - Estimation des valeurs d'une série 10-12-19 à 11:24

detaille comment tu arrives à cette equation sinon on ne trouvera pas l'erreur

Posté par
foxhound92
re : Statistique - Estimation des valeurs d'une série 10-12-19 à 12:58

Voilà mon calcul :

Equation 1 :
a=25 et b = 33
donc d = 138-25-33-c = 80-c

Equation 2 :
Je connais 18 valeurs dont je calcule l'écart à la moyenne élevé au carré.
(30-33.05)2+(35-33.05)2+(32-33.05)2....+(25-33.05)2+(33-33.05)2=1420,345

Il me reste les deux membres à développer :
(c-33.05)2+(80-c-33.05)2

En développant j'obtiens ceci :


c2 - 66.1c + 1092.3025 + 2204.3025 - 93.9c + c2

Je regroupe les termes :
2c2 - 160c + 3296.605

Je rajoute la somme des écarts de tout à l'heure :
2c2 - 160c + 3296.605 + 1420.345

Et il me reste la partie avec l'écart-type qui est à l'origine de l'équation ce qui donne :
2c2 - 160c + 3296.605 + 1420.345 = 8,9411820722*20

Pour au final obtenir :
2c2 - 160c + 3296.605 + 1420.345 - 1598.89474 = 0

2c2 - 160c + 3118.05526 = 0

Posté par
alb12
re : Statistique - Estimation des valeurs d'une série 10-12-19 à 13:37

Excellent ! Tres bien !
On va pouvoir conclure
Attention: il ne faut pas multiplier par 20 mais par 19 car c'est l'ecart-type estime qui est donne dans l'enonce
Le reste me semble juste.
Encore un petit effort

Posté par
foxhound92
re : Statistique - Estimation des valeurs d'une série 10-12-19 à 14:59

En effet ça change tout. Je prenais l'écart-type de la population au lieu de l'écart type estimé.

Donc ça me donne l'équation finale :
2c2 - 160c + 3198 = 0

Et j'obtiens 2 valeurs possibles 41 et 39.

Je retrouve bien le résultat voulu.

Ce qui me reste à faire, c'est d'essayer de programmer la résolution avec excel VBA (par exemple).

Dans ton programme, tu as encadré les valeurs de a,b,c,d entre 20 et 70.  
Qu'est ce qui t'a permis de prendre ces bornes ?

Encore merci pour ton aide.

Posté par
carpediem
re : Statistique - Estimation des valeurs d'une série 10-12-19 à 15:30

en tout cas c'est totalement stupide de prendre un écart type estimé d'une population de 20 employés dans la statistique est mené sur les 20 employés

c'est un autre pb  que d'une population de taille N on extrait un échantillon de taille n dont une statistique donne une moyenne  et un écart type m et s et qu'on veuille faire une estimation sur la population totale ...



et à tout le moins ça devrait être précisé dans l'énoncé ...

Posté par
alb12
re : Statistique - Estimation des valeurs d'une série 10-12-19 à 16:42

j'ai pris 20 et 70 pour tenir compte de la reforme de la retraite

Posté par
carpediem
re : Statistique - Estimation des valeurs d'une série 10-12-19 à 16:54

Posté par
carpediem
re : Statistique - Estimation des valeurs d'une série 10-12-19 à 17:00

carpediem @ 30-11-2019 à 16:42

et maintenant tu as une infinité de solutions :

(a - 33,05)^2 + (b - 33,05)^2 + (c - 33,05)^2 + (124,95 - a - b - c)^2 = 243, 35 ...

tu choisis pour a et b des valeur quelconques .... ou presque puisque tu as une somme de carrés donc de nombres positifs de somme 243, ... et il te reste une inconnue c dans une équation du second degré ...
une remarque : la formule de Koenig eut été plus performante car elle impose de visu la condition sur deux des valeurs bien plus efficacement ...



Vous devez être membre accéder à ce service...

Pas encore inscrit ?

1 compte par personne, multi-compte interdit !

Ou identifiez-vous :


Rester sur la page

Inscription gratuite

Fiches en rapport

parmi 1675 fiches de maths

Désolé, votre version d'Internet Explorer est plus que périmée ! Merci de le mettre à jour ou de télécharger Firefox ou Google Chrome pour utiliser le site. Votre ordinateur vous remerciera !