Inscription / Connexion Nouveau Sujet
Niveau Prepa intégrée
Partager :

Statistiques

Posté par
luciedu87
27-12-23 à 00:04

Bonjour,

Dans mon module de maths, j'en suis au chapitre des statistiques. Ma prof m'a donnée cet exercice, je dois faire cet exercice pendant les vacances, et j'ai un peu de mal. J'ai recopié l'exercice tout en bas.

Pour la Q1, je propose ça :
H0 : les 12 paquets ont un poids inférieur ou égal à 250 grammes.
H1 : les 12 paquets prélevés ont un poids strictement supérieur à 250 grammes.

Est-ce que ce sont les bonnes hypothèses ? Comment trouver ensuite la statistique de test ? Merci bien !

Voici l'exercice :

Sur une chaine de remplissage de paquets de beurre de 250 grammes, on contrôle tous les jours la contenance en prélevant 12 paquets au hasard. Lorsqu'il y a un dérèglement, la contenance est supérieure à 250 grammes. On suppose que la contenance d'un paquet pris au hasard suit une loi normale N (µ, σ2) de moyenne et variance inconnues. On rappelle que pour une variable aléatoire X qui suit une loi géométrique de paramètre p, on a :
P(X = k) = (1 − p)k−1p et E(X) = 1/p.

1. Ecrire les hypothèses, la statistique de test et la zone de rejet d'un test pour vérifier s'il n'y a pas dérèglement. En déduire une valeur seuil s pour la moyenne des 12 paquets au dessus de laquelle on pourra affirmer avec un risque de première espèce α que la machine remplit trop les paquets.

2. Un jour donné, la moyenne empirique des 12 paquets est égale à 251.5g et l'écart-type empirique est égal à 5g. Peut-on en conclure que la chaine est déréglée pour un risque de première espèce α = 0.05 ?

3. Soit N la variable aléatoire qui représente le nombre de jours écoulés avant de détecter une valeur moyenne sur les 12 paquets supérieure au seuil, alors que la machine n'est pas déréglée. Donner la loi de N en fonction de α. Quelle doit être la valeur de α pour qu'on ait, en moyenne, une fausse alerte par trimestre (91 jours) ?

Posté par
luciedu87
re : Statistiques 28-12-23 à 20:45

bonsoir

personne ne peut m'aider ?

Posté par
phyelec78
re : Statistiques 28-12-23 à 21:16

Bonjour,

je pense qu 'il faut mettre :

H0 : les 12 paquets ont un poids moyen inférieur ou égal à 250 grammes.
H1 : les 12 paquets prélevés ont un poids  s moyen strictement supérieur à 250 grammes.

Posté par
luciedu87
re : Statistiques 28-12-23 à 21:32

d'accord, merci

et comment trouver la statistique de test ?

Posté par
phyelec78
re : Statistiques 28-12-23 à 21:41

Je pense que vous avez des éléments dans votre cours, sinon regardez ce lien  pour vous donner des idées.

https://www.iedunote.com/fr/tests-dhypotheses

Posté par
luciedu87
re : Statistiques 28-12-23 à 22:02

oui, j'ai vu ça, mais ce que je comprends pas c'est qu'ils nous parlent de loi normale et de loi géométrique dans l'énoncé

donc quelle statistique utiliser ? Normale ou géométrique ?

Posté par
phyelec78
re : Statistiques 28-12-23 à 23:06

Sauf erreur de ma part :

Je pense, que les aspects loi  Normale ou géométrique  n'interviennent pas dans la réponse à la question 1)

Pour la question 2 ,il faut utiliser la loi normale : selon l'énoncé la loi normale est pour le poids du beurre ,les valeurs de la moyenne et écart-type sont fournies dans la question 2)

Pour la question 3) il faut utiliser la loi géométrique avec k=91.

Posté par
luciedu87
re : Statistiques 29-12-23 à 00:54

ok merci, je vais continuer d'étudier les questions 2 et 3.

Par contre comment terminer la question 1 ?

Posté par
verdurin
re : Statistiques 29-12-23 à 18:47

Bonsoir,
je ne suis pas d'accord sur les hypothèses du test : elles portent évidement sur la moyenne inconnue de l'ensemble de la production un jour donné.
En principe dans ce type de cas on utilise un test de Student, mais si tu ne connais pas ce test on peut faire un test avec une loi normale en utilisant l'écart-type empirique.

Posté par
luciedu87
re : Statistiques 30-12-23 à 11:53

bonjour @verdurin,

merci de la réponse

alors quelles sont les hypothèses H0 et H1, vu que celles que j'ai proposées sont incorrectes ?

Posté par
verdurin
re : Statistiques 30-12-23 à 18:18

Bonsoir luciedu87.
Je proposerais
H0 : la valeur de est égale à 250g ;
H1 : la valeur de est strictement supérieure à 250g.

On va rejeter l'hypothèse nulle si la moyenne de l'échantillon ( c'est la statistique du test ) est « significativement » plus grande que 250.
En supposant que l'on fasse le test en utilisant la loi normale, ce qui n'est pas vraiment juste mais courant, on rejette H0 si la moyenne observée est plus grande que 250+t_\alpha\times \frac{s}{\sqrt{12}} ou s est l'écart-type empirique et t_\alpha la valeur vérifiant \text{P}(T>t_\alpha)=\alpha où T est une variable aléatoire suivant la loi normale centrée réduite.

Posté par
luciedu87
re : Statistiques 30-12-23 à 19:16

merci de votre réponse, cela commence à s'éclaircir.

J'ai 3 questions :

1. Pourquoi ne pouvait-on pas mettre ce que phyelec78 proposait dans ce message pour les hypothèses ?

phyelec78 @ 28-12-2023 à 21:16

Bonjour,

je pense qu 'il faut mettre :

H0 : les 12 paquets ont un poids moyen inférieur ou égal à 250 grammes.
H1 : les 12 paquets prélevés ont un poids  s moyen strictement supérieur à 250 grammes.


2. Pour terminer correctement la première question de l'exercice, et avec votre aide expliquée à 18h18, la prochaine étape est de déterminer la valeur de t_alpha ? Ou la "valeur seuil s pour la moyenne des 12 paquets au dessus de laquelle on pourra affirmer avec un risque de première espèce α que la machine remplit trop les paquets." ?

3. Aussi, quelle est la zone de rejet du test ? C'est ce que vous avez écrit  18h18 ?

merci beaucoup de votre aide, c'est très utile pour moi (et précieux !)

Posté par
verdurin
re : Statistiques 30-12-23 à 19:47

Pour la première question :
ce que propose phyelec78 n'a rien d'un test, on prend douze plaquettes et on regarde leur masse moyenne, il n'y a aucune trace de conclusion sur ce qui est important à savoir la masse moyenne des plaquettes dans la production.

Pour prendre un exemple limite : on prend une plaquette, elle pèse 251g. Que peut-on en conclure de plus que le fait qu'une plaquette pèse plus de 250g ?

Posté par
luciedu87
re : Statistiques 30-12-23 à 21:27

Merci de votre réponse c'est beaucoup plus clair.

Et pour la deuxième question que j'avais posée dans mon message de 19h16 ?

Posté par
verdurin
re : Statistiques 30-12-23 à 22:13

J'ai donné la réponse à 18h18.
Au passage il n'y a pas de différence entre tes questions 2 et 3.

Posté par
luciedu87
re : Statistiques 31-12-23 à 10:09

D'accord, merci beaucoup

Donc on est d'accord que la question 1 est terminée ?

Auriez-vous une piste pour la question 2 de lexo ?

Merci, bonne journée

Posté par
verdurin
re : Statistiques 31-12-23 à 10:20

La question 2 est une application numérique du résultat de la question 1.

Posté par
luciedu87
re : Statistiques 31-12-23 à 11:23

Effectivement, on a s=251,5 grammes. C'est bien ça ?

Par contre comment déterminer la valeur de t alpha ?

Posté par
verdurin
re : Statistiques 31-12-23 à 11:45

Citation :
on rejette H0 si la moyenne observée est plus grande que 250+t_\alpha\times \frac{s}{\sqrt{12}}s est l'écart-type empirique


Ici la moyenne observée est 251,5g et l'écart-type empirique 5g on a donc s=5.
Pour la valeur de t on prend une table de la loi normale ou un instrument de calcul donnant la fonction quantile de la loi normale.

Posté par
luciedu87
re : Statistiques 31-12-23 à 17:28

Top, merci de votre réponse

J'ai regardé un tableau de la loi normale mais je ne suis pas bien sûre : on prend dans la colonne 0,05 car c'est le alpha donné, mais dans quelle ligne regarder ?

Bonne soirée. Bon réveillon

Posté par
alb12
re : Statistiques 31-12-23 à 18:21

Salut,
Voici un programme Xcas qui permet soit de construire ce type de test soit de vérifier ses calculs.
N'hésitez pas à critiquer :=).


//n:taille échantillon;alpha:risque;hypothèse nulle:la moyenne de la population est égale à m0;
//sconnu=1 si écart-type population connu, 0 sinon (cas général)
//bilat=1 pour un test bilatéral et 0 pour un test unilatéral
//renvoie 0 si rejet, 1 sinon
  
ConformiteMoyenne(mu,sigma,n,alpha,m0,sconnu,bilat):={
  local E,Uobs,Uth;
  si sconnu==1 alors
    E:=sigma
  sinon
    E:=sigma*sqrt(n/(n-1))
  fsi;
  Uobs:=evalf(abs(mu-m0)/E*sqrt(n));
  si n>30 ou (n<30 et sconnu==1) alors
    si bilat==1 alors
      Uth:=normal_icdf(1-alpha/2);
    sinon
      Uth:=normal_icdf(1-alpha);
    fsi
  sinon
    si bilat==1 alors
      Uth:=student_icdf(n-1,1-alpha/2);
    sinon
      Uth:=student_icdf(n-1,1-alpha);
    fsi
  fsi
  afficher("Uobs="+Uobs+" et Uth="+Uth);
  si Uobs>Uth alors
    afficher("Au risque "+(alpha)+", on rejette l'hypothèse H0");
    retourne 0
  sinon
    afficher("Au risque "+(alpha)+", on ne rejette pas l'hypothèse H0");
    retourne 1
  fsi
}
:;

Pour ma part la commande:

ConformiteMoyenne(251.5,5,12,0.05,250,0,0)

renvoie:
Uobs=0.99499 et Uth=1.7959
Au risque 0.05, on ne rejette pas l'hypothèse H0


Pouvez-vous con(in)firmer cette conclusion ?

Posté par
alb12
re : Statistiques 31-12-23 à 18:23

oups remplacer renvoie par affiche

Posté par
luciedu87
re : Statistiques 01-01-24 à 16:36

Je ne comprends pas grand chose à ce qu'a écrit alb12...

Verdurin, pourriez-vous répondre à cette question :

Citation :
on prend dans la colonne 0,05 car c'est le alpha donné, mais dans quelle ligne regarder


Merci, bonne année.

Posté par
verdurin
re : Statistiques 01-01-24 à 17:57

Bonsoir et bonne année à tous.

À luciedu87,
il faut apprendre à lire la table, j'espère que tu as, ou que tu auras très vite, un cours sur le sujet.

Très rapidement : en général les tables donnent la probabilité de Tt avec T qui suit une loi normale centée réduite.
On veut trouver t tel que P(T>t)=0,05 c'est à dire tel que P(Tt)=0,95.
Il faut donc trouver la valeur 0,95 dans les valeurs de la table.
Voici une image d'un morceau de la table du modèle courant :
Statistiques
On lit à l'intersection de la ligne 1,5 et de la colonne 0,08 que P(T1,58)0,9429.

On voudrait avoir 0,95 et on regarde les deux cases que j'ai surligné.
On voit que P(T1,64)0,9495 et que P(T1,65)0,9505. On prend t « au milieu » soit t[sub]1,645.

Si tu veux plus de précision, ou pour faire d'autres calculs, tu peux utiliser Xcas en ligne , voir même le télécharger.
En ligne il suffit d'ouvrir la console et de taper normal_icdf(0.95).

À alb12 : je te répond dans le message suivant.

Posté par
verdurin
re : Statistiques 01-01-24 à 18:14

Concernant le programme donné par alb12 je ne l'utiliserait pas.
Il y a trop de paramètres alors qu'un calcul direct est finalement très simple. Mais je suis assez admiratif car écrire ce genre de choses dépasse ma résistance au stress.
Un petit défaut quand même : il y a deux test unilatéraux possibles et le programme n'en propose qu'un.

Posté par
luciedu87
re : Statistiques 01-01-24 à 20:50

Merci beaucoup verdurin pour vos explications, la question 2 est maintenant beaucoup plus claire. Je vais la rédiger entièrement et vous proposer une résolution rédigée demain ou ce soir

Pour la question 3, auriez-vous une piste pour la débuter ? Que signifie "Donner la loi de N en fonction de alpha" ?

Posté par
alb12
re : Statistiques 01-01-24 à 22:39

Merci pour les retours

1/ Xcas en ligne est obsolète, il faut utiliser Xcas web

2/ En 2023 utiliser des tables statistiques me paraît anachronique.

3/ Pour un échantillon de taille 12, je pense qu'il faut utiliser la variable de Student à 11 ddl

4/ Pour mu>250 je n'envisage qu'un seul test unilatéral H0:m=250 contre H1:m>250 mais j'ai peut-être tort.

5/ Du point de vue pédagogique tu as raison la notion de zone de rejet est plus pertinente que mon algorithme. Mais il permet aux étudiants de vérifier leurs rédactions.

Posté par
luciedu87
re : Statistiques 03-01-24 à 00:27

Merci beaucoup pour ces précisions alb12.

Verdurin, pourriez-vous m'aider pour la question 3 svp ? Comment la commencer ? J'ai besoin d'une piste, d'une idée pour répondre à la question posée....

Merci bien

Posté par
verdurin
re : Statistiques 03-01-24 à 16:10

À luciedu87.
Pour la troisième question on fait des tests que l'on peut raisonnablement supposer indépendants.
Pour chaque test on a une probabilité d'avoir une moyenne plus grande que le seuil de rejet alors que la machine n'est pas déréglée. C'est la définition du risque de première espèce.
On se demande quelle est la loi de la première apparition d'un événement de probabilité en faisant des essais successifs indépendants. C'est la définition d'une loi . . .
( indication : elle est nommée dans l'énoncé )


À alb12.
—1. Merci pour le lien vers Xcas web. Personnellement j'utilise Xcas en local, mais c'est bien de pouvoir donner un lien efficace.
—2. Sans doute mais luciedu87 semble devoir utiliser une table.
—3. Je suis de ton avis ( cf mon premier message ). Encore faut-il avoir entendu parler du test de Student.

Posté par
luciedu87
re : Statistiques 03-01-24 à 17:57

Merci verdurin de votre réponse.

Je comprends mieux l'objectif de la question 3. Mais concrètement, que faut-il faire ? On utilise le logiciel R pour faire les différents tests ? Ou peut-on faire un test à la main ?

Merci !

Posté par
verdurin
re : Statistiques 03-01-24 à 18:50

Il n'y a aucun test à faire pour la question 3.
Je crois que la réponse attendue est : « pour avoir en moyenne un faux positif sur nonante et un jours il faut que l'espérance de N soit nonante et un ». C'est à dire =1/91 en utilisant les formules données.
Ça marche car le nombre de faux positifs suit une loi binomiale de paramètres 91 et dont l'espérance est 91. Ce qui donne le même résultat.

Si tu utilises R tu peux utiliser la fonction qnorm() pour obtenir les t.

Posté par
luciedu87
re : Statistiques 03-01-24 à 23:41

Merci de la réponse.

Pardon, mais autant j'avais très bien compris grâce à vous les questions 1 et 2, autant la question 3 ce n'est pas encore ça...

Pourriez-vous reformuler la réponse à la question 3 svp ?

Merci !

Posté par
verdurin
re : Statistiques 04-01-24 à 19:28

Citation :
Soit N la variable aléatoire qui représente le nombre de jours écoulés avant de détecter une valeur moyenne sur les 12 paquets supérieure au seuil, alors que la machine n'est pas déréglée.

On fait des essais successifs et indépendants jusqu'à obtenir un événement ( ce que j'ai mis en vert ) de probabilité constante.

C'est la définition d'une loi géométrique . Comme indiqué dans l'article en lien il y a deux choix possibles pour la loi. Compte tenu des formules rappelées dans l'énoncé il me semble que l'on doit compter le jour où l'événement se produit.

L'événement en question « détecter une valeur moyenne sur les 12 paquets supérieure au seuil, alors que la machine n'est pas déréglée »  est la réalisation du risque de première espèce et, par définition, sa probabilité est égale à .

Posté par
luciedu87
re : Statistiques 04-01-24 à 20:26

Merci beaucoup c'est bien plus clair

Mais que doit-on répondre à la question "Donner la loi de N en fonction de α." dans la Q3 ?

C'est ça que je ne comprends pas vraiment...

Posté par
verdurin
re : Statistiques 04-01-24 à 21:25

Je t'ai dit que N suit une loi géométrique.
Cette loi a un paramètre qui est la probabilité de l'événement que l'on attend.
Ici cet événement est :  détecter une valeur moyenne sur les 12 paquets supérieure au seuil, alors que la machine n'est pas déréglée.
J'ai dèja donné la probabilité de cet événement mais tu peux aussi réfléchir.

Posté par
luciedu87
re : Statistiques 17-01-24 à 00:37

Bonjour,

je reviens sur cet exercice car je ne suis pas sûre de ma réponse pour la question 3.

En effet, une camarade de classe a dit que comme on était en présence de la loi géométrique, l'espérance de N était de 91, c'est-à-dire que \frac{1}{p}=91, et donc que \frac{1}{1-\alpha }=91. Soit alors : \alpha = 1 - \frac{1}{91}.

Qu'est-ce que vous en pensez ? Est-ce que notre résultat est faux (on avait alpha = 1/91) ? Ou est-ce que ma camarade de classe a faux ?

merci bien

Posté par
luciedu87
re : Statistiques 24-01-24 à 00:10

bonjour et navrée de revenir sur ce sujet, mais je ne sais toujours pas :

Est-ce que E(N)=1/α ou E(N)=1/(1-α) ?
Dans ma classe, les résultats sont partagés entre ces deux réponses...

Alors qu'est-ce qui est correct ? Et pourquoi ?

merci bien

Posté par
verdurin
re : Statistiques 25-01-24 à 06:58

Bonjour,
l'énoncé précise bien que est le seuil de risque de première espèce. C'est à dire la probabilité d'avoir un faux positif.
Je crois qu'il y a, dans votre classe, une confusion entre seuil de risque et seuil de confiance.

En écrivant p=\frac1{1-\alpha} on fait comme si on s'intéressait à l'événement « détecter une valeur moyenne sur les 12 paquets supérieure inférieure au seuil, alors que la machine n'est pas déréglée ».
En faisant ce calcul on trouve un seuil de risque d'environ 99% et personne ne veut rejeter H0 à tort dans 99% des cas.



Vous devez être membre accéder à ce service...

Pas encore inscrit ?

1 compte par personne, multi-compte interdit !

Ou identifiez-vous :


Rester sur la page

Inscription gratuite

Fiches en rapport

parmi 1701 fiches de maths

Désolé, votre version d'Internet Explorer est plus que périmée ! Merci de le mettre à jour ou de télécharger Firefox ou Google Chrome pour utiliser le site. Votre ordinateur vous remerciera !