Bonjour,
Voici le problème :
J'ai une liste de coordonnées x et y qui ont été mesuré par un instrument 500 fois.
On me demande de trouver la moyenne, et l'erreur-type de x et de y (facile)
On me demande ensuite de trouver le Z-score (coordonée - moyenne / erreur-type) pour chaque coordonées en considérant x et y indépendant l'un de l'autre, et de rejeter les coordonées qui tombent en dehors de 99% de la distribution. Il est précisé de faire attention car en rejetant les coordonées, la moyenne et l'erreur-type changent.
J'ai fait tout cela, mais mon problème est le suivant : Effectivement la moyenne et l'erreur-type changent quand je supprime des coordonées, c'est bien normal, et je ne sais pas si je dois rejeter toutes les coordonées qui tombent en dehors des 99% d'un coup, puis refaire cela avec les nouvelles coordonées qui ne tombaient pas avant dans les 99% mais qui maintenant le sont, du au changement de la moyenne et de l'erreur type, et faire cela jusqu'a ce que plus aucune valeur ne soit dans la zone des 1% a rejeter ? Ou si je devrais rejeter les coordonées une à une, et du coup certaines que j'aurais du rejeter en premier lieu, je ne les rejete plus car la moyenne et l'erreur type ont changé ?
Je peux fournir un doc excel de ce que j'ai fait jusqu'a maintenant et l'énoncé de l'exercice (en anglais) si ce n'est pas clair.
Merci !
Si tu es puriste et que tu as un outil pour faire la calcul automatiquement, il semblerait logique de trier les points selon le Z-score et de commencer par éliminer le point ayant le pire score.
Et tu recommences (y compris recalcul du Z-score), jusqu'à ce que tu aies éliminé 5 points, c'est à dire 1% des 500 points de départ.
Bonjour,
L'énoncé précise bien que il faut rejeter les coordonnées qui tombent en dehors de 99% de la distribution.
Cette marge correspond à une recherche de valeurs fausses, type erreur de recopie.
Mais il est vrai qu'il y a à peu près 4 valeurs pour 1000 qui s'éloignent de cette distribution.
L'énoncé ne dit pas qu'il faut éliminer 1% des valeurs, mais qu'il faut éliminer les points dont une des coordonnées dépasse 99% de la distribution.
Ca m'intéresserait d'avoir le document Excel.
Voici un lien vers mon fichier excel : http://xls.lu/8KPT
et l'énoncé du problème (en anglais) : http://pdf.lu/2ofo
Il était fourni avec l'énoncé les 3 premières colonnes du fichier excel (time, E, N), c'est moi qui ai fait le reste
Merci beaucoup !
J'ai regardé l'énoncé.
Il est bidon.
Je ne te conseille pas de perdre trop de temps la dessus.
Si je dis qu'il est bidon c'est parce qu'il n'est ni scolaire, ni réel.
Dans un exercice "scolaire" bien fait, il n'y aurait pas d'ambiguïté sur ce qu'on attend de toi.
Or tu as judicieusement repéré qu'il y avait une ambiguïté que tu as parfaitement décrite.
Dans un travail réel on ne ferait pas des hypothèses aussi débiles que celles qui sont faites.
On ne peut en même temps prétendre faire un contrôle réel sur des données réelles... et faire des hypothèses a priori sur la distribution.
Sur un cas réel : tu commences par faire un histogramme et tu observes la distribution par toi même.
Donc en résumé, c'est un exercice pour que tu t'entraînes à manipuler des données sous EXCEL et le but est surtout d'apprendre à maîtriser ce que TOI tu estimes juste de faire. Alors fais donc ça : un contrôle qui te semble intelligent.

Raté l'école est en fait une université anglaise
En fait j'ai juste un doute :
J'exclue 8 points après les avoir détécté comme "gross errors". Parfait, je les supprime de ma table excel, mais le problème c'est que la moyenne et la std error changent, et de nouveaux points apparaissent à exclure, alors qu'ils apparaissaient ok avant.
Ma question est donc la suivante : dois-je continuer à exclure aussi les novueaux points qui apparaissent en "gross error" jusqu'a qu'ils soient tous ok ? Ou la réponse au problème est elle seulement de fournir les 8 premiers points à exclure, et s'arréter la ?
Selon toute vraisemblance, les valeurs données dans l'exercice résultent de mesures réelles, et indépendamment de la question posée, c'est une excellente illustration de la théorie des erreurs.
.Vous devez être membre accéder à ce service...
Pas encore inscrit ?
1 compte par personne, multi-compte interdit !
Ou identifiez-vous :