Bonjour,
Ma question concerne la formule de l'écart type :
J'ai cru pendant longtemps que l'ecart type en statistique mesurait l'écart moyen entre une valeur de la série et la moyenne de cette série.
Or, cela est faux, le résultat en est proche mais différent, on peut le constater sur une série de 5 valeurs prises au hasard.
Existe-t-il un indicateur en statistique qui mesure effectivement l'écrat moyen entre une valeur prise au hasard et la moyenne ?
Pourquoi cet indicateur n'est il pas enseigné, vu qu'il parait plus intuitif que l'écart type?
Merci d'avance ! !!
Bonsoir,
Une raison simple:
Il est donc nécessaire d'utiliser soit les carrés ,soit les valeurs absolues,
Alain
Bonsoir Alain,
La question de remil1ben ne le disait pas explicitement, mais elle sous entendait évidemment qu'on considérait la valeur absolue des écarts.
Sa question reste donc extrêmement pertinente.
Bonsoir,
La question du choix de l'écart-type (et de sa mère la variance) comme indicateur de dispersion est une question intéressante et en général négligée dans l'enseignement.
L'indicateur intuitif est effectivement l'écart moyen absolu : moyenne des valeurs absolues des différences entre X et sa moyenne. Il existe donc, et il est parfois enseigné, mais très vite "oublié". Par simplification on peut l'appeler plus simplement "écart-moyen" après avoir précisé sa définition pour éviter de passer pour une andouille auprès des esprits chagrins .
L'écart type et l'écart moyen se ressemblent assez lorsque la dispersion est faible et homogène. Mais dès qu'apparaissent des valeurs extrêmes fortes, l'écart-type va s'enflammer (à cause du carré des écarts qui pondère fortement les écarts élevés).
Il n'y a pas dans l'absolu un indicateur vraiment meilleur qu'un autre. C'est l'usage qu'on en fait qui détermine le choix qui convient.
En Business Intelligence par exemple, l'écart moyen est plus intuitif. Surtout exprimé en valeur relative. Si tu présentes un exposé sur un travail de modélisation, tu pourras être mieux compris si tu parles d'écart relatif ou d'erreur relative, souvent exprimée en pourcentage (d'une référence ou de la moyenne). Exemple : "le modèle commet en moyenne une erreur de 3 points d'indice. Ou encore on observe une erreur moyenne de 8% (sans toujours préciser des pourcentages de quoi du reste...)".
Si les statisticiens ont retenues l'écart-type comme indicateur de référence, c'est que celui-ci a d'autres avantages, dont certains sont incomparables. J'en donnerai deux, mais il y en a d'autres.
Le premier avantage est historique.
SI tu disposes d'une très grande série, de moyenne et de variance déjà calculées, et que tu souhaites y adjoindre un nouvel échantillon, la moyenne de la série étendue est facile à corriger, de même que la variance grâce au théorème de Koenig. En revanche il n'est pas possible de corriger simplement l'écart-moyen : il faut refaire tout le calcul. A l'époque où il n'y avait pas d'ordinateur, ces considérations étaient importantes.
Le deuxième avantage est également "utilitaire", avec beaucoup plus d'importance.
L'écart-type bénéficie de propriétés mathématiques beaucoup plus intéressantes que l'écart moyen. Toute l'inférence statistique repose sur la variance ou l'écart-type. On ne saurait pas faire de théorie des tests sans lui. Pas plus que d'intervalle de confiances pour une prévision issue d'un modèle. C'est probablement cette raison qui a imposé l'écart-type comme incontournable.
Waou, quelle réponse éclairée, Le Dino !
Merci beaucoup pr ts ces éléments, je vais me rencarder sur le théorème de Koenig.
Merci encore et bonne année à tous!
salut,
juste un petit complement tres mal exprime
avec l'ecart absolu moyen on cree des points anguleux (non derivabilite de la valeur absolue)
alors qu'avec les carres des differences c'est derivable partout.
Bon Noel,
Pour suivre l'idée d' alb12, il existe plusieurs manières d'estimer la
dispersion d'une population ou d'un échantillon :étendue avec ou sans extrêmes,EAM,écart type,écart par rapport à la médiane, mais l'écart type lié avec la moyenne est celui qui se prête le mieux aux calculs ,aux développements statistiques (plusieurs variables,calculs complexes) ,aux comparaisons entre populations
et expressions comme formes limites d'autres distributions,
Amicalement,
Alain
Autre avantage décisif de l'écart-type sur l'écart moyen, compréhensible dès la terminale : l'inégalité de Bienaymé Tchebychev.
Implique par exemple que dans un intervalle de plus ou moins 2 sigma autour de la moyenne, on trouvera au moins 75% des valeurs de X, quelle que soit sa loi.
Dans le cas particulier de la loi normale, qui est le confluent de toutes les lois (grâce à la loi des grands nombres, elle même découlant de Bienaymé-Tchebychev, donc de l'écart-type)... c'est un peu plus de 95% des valeurs de X que l'on retrouvera dans ce même intervalle.
L'écart-type qui n'est pas intuitif à la base pour le béotien, le devient fortement pour le statisticien qui raisonne sur les propriétés des distributions...
Effectivement l'article de Wikipédia sur la dispersion résume très bien les choses .
Et je suis également heureux de voir qu'il ne fait pas des manières en parlant clairement d'écart moyen.
Bonsoir, et bonne fêtes à tous.
Il y a une autre raison au choix d'associer moyenne et variance.
Si on considère une suite finie de valeurs il est légitime de chercher une valeur genre moyenne ou médiane ou mode ou ... qui résume la série.
On peut donc chercher la valeur de qui minimise on tombe sur la moyenne mais le minimum est 0, on apprend rien sur la dispersion.
On peut chercher une valeur de qui minimise on arrive alors à la médiane, mais il n'y a pas toujours unicité du minimum.
Et, à ma connaissance, il n'y a pas d'interprétation pour la valeurs du minimum.
On peut chercher une valeur de qui minimise . On trouve par un calcul de dérivé facile, et qu'il est intéressant, à mon avis, de faire faire aux élèves, que le minimum est atteint quand x est la moyenne, et la valeur du minimum est n fois la variance.
On a en plus une interprétation géométrique : on se place dans muni d'une base orthonormal .
La moyenne est alors la projection M du point sur la droite passant par l'origine et de vecteur directeur la variance étant n fois le carré de la distance de X à M.
L'écart-type est alors la distance de X à M en prenant comme unité de longueur la distance de l'origine au point .
Bonjour,
D'une manière générale le calculable est préféré;aussi en physique ,démographie,
économie ont été privilégiées les fonctions lisses ,même lorsque la nature profonde des phénomènes ne le justifie pas (physique quantique,calculs financiers).
L'interprétation géométrique dont parle *Verdurin* bien qu'intéressante n'est qu'une
correspondance ,
Alain
Alain
Salut.
En ce qui concerne l'analogie géométrique, je dirais qu'il s'agit d'une interprétation des données en termes géométriques.
De façon général cette interprétation s'est montrée féconde en statistique à plusieurs variables. Il suffit d'ouvrir un livre de statistiques pour voir un usage intensif de l'algèbre linéaire.
J'ai fait connaissance avec cette interprétation quand j'ai préparé mes premiers cours de statistiques, et elle m'a beaucoup aidée.
Un exemple élémentaire :
Si on considère une série à deux variables on la représente dans l'espace des individus par deux points X et Y que l'on projette sur la première diagonale en et .
La covariance est alors le produit scalaire et le coefficient de corrélation linéaire est le cosinus de l'angle entre ces deux vecteurs.
Dans le même sens : toute l'analyse de données (analyse factorielle, analyse en composantes principales, analyse des correspondances, analyse discriminantes...) repose intuitivement sur l'analogie géométrique et en pratique sur l'algèbre linéaire.
OUI
Dire "Le théorème de Koenig est très "géométrique". ne revient' il pas à reconnaître
une correspondance entre deux domaines distincts et aussi une "structure commune"
et permettant donc déductions et calculs 'communs'.
Notre esprit se réconforte dans les représentations.
Alain
Vous devez être membre accéder à ce service...
Pas encore inscrit ?
1 compte par personne, multi-compte interdit !
Ou identifiez-vous :