Inscription / Connexion Nouveau Sujet
Niveau enseignement
Partager :

formule de l'acart type

Posté par
remil1ben
24-12-15 à 18:06

Bonjour,
Ma question concerne la formule de l'écart type :
J'ai cru pendant longtemps que l'ecart type en statistique mesurait l'écart moyen entre une valeur de la série et la moyenne de cette série.
Or, cela est faux, le résultat en est proche mais différent, on peut le constater sur une série de 5 valeurs prises au hasard.

Existe-t-il un indicateur en statistique qui mesure effectivement l'écrat moyen entre une valeur prise au hasard et la moyenne ?
Pourquoi cet indicateur n'est il pas enseigné, vu qu'il parait plus intuitif que l'écart type?


Merci d'avance ! !!

Posté par
torio
re : formule de l'acart type 24-12-15 à 18:45



Ecart moyen absolu

Posté par
alainpaul
re : formule de l'acart type 24-12-15 à 18:51

Bonsoir,

Une raison simple:

\sum_1^n( x_i-m )=(\sum_1^n  x_i)- nm=0

Il est donc nécessaire d'utiliser soit les carrés ,soit les valeurs absolues,

Alain

Posté par
LeDino
re : formule de l'acart type 24-12-15 à 19:35

Bonsoir Alain,

La question de  remil1ben  ne le disait pas explicitement, mais elle sous entendait évidemment qu'on considérait la valeur absolue des écarts.
Sa question reste donc extrêmement pertinente.

Posté par
LeDino
re : formule de l'acart type 24-12-15 à 20:09

Bonsoir,

La question du choix de l'écart-type (et de sa mère la variance) comme indicateur de dispersion est une question intéressante et en général négligée dans l'enseignement.

L'indicateur intuitif est effectivement l'écart moyen absolu : moyenne des valeurs absolues des différences entre X et sa moyenne. Il existe donc, et il est parfois enseigné, mais très vite "oublié". Par simplification on peut l'appeler plus simplement "écart-moyen" après avoir précisé sa définition pour éviter de passer pour une andouille auprès des esprits chagrins .

L'écart type et l'écart moyen se ressemblent assez lorsque la dispersion est faible et homogène. Mais dès qu'apparaissent des valeurs extrêmes fortes, l'écart-type va s'enflammer (à cause du carré des écarts qui pondère fortement les écarts élevés).

Il n'y a pas dans l'absolu un indicateur vraiment meilleur qu'un autre. C'est l'usage qu'on en fait qui détermine le choix qui convient.

En Business Intelligence par exemple, l'écart moyen est plus intuitif. Surtout exprimé en valeur relative. Si tu présentes un exposé sur un travail de modélisation, tu pourras être mieux compris si tu parles d'écart relatif ou d'erreur relative, souvent exprimée en pourcentage (d'une référence ou de la moyenne). Exemple : "le modèle commet en moyenne une erreur de 3 points d'indice. Ou encore on observe une erreur moyenne de 8% (sans toujours préciser des pourcentages de quoi du reste...)".

Si les statisticiens ont retenues l'écart-type comme indicateur de référence, c'est que celui-ci a d'autres avantages, dont certains sont incomparables. J'en donnerai deux, mais il y en a d'autres.

Le premier avantage est historique.

SI tu disposes d'une très grande série, de moyenne et de variance déjà calculées, et que tu souhaites y adjoindre un nouvel échantillon, la moyenne de la série étendue est facile à corriger, de même que la variance grâce au théorème de Koenig. En revanche il n'est pas possible de corriger simplement l'écart-moyen : il faut refaire tout le calcul. A l'époque où il n'y avait pas d'ordinateur, ces considérations étaient importantes.

Le deuxième avantage est également "utilitaire", avec beaucoup plus d'importance.

L'écart-type bénéficie de propriétés mathématiques beaucoup plus intéressantes que l'écart moyen. Toute l'inférence statistique repose sur la variance ou l'écart-type. On ne saurait pas faire de théorie des tests sans lui. Pas plus que d'intervalle de confiances pour une prévision issue d'un modèle. C'est probablement cette raison qui a imposé l'écart-type comme incontournable.

Posté par
remil1ben
re : formule de l'acart type 25-12-15 à 10:12

Waou, quelle réponse éclairée, Le Dino  !
Merci beaucoup pr ts ces éléments, je vais me rencarder sur le théorème de Koenig.

Merci encore et bonne année à tous!

Posté par
alb12
re : formule de l'acart type 25-12-15 à 11:28

salut,
juste un petit complement tres mal exprime
avec l'ecart absolu moyen on cree des points anguleux (non derivabilite de la valeur absolue)
alors qu'avec les carres des differences c'est derivable partout.

Posté par
alainpaul
re : formule de l'acart type 25-12-15 à 12:37

Bon Noel,

Pour suivre l'idée d' alb12, il existe plusieurs manières d'estimer la
dispersion d'une population ou d'un échantillon  :étendue avec ou sans extrêmes,EAM,écart type,écart par rapport à la médiane,  mais l'écart type lié  avec  la moyenne est celui qui se prête le mieux aux calculs ,aux développements statistiques (plusieurs variables,calculs complexes) ,aux comparaisons entre populations
et expressions comme formes limites d'autres distributions,

Amicalement,

Alain

Posté par
LeDino
re : formule de l'acart type 25-12-15 à 13:19

Citation :
... je vais me rencarder sur le théorème de Koenig
C'est juste l'équivalent du théorème de Huygens sur l'inertie :  VAR(X) = E(X²) - E(X)²

Si tu passes d'une grande série X (dont tu connais l'effectif N, la moyenne M et la variance V)...
... à une série X' (N', M', V' inconnus) qui inclut X augmenté d'un échantillon dX (n, m, v calculables facilement), alors :
N' = N + n
M' = (N*M + n*m)/N'


E(X²) = V - M²
E(X'²) = V' - M'²  =  Somme des X'² / N'  =  (Somme des X² + Somme des dX²) / N'  =  (N.(V-M²) + n.(v-m²)) / N'
V' = M'² + (N.(V-M²) + n.(v-m²)) / N'

Sauf erreur...
Donc si la série X comprend 10,000 individus et que l'échantillon dX qu'on lui adjoint comprend 100 individus, on calcule juste m et v et on injecte ça dans la formule pour en déduire directement V'.

Il n'y a pas d'équivalent pour l'écart moyen.

Plus généralement, la variance est assimilable à une "inertie d'information". C'est aussi grâce à ça qu'on peut faire l'analyse de données (analyse factorielle, analyse en composantes principales...).

Posté par
LeDino
re : formule de l'acart type 25-12-15 à 13:19

Et joyeux Noël à tous .

Posté par
LeDino
re : formule de l'acart type 25-12-15 à 13:21

Citation :
avec l'ecart absolu moyen on cree des points anguleux (non derivabilite de la valeur absolue)
alors qu'avec les carres des differences c'est derivable partout.
Très utile pour la recherche du maximum de vraisemblance si je ne me trompe pas ...

Posté par
LeDino
re : formule de l'acart type 25-12-15 à 14:13

Autre avantage décisif de l'écart-type sur l'écart moyen, compréhensible dès la terminale :  l'inégalité de Bienaymé Tchebychev.

P \left( \dfrac {|X-\mu|} {\sigma} > t \right)  \le  \dfrac{1}{t^2}

Implique par exemple que dans un intervalle de plus ou moins 2 sigma autour de la moyenne, on trouvera au moins 75% des valeurs de X, quelle que soit sa loi.

Dans le cas particulier de la loi normale, qui est le confluent de toutes les lois (grâce à la loi des grands nombres, elle même découlant de Bienaymé-Tchebychev, donc de l'écart-type)... c'est un peu plus de 95% des valeurs de X que l'on retrouvera dans ce même intervalle.

L'écart-type qui n'est pas intuitif à la base pour le béotien, le devient fortement pour le statisticien qui raisonne sur les propriétés des distributions...

Posté par
alb12
re : formule de l'acart type 25-12-15 à 17:03

Posté par
LeDino
re : formule de l'acart type 25-12-15 à 17:39

Effectivement l'article de Wikipédia sur la dispersion résume très bien les choses .
Et je suis également heureux de voir qu'il ne fait pas des manières en parlant clairement d'écart moyen.

Posté par
verdurin
re : formule de l'acart type 28-12-15 à 00:40

Bonsoir, et bonne fêtes à tous.

Il y a une autre raison au choix d'associer moyenne et variance.

Si on considère une suite finie de n valeurs  (x_i) il est légitime de chercher une valeur genre moyenne ou médiane ou mode ou ... qui résume la série.

On peut donc chercher la valeur de x qui minimise \left\vert \sum_{i=0}^n (x-x_i)\right\vert on tombe sur la moyenne mais le minimum est 0, on apprend rien sur la dispersion.

On peut chercher une valeur de x qui minimise \sum_{i=0}^n |x-x_i| on arrive alors à la médiane, mais il n'y a pas toujours unicité du minimum.
Et, à ma connaissance, il n'y a pas d'interprétation pour la valeurs du minimum.

On peut chercher une valeur de x qui minimise \sum_{i=0}^n (x-x_i)^2 . On trouve par un calcul de dérivé facile, et qu'il est intéressant, à mon avis, de faire faire aux élèves, que le minimum est atteint quand x est la moyenne, et la valeur du minimum est n fois la variance.
On a en plus une interprétation géométrique : on se place dans \R^n muni d'une base orthonormal (e_1,\dots e_n).
La moyenne est alors la projection M du point X=(x_1\dots x_n) sur la droite passant par l'origine et de vecteur directeur (1,\dots 1) la variance étant n fois le carré de la distance de X à M.
L'écart-type est alors la distance de X à M en prenant comme unité de longueur la distance de l'origine au point (1,\dots 1) .

Posté par
alainpaul
re : formule de l'acart type 28-12-15 à 11:18

Bonjour,


D'une manière générale le calculable est préféré;aussi en physique ,démographie,
économie ont été privilégiées les fonctions lisses ,même lorsque la nature profonde des phénomènes  ne le justifie pas (physique quantique,calculs financiers).

L'interprétation géométrique dont parle  *Verdurin*  bien qu'intéressante n'est qu'une
correspondance ,

Alain



Alain

Posté par
LeDino
re : formule de l'acart type 28-12-15 à 12:49

Citation :
L'interprétation géométrique dont parle  *Verdurin*  bien qu'intéressante n'est qu'une correspondance.
Bonjour Alain,

Je ne dirais pas ça en général. L'analogie géométrique fait bénéficier à la variance, comme moment d'ordre 2, des propriétés de la distance et de l'orthogonalité... qui font précisément la force de l'écart-type comme pilier de la statistique.

Le théorème de Koenig est très "géométrique". Comme bon nombre de démonstrations qui mènent à des théorèmes au cœur desquels trône la variance.

Posté par
verdurin
re : formule de l'acart type 28-12-15 à 14:02

Salut.
En ce qui concerne l'analogie géométrique, je dirais qu'il s'agit d'une interprétation des données en termes géométriques.

De façon général cette interprétation s'est montrée féconde en statistique à plusieurs variables. Il suffit d'ouvrir un livre de statistiques pour voir un usage intensif de l'algèbre linéaire.

J'ai fait connaissance avec cette interprétation quand j'ai préparé mes premiers cours de statistiques, et elle m'a beaucoup aidée.

Un exemple élémentaire :
Si on considère une série à deux variables  (x_i ;y_i)_{i=1,\dots n} on la représente dans l'espace des individus par deux points X et Y que l'on projette sur la première diagonale en M_x et M_y.
La covariance est alors le produit scalaire \vec{M_xX}\cdot\vec{M_yY} et le coefficient de corrélation linéaire est le cosinus de l'angle entre ces deux vecteurs.

Posté par
LeDino
re : formule de l'acart type 28-12-15 à 14:06

Dans le même sens : toute l'analyse de données (analyse factorielle, analyse en composantes principales, analyse des correspondances, analyse discriminantes...) repose intuitivement sur l'analogie géométrique et en pratique sur l'algèbre linéaire.

Posté par
alainpaul
re : formule de l'acart type 28-12-15 à 14:18

OUI

Dire "Le théorème de Koenig est très "géométrique".   ne revient' il pas à reconnaître
une correspondance entre deux domaines distincts et aussi une "structure commune"
et  permettant donc déductions et calculs 'communs'.

Notre esprit se réconforte dans les représentations.


Alain

Posté par
LeDino
re : formule de l'acart type 28-12-15 à 14:42

Citation :
Notre esprit se réconforte dans les représentations
Tout à fait.
Et notre intuition puise son inspiration entre autre dans cette forme de confiance.

Posté par
alainpaul
re : formule de l'acart type 28-12-15 à 16:32

Bon alors,

Et N. Bourbaki dans tout ça!?

Alain

Posté par
verdurin
re : formule de l'acart type 28-12-15 à 19:15

Je crois que Bourbaki ne s'est guère intéressé aux probabilités, alors les statistiques ...

Posté par
alainpaul
re : formule de l'acart type 29-12-15 à 10:15

Bonjour,

La densité de l' oeuvre du 'collège'  N.Bourbaki  et son degré de généralité
ne nous permettent-ils pas de considérer ces deux  domaines comme simples
développements  et applications,


Bonne journée,

Alain



Vous devez être membre accéder à ce service...

Pas encore inscrit ?

1 compte par personne, multi-compte interdit !

Ou identifiez-vous :


Rester sur la page

Désolé, votre version d'Internet Explorer est plus que périmée ! Merci de le mettre à jour ou de télécharger Firefox ou Google Chrome pour utiliser le site. Votre ordinateur vous remerciera !