logo

Covariance


Covariance : encyclopédie mathématiques

wikipediaCet article est issu de l'encyclopédie libre Wikipedia.
Vous pouvez consulter l'article ici ainsi que son historique.
Les textes et les images sont disponibles sous les termes de la Licence de documentation libre GNU.
Aller à : Navigation, Rechercher

Pour le principe physique, voir Principe de covariance générale.

En statistiques, la covariance est un nombre permettant d'évaluer le sens de variation de deux variables et, par là, de qualifier l'indépendance de ces variables.

Deux variables ayant une covariance non nulle sont dites dépendantes : par exemple, dans une population donnée, le poids et la taille sont des variables dépendantes. Cependant, elles ne sont pas corrélées : la corrélation est une relation linéaire, or le poids ne varie généralement pas proportionnellement à la taille.

Sommaire

[modifier] Définition

En théorie des probabilités et en statistique, on nomme covariance de deux variables aléatoires réelles X et Y la valeur :

Définition â€” \operatorname{cov}(X,Y)\equiv E[(X-E[X])\,(Y-E[Y])]

où E désigne l'espérance mathématique.

Notation â€” On note parfois  \operatorname{cov}(X,Y)\equiv \sigma_{XY}

Intuitivement, la covariance est une mesure de la variation simultanée de deux variables aléatoires. C'est-à-dire que la covariance devient plus positive pour chaque couple de valeurs qui diffèrent de leur moyenne dans le même sens, et plus négative pour chaque couple de valeurs qui diffèrent de leur moyenne dans le sens opposé.

L'unité de mesure de la covariance cov(X,Y) est le produit de l'unité des variables aléatoires X et Y et sa valeur est comprise dans ]-\infty; +\infty[. En revanche, la corrélation, qui dépend de la covariance, est une mesure de dépendance linéaire sans unité et prend ses valeurs dans [ − 1;1].

Dans le cas de variables discrètes, on a:

\sigma_{xy}=\operatorname{cov}(x, y) = \sum_{i=1}^n \sum_{j=1}^m(x_i y_j p(x_i) p(y_j/x=x_i))-\bar{x}\bar{y}=\sum_{i=1}^n \sum_{j=1}^m(x_i y_j p(y_j) p(x_i/y=y_j))-\bar{x}\bar{y}
tandis que: \sigma_x^2 = \sum_{i=1}^n x_i^2 p(x_i)-\bar{x}^2 et \sigma_y^2 = \sum_{j=1}^m y_j^2 p(y_j)-\bar{y}^2

[modifier] Propriétés

Par analogie avec le théorème de König-Huyghens pour la variance, on a:

Propriété â€” \operatorname{cov}(X, Y) = E(X Y) - E(X)E(Y)


La seconde propriété est utile pour les cas de variables X et Y indépendantes

Propriété â€”  X et Y indépendants \Rightarrow \operatorname{cov}(X,Y) =0

La réciproque, cependant, n'est pas vraie. Il est en effet possible que X et Y ne soient pas indépendantes, et que leur covariance soit nulle. Des variables aléatoires dont la covariance est nulle sont dites non corrélées.

Propriété â€”  \operatorname{cov}(X, X) = \operatorname{var}(X)

Propriété â€” \operatorname{cov}(X, Y) = \operatorname{cov}(Y, X)

Propriété â€”  \operatorname{cov}(cX, Y) = c\, \operatorname{cov}(X, Y) avec c une constante

Propriété â€”  \operatorname{cov}(X+c, Y) = \operatorname{cov}(X, Y) avec c une constante

Propriété â€”  \operatorname{cov}\left(\sum_i{X_i}, \sum_j{Y_j}\right) = \sum_i{\sum_j{\operatorname{cov}\left(X_i, Y_j\right)}}

Bilinéarité de la variance:

Propriété â€”  \operatorname{var}(X+Y) = var(X) + var(Y) + 2cov(X,Y)

Cette formule est l'analogue de (x + y)2 = x2 + y2 + 2xy . En fait, la plupart des propriétés de la covariance sont analogues à celles du produit de deux réels ou du produit scalaire de deux vecteurs.

[modifier] Exemple

Dans un forum Internet, quelqu'un affirme que les activités sont plus intenses les jours de pleine lune. On peut ne pas disposer du calendrier des pleines lunes, mais si cette affirmation est exacte et si l'on nomme N(t) le nombre de contributions au jour t, la covariance entre N(t) et N(t+28) cumulée sur toutes les valeurs de t sera supérieure en principe aux covariances entre N(t) et N(t+x) pour les valeurs de x différentes de 28.


[modifier] Estimation

Un estimateur de la covariance \operatorname{cov}(AB)\equiv\sigma_{AB} de deux variables aléatoires A et B observées conjointement N fois est donné par:

\hat\sigma_{AB} = \frac{\sum a_i \cdot b_i}{N} - \frac{\sum a_i}{N} \cdot \frac{\sum b_i}{N}


[modifier] Matrice de variance-covariance

Article détaillé : matrice de variance-covariance.

[modifier] Définition

La matrice de variance-covariance (ou simplement matrice de variance) d'un vecteur de k variables aléatoires \vec X est la matrice carrée donnée par:


\operatorname{var}(\vec X)
=\operatorname{var}\begin{pmatrix} X_1  \\ \vdots\\ X_k \end{pmatrix}
=\begin{pmatrix} 
\operatorname{var}(X_1) & \operatorname{cov}(X_{1}X_{2}) &  \cdots & \operatorname{cov}(X_{1}X_{k}) \\
\operatorname{cov}(X_{1}X_{2}) & \ddots & \cdots & \vdots\\
\vdots & \vdots & \ddots & \vdots\\
\operatorname{cov}(X_{1}X_{k}) & \cdots & \cdots&  \operatorname{var}(X_k) 
\end{pmatrix}
=\begin{pmatrix} 
\sigma^2_{x_1} & \sigma_{x_{1}x_{2}} &  \cdots & \sigma_{x_{1}x_{k}} \\
\sigma_{x_{1}x_{2}} & \ddots & \cdots & \vdots\\
\vdots & \vdots & \ddots & \vdots\\
\sigma_{x_{1}x_{k}} & \cdots & \cdots&  \sigma^2_{x_k} 
\end{pmatrix}


Vu la propriété que \operatorname{cov}(X, Y) = \operatorname{cov}(Y, X), il s'agit d'une matrice symétrique. L'inverse de la matrice de covariance est parfois désignée par le terme de « matrice de précision Â».

[modifier] Estimation

Un estimateur de la matrice de variance-covariance de N réalisations d'un vecteur de variables aléatoires peut être donné par:

\operatorname{\widehat {var}}(\vec X) = \frac{\sum x_i \cdot x_i^T}{N} - \frac{\sum x_i}{N} \cdot \left(\frac{\sum x_i}{N}\right)^T

[modifier] Usage

La connaissance des covariances est le plus souvent indispensable dans les fonctions d'estimation, de filtrage et de lissage. Elles permettent, entre autres en photographie, d'arriver à corriger de façon spectaculaire les flous de mise au point ainsi que les flous de bougé, ce qui est extrêmement important pour les clichés astronomiques. On les utilise également en automatique. En sociolinguistique, la covariance désigne la correspondance entre l’appartenance à une certaine classe sociale et un certain parler inhérent à cette condition sociale.

[modifier] Voir aussi

  • espérance mathématique
  • corrélation
  • autocovariance

Voir « covariance Â» sur le Wiktionnaire.

modifier Articles de mathématiques en rapport avec les probabilités ou les statistiques
Statistiques descriptives • Analyse des données • Visualisation des données • Estimateurs • Tests statistiques • Séries temporelles et économétrie • Statistique Mathématique • Théorie des probabilités • Variables aléatoires • Inégalités • Théorèmes limites • Processus stochastiques • La mécanique statistique • Les statistiques et l'économie • Les statistiques et la sociologie • Les statistiques et les sciences • Les probabilités et les jeux • Les équations aux dérivées partielles et les probabilités
wikipediaCet article est issu de l'encyclopédie libre Wikipedia.
Vous pouvez consulter l'article ici ainsi que son historique.
Les textes et les images sont disponibles sous les termes de la Licence de documentation libre GNU.


cours particuliers - cours de maths haut de pagehaut Retrouvez cette page sur ilemaths l'île des mathématiques
© Tom_Pascal & Océane 2008