Bonsoir à tous,
J'ai un souci avec l'analyse à composante principal et j'aurais besoin de votre aide.
On a p variables quantitatives observées sur n individus. On cherche à représenter le nuage des points des individus. À chaque individu on peut associer un point de R^p . Il est impossible de visualiser le nuage dès que p>3.
On cherche alors une représentation des n individus dans un sous-espace Fk de Rp de dimension k (par exemple un plan). Autrement, on cherche à définir k nouvelles variables combinaison linéaires des p variables initiales qui ferons perdre le moins d'information possibles.
L'image ci-dessous de la poisson résume l'objectif de l'ACP.
Cependant je n'arrive pas à comprendre ceci:
Fk devra être «ajustee» le mieux possible au nuage des individus :la Somme des carrés des distances des individus à Fk doit être minimale
équivalent à :
Fk est le sous-espace tel que le nuage projeté ait une inertie (dispersion) maximale.

Je vous livre une explication dans le plan mais ceci est généralisable en dimension . En espérant que
ceci apporte un éclairage utile.
Les pixels de l'image sont distribués dans le plan
. A chaque pixel
est associé
une position rapportée aux axes coordonnés.
On peut estimer le centroïde (ou l'espérance) de cette distribution comme la position moyenne (\bar x, \bar y).
On peut estimer la matrice carrée de variance-covariance encore appelée tenseur d'inertie de cette distribution de taille 2x2 , symétrique de la forme,
avec
L'analyse ACP n'est rien d'autre que la diagonalisation de cette matrice. Un vecteur propre issu de cette diagonalisation oriente un axe principal du tenseur d'inertie c'est à dire le sous-espace propre du plan qui maximise la dispersion des points de la distribution relativement à son sous-espace orthogonal complémentaire (c'est à dire la somme des carrés de la projection orthogonale des points sur ce sous-espace complémentaire) ce qui revient à dire qu'un axe propre donné représente aux mieux la direction selon laquelle la dispersion des points relativement au sous-espace propre qui lui est orthogonal est maximal.
En passant de la base initiale dans la base propre ACP, le tenseur d'inertie admet une représentation diagonale de la forme,
où les valeurs propres et
mesurent chacune la dispersion de la distribution de points relativement au sous-espace orthogonal à l' espace propre qui leur est associée .
En dimension 2 elles déterminent les demi-grands axes d'une ellipse de dispersion centrée sur le centroïde. Leur somme c'est à dire la trace du tenseur d'inertie $I_xx+I_yy$ mesure la dispersion totale. Elle est conservée dans l'analyse PCA. donc égale à mais le couple
maximise, nous l'avons vu, les dispersions des points sur relativement à leur sous-espace orthogonal.
Les relations linéaires évoquées sont simplement celle du changement de la base orthogonal unitaire (i.e. de la rotation)
menant de la base initiale à la base PCA.
Vous devez être membre accéder à ce service...
Pas encore inscrit ?
1 compte par personne, multi-compte interdit !
Ou identifiez-vous :