logo

Théorème de Cayley-Hamilton


Théorème de Cayley-Hamilton : encyclopédie mathématiques

wikipediaCet article est issu de l'encyclopédie libre Wikipedia.
Vous pouvez consulter l'article ici ainsi que son historique.
Les textes et les images sont disponibles sous les termes de la Licence de documentation libre GNU.
Page d'aide sur l'homonymie Ne pas confondre avec le thĂ©orème de Cayley en thĂ©orie des groupes ni avec le thĂ©orème de Hamilton en gĂ©omĂ©trie.

En algèbre linéaire, le théorème de Cayley-Hamilton affirme que tout endomorphisme d'un espace vectoriel de dimension finie sur un corps commutatif quelconque annule son propre polynôme caractéristique.

En termes de matrice, cela signifie que :

si A est une matrice carrée d'ordre n et si

p(X)= \det(XI_n-A) = X^n + p_{n-1}X^{n-1} + \ldots + p_1 X + p_0

est son polynĂ´me caractĂ©ristique (polynĂ´me d'indĂ©terminĂ©e X), alors en remplaçant formellement X par la matrice A dans le polynĂ´me, le rĂ©sultat est la matrice nulle :

p(A)= A^n + p_{n-1}A^{n-1} + \ldots + p_1 A + p_0 I_n = 0_n.\;

Le théorème de Cayley-Hamilton s'applique aussi à des matrices carrées à coefficients dans un anneau commutatif quelconque.

Un corollaire important du théorème de Cayley-Hamilton affirme que le polynôme minimal d'une matrice donnée est un diviseur de son polynôme caractéristique.

Bien qu'il porte les noms des mathématiciens Arthur Cayley et William Hamilton, la première démonstration du théorème est donnée par Ferdinand Georg Frobenius en 1878, Cayley l'ayant principalement utilisé dans ses travaux, et Hamilton l'ayant prouvé en dimension 2.

Sommaire

[modifier] Motivation

Ce thĂ©orème possède deux familles d'utilisation :

  • Il permet d'Ă©tablir des rĂ©sultats thĂ©oriques, par exemple pour calculer le polynĂ´me caractĂ©ristique d'un endomorphisme nilpotent.
  • Il autorise aussi des simplifications puissantes dans les calculs de matrices. L'approche par les polynĂ´mes minimaux est en gĂ©nĂ©ral moins coĂ»teuse que celle par les dĂ©terminants.

On trouve ce théorème utilisé dans les articles sur les polynômes d'endomorphisme, endomorphismes nilpotents, et plus généralement dans la théorie générale des matrices

[modifier] Exemple

Considérons par exemple la matrice

A = \begin{pmatrix}1&2\\
3&4\end{pmatrix}.

Le polynôme caractéristique s'écrit

p(X)=\det\begin{pmatrix}X-1&-2\\
-3&X-4\end{pmatrix}=(X-1)(X-4)-(-2)(-3)=X^2-5X-2.

Le théorème de Cayley-Hamilton affirme que

A^2-5A-2I_2=0

et cette relation peut être rapidement vérifiée dans ce cas. De plus le théorème de Cayley-Hamilton permet de calculer les puissances d'une matrice plus simplement que par un calcul direct. Reprenons la relation précédente

A^2-5A-2I_2=0
A^2=5A+2I_2

Ainsi, par exemple, pour calculer A4, nous pouvons écrire

A^3=(5A+2I_2)A=5A^2+2A=5(5A+2I_2)+2A=27A+10I_2

et il vient

A^4=A^3A=(27A+10I_2)A=27A^2+10A=27(5A+2I_2)+10A
A^4=145A+54I_2.

On peut également utiliser la relation polynomiale initiale A^2-5A-2I_2=0 pour prouver l'inversibilité de A et calculer son inverse. Il suffit en effet de mettre en facteur une puissance de A là où c'est possible et

A(A-5I_2)=2I_2

ce qui montre que A admet pour inverse

A^{-1} = \frac12 (A-5I_2)

[modifier] Démonstration

[modifier] Une preuve

Quelle que soit la matrice S \in \mathcal{M}_n(\mathbb{K}), il existe une matrice explicitement déterminée, \textrm{Comp}(S), la matrice complémentaire de S, qui vérifie S\textrm{Comp}(S)=\textrm{Comp}(S)S=\det S I_n. La matrice \textrm{Comp(S)} est la transposée de la comatrice ou matrice des cofacteurs de S. Cette relation reste encore vraie si les coefficients de S appartiennent à un anneau, puisqu'on n'a pas fait de divisions. On peut donc poser S=XI_n-A, dont les coefficients sont dans \mathbb{K}[X] et on a alors la relation:

(XI_n-A)\textrm{Comp}(XI_n-A)=\det(XI_n-A)I_n=p(X)I_n. \ \ (1)

Partons de (1), en écrivant

\textrm{Comp}(XI_n-A)=\sum_{j=0}^{n-1}B_j X^j

avec B_j\in\mathcal{M}_n(\mathbb{K}), et

p(X)=\sum_{j=0}^n p_jX^j.

On peut dĂ©velopper le produit (XI_n-A)\textrm{Comp}(XI_n-A) :

(XI_n-A)\textrm{Comp}(XI_n-A)=X^{n}B_{n-1} +\sum_{i=1}^{n-1}X^i(B_{i-1}-AB_{i}) -AB_0\ \ (2),

qui est identique Ă 

\sum_{j=0}^n X^jp_jI_n.\ \ (3)

Les polynomes (2) et (3) sont égaux. Par conséquent,

p_{n}I_n=B_{n-1},\quad p_iI_n=B_{i-1}-AB_{i},\quad p_0I_n=-AB_0.

Il vient alors un tĂ©lescopage :

\begin{align}p(A)&=\sum_{j=0}^n A^j(p_jI_n)\\&=A^nB_{n-1}+\sum_{i=1}^{n-1}A^i(B_{i-1}-AB_{i}) -AB_0\\&=\sum_{i=1}^nA^iB_{i-1}-\sum_{i=0}^{n-1}A^{i+1}B_i\\&=0\end{align},

La preuve ne consiste pas en une substitution de X par A dans des égalités de polynômes, mais en une identification de leurs coefficients.

[modifier] Une variante

On peut également aligner des idées abstraites.

Commençons par introduire un morphisme d'Ă©valuation appropriĂ© Ă  la rĂ©solution du problème. Tout d'abord, \mathbb{K}[A] Ă©tant une algèbre commutative sur \mathbb{K}, on a un morphisme d'Ă©valuation : \mathbb{K}[X] \to \mathbb{K}[A] (qui envoie X sur A et \lambda sur \lambda I_n pour tout scalaire \lambda). Ce morphisme d'anneaux commutatifs induit un morphisme d'Ă©valuation sur les anneaux de matrices \mathcal{M}_n(\mathbb{K}[X]) \to \mathcal{M}_n(\mathbb{K}[A]).

Une notation auxiliaire nous sera utile : pour deux matrices carrĂ©es (n,n) notĂ©es C=(c_{ij}) et D=(d_{ij}), on notera C \triangleright D la matrice Ă  coefficients matriciels de terme gĂ©nĂ©ral c_{ij}D. Si le lecteur connaĂ®t le produit de Kronecker de deux matrices, il pourra remarquer que C\triangleright D c'est presque la mĂŞme chose que C\otimes D Ă  ceci près que C\triangleright D est une matrice (n,n) dont les coefficients sont des matrices (n,n) tandis que C\otimes D est une matrice (n^2,n^2). Les formules ci-dessous ne contiennent de fait que deux cas particuliers de cette opĂ©ration : des produits de la forme I_n \triangleright C c'est-Ă -dire des matrices carrĂ©es avec des C sur la diagonale et des 0 ailleurs et un produit A\triangleright I_n c'est-Ă -dire une variante de A oĂą la matrice a_{ij}I_n vient remplacer le coefficient a_{ij}.

Cette notation posĂ©e, appliquons le morphisme d'Ă©valuation Ă  la relation :

(XI_n-A)\,\textrm{Comp}(XI_n-A)=p(X)I_n.

On obtient une relation

(I_n\triangleright A-A\triangleright I_n)\,M=I_n\triangleright p(A)\qquad(*)

dans laquelle M est une certaine matrice Ă  coefficients dans \mathbb{K}[A] dont on n'aura besoin de rien savoir.

Ainsi on a Ă©crit une formule juste, et on en pâtit : on n'a du coup pas fini, l'Ă©valuation de XI_n-A par une technique rigoureuse ne fournit pas 0 mais une bizarre matrice Ă  coefficients matriciels.

Il faut une deuxième idĂ©e pour conclure. Elle consiste Ă  remarquer que si \mathbb{A} est un anneau et E un \mathbb A-module Ă  droite, pour tous entiers r, s, t on peut dĂ©finir par les formules habituelles un produit matriciel :

\mathcal{M}_{rs}(E)\times\mathcal{M}_{st}(\mathbb{A})\to\mathcal{M}_{rt}(E)

pour laquelle on a associativitĂ© si on veut calculer des produits Ă  trois termes :

\mathcal{M}_{rs}(E)\times\mathcal{M}_{st}(\mathbb{A})\times\mathcal{M}_{tu}(\mathbb{A})\to\mathcal{M}_{ru}(E).

Appliquons cette notion Ă  E=\mathbb{K}^n (pour les puristes Ă  E=\mathcal{M}_{n1}(\mathbb{K})) qui est un module (dont la multiplication s'Ă©crit spontanĂ©ment Ă  gauche mais peut l'ĂŞtre Ă  droite si on prĂ©fère, l'anneau Ă©tant commutatif) sur l'anneau commutatif \mathbb{A}=\mathbb{K}(A), la multiplication externe Ă©tant l'application : \mathcal{M}_{n1}(\mathbb{K})\times\mathbb{K}(A) dĂ©finie par (E,B)\mapsto BE (ce BE\, Ă©tant le produit matriciel ordinaire de la matrice carrĂ©e B\, par la matrice colonne E\,).

Multiplions Ă  gauche la relation (*) par le vecteur ligne \begin{pmatrix}e_1&\cdots&e_n\end{pmatrix} oĂą (e_1,\ldots,e_n) dĂ©signe la base canonique de \mathbb{K}^n : en utilisant l'expression de droite dans (*) on obtient le vecteur ligne \begin{pmatrix}p(A)e_1&\ldots&p(A)e_n\end{pmatrix}.

Si maintenant on utilise l'expression de gauche dans (*) et qu'on dĂ©place les parenthèses par associativitĂ© de la multiplication matricielle un peu inhabituelle dĂ©crite ci avant, on est amenĂ© Ă  calculer le produit :

\begin{pmatrix}e_1&\ldots&e_n\end{pmatrix}(I_n\triangleright A-A\triangleright I_n).

Pour chaque indice j, on ne peut que constater que sa j-ème composante vaut :

Ae_j-\sum_{i=1}^n(a_{ij}I_n)e_i=Ae_j-\sum_{i=1}^na_{ij}e_i=0.

En multipliant ceci Ă  droite par l'inoffensive matrice M et en comparant les deux expressions du produit, on conclut que pour tout indice j, p(A)e_j=0.

Et donc p(A)=0[1].

[modifier] Remarques additionnelles sur la démonstration

La preuve qui a Ă©tĂ© donnĂ©e Ă©vite la substitution de X par une matrice dans un contexte non commutatif, mais les manipulations effectuĂ©es sont quand mĂŞme proches de cette idĂ©e : on a bien dĂ©composĂ© l'Ă©quation en composantes suivant les puissances de X, on a multipliĂ© Ă  gauche par A^j la composante qui Ă©tait en facteur de X^j, et on a additionnĂ© tout ensemble. En fait, on a utilisĂ© l'opĂ©ration \textrm{Ev}_A dĂ©finie en (5), sans supposer qu'il s'agisse d'un homomorphisme d'anneaux, de \mathcal{M}_n(\mathbb{K})[X] dans {M}_n(\mathbb{K}). L'opĂ©ration \textrm{Ev}_A est une Ă©valuation Ă  gauche, parce que la multiplication par l'indĂ©terminĂ©e scalaire X est remplacĂ©e par la multiplication Ă  gauche par A.


Une autre observation est importante : la forme exacte du polynĂ´me \textrm{Comp}(XI_n-A) n'a aucune importance. Il y a donc quelque chose Ă  exploiter ici, ce que n'ont pas manquĂ© de faire les mathĂ©maticiens.

Soit M un anneau non commutatif ; on peut dĂ©finir une division euclidienne d'un polynĂ´me P\in M[X] par un polynĂ´me B monique. C'est un polynĂ´me dont le coefficient du terme de plus haut degrĂ© est une unitĂ© de M, c'est-Ă -dire un Ă©lĂ©ment de M qui possède un inverse dans M. Plus prĂ©cisĂ©ment, il existe deux polynĂ´mes Q, R\in M[X], avec R de degrĂ© strictement infĂ©rieur au degrĂ© de B, tels que

P=BQ+R.

La démonstration est entièrement analogue à celle du cas scalaire. Si B=XI_n-A, alors le reste R est de degré 0, et donc identique à une constante appartenant à M. Mais dans ce cas, en raisonnant exactement comme dans la démonstration du théorème de Cayley-Hamilton, on arrive à la conclusion

\textrm{Ev}_A(P)=R.

Il s'ensuit que \textrm{Ev}_A(P) est nul si et seulement si P est divisible Ă  gauche par XI_n-A.

La dĂ©monstration du thĂ©orème de Cayley-Hamilton donne aussi une autre information : le polynĂ´me \textrm{Comp}(XI_n-A) est le quotient Ă  gauche de p(X)I_n par tI_n-A. Comme p(X)I_n et XI_n-A appartiennent tous deux au sous-anneau commutatif \mathrm{K}[A][X], la division Ă  gauche se passe entièrement dans ce sous-anneau, c'est donc une division ordinaire. En particulier, les coefficients matriciels de \textrm{Comp}(XI_n-A) sont des combinaisons linĂ©aires de puissances de A. En d'autres termes, la matrice complĂ©mentaire d'une matrice A est un polynĂ´me en A, ce qu'il n'est pas facile de dĂ©duire directement de la dĂ©finition d'une matrice complĂ©mentaire. Mieux, on peut calculer explicitement ses coefficients Ă  partir de ceux du polynĂ´me caractĂ©ristique p(X), puisqu'il s'agit de faire une division euclidienne ordinaire, et on trouve

\textrm{Comp(-A)}=\sum_{j=1}^n p_jA^{j-1}.

On aurait pu également obtenir cette relation directement à partir du théorème de Cayley-Hamilton, en vertu de l'identité

p_0I_n=\det(-A)I_n=-A\cdot \textrm{Comp}(-A)=\textrm{Comp}(-A)\cdot-A.

[modifier] Abstraction et généralisations

La preuve donnĂ©e ci-dessus n'utilise que les propriĂ©tĂ©s d'anneau commutatif du corps K, puisqu'elle ne comporte pas de division par des Ă©lĂ©ments de cet anneau mais s'appuie juste sur la formule de Laplace, valide pour une matrice Ă  coefficients dans n'importe quel anneau commutatif B. On peut donc gĂ©nĂ©raliser le thĂ©orème de Cayley-Hamilton Ă  ce cas, en utilisant la formule de Laplace pour des matrices Ă  coefficients dans l'anneau B = R [X], R Ă©tant un anneau commutatif quelconque :

Pour toute matrice carrée A de taille nxn à coefficients dans un anneau commutatif R, si l'on note

p_A(X)=\det(XI_n-A)\,,
on a :
p_A(A)=0\,.

Soit alors M un module de type fini sur cet anneau R (l'analogue de la notion d'espace vectoriel de dimension finie sur un corps, mais sans l'existence de bases : M a seulement des familles gĂ©nĂ©ratrices finies), et soit φ un endomorphisme de M, le thĂ©orème de Cayley-Hamilton permet de construire comme suit des polynĂ´mes en φ qui s'annulent sur M : soit (e1, e2, ... , en) une famille gĂ©nĂ©ratrice de M. On peut trouver des Ă©lĂ©ments a_{ij} de R tels que

\varphi(e_j)=\sum_{i=1}^n a_{ij}e_i,

et on note A la matrice nxn formée de ces coefficients. Cette matrice n'est pas unique, même pour une famille génératrice fixée, puisqu'on n'a pas supposé libre cette famille. Néanmoins, de la formule p_A(A)=0 on déduit que p_A(\varphi)=0.

Parmi les multiples dĂ©monstrations[2] du thĂ©orème de Cayley-Hamilton dans le contexte des anneaux commutatifs, soulignons l'Ă©lĂ©gance de la dĂ©monstration gĂ©nĂ©rique, dont le principe est abstrait mais courant en algèbre : elle repose sur la remarque que l'Ă©quation p_A(A)=0 est une Ă©quation polynomiale universelle en les coefficients de la matrice A (carrĂ©e de taille n fixĂ©e). C'est-Ă -dire que p_A(A)=U(a_{i,j}) pour toute matrice A de coefficients a_{i,j} dans n'importe quel anneau commutatif, oĂą U(Y_{i,j}) dĂ©signe une certaine matrice carrĂ©e de taille n Ă  coefficients dans l'anneau de polynĂ´mes Ă  n2 indĂ©terminĂ©es R=\Z[(Y_{i,j})_{1\le i\le n, 1\le j\le n}] (cette matrice universelle U est indĂ©pendante de A et rĂ©sulte juste des formules de dĂ©veloppement du dĂ©terminant et des puissances de matrices). Pour dĂ©montrer le thĂ©orème pour n'importe quelle matrice A dans n'importe quel anneau commutatif, il suffit donc de vĂ©rifier que cette matrice U(Y_{i,j}) est nulle, c'est-Ă -dire de dĂ©montrer le thĂ©orème pour une seule matrice : la matrice Y dont les coefficients sont les Y_{i,j}, Ă©lĂ©ments de l'anneau R.

[modifier] Références

(en) Cet article est partiellement ou en totalitĂ© issu de l’article en anglais intitulĂ© « Cayley-Hamilton Theorem Â» (voir la liste des auteurs)

  1. ↑ Cette preuve est celle qui figure dans Introduction to commutative algebra, M. F. Atiyah et I. G. Macdonald, Addison-Wesley, (ISBN 0-201-00361-9), p. 21.
  2. ↑ [PDF] Présentation de 30 démonstrations, par Michel Coste, Université de Rennes 1


wikipediaCet article est issu de l'encyclopédie libre Wikipedia.
Vous pouvez consulter l'article ici ainsi que son historique.
Les textes et les images sont disponibles sous les termes de la Licence de documentation libre GNU.


maths - prof de maths haut de pagehaut Retrouvez cette page sur ilemaths l'île des mathématiques
© Tom_Pascal & Océane 2012