logo

Fonction convexe



Fonction convexe : encyclopédie mathématiques

wikipediaCet article est issu de l'encyclopédie libre Wikipedia.
Vous pouvez consulter l'article ici ainsi que son historique.
Les textes et les images sont disponibles sous les termes de la Licence de documentation libre GNU.
Aller Ă  : navigation, rechercher
Fonction convexe.

En mathĂ©matiques, une fonction rĂ©elle d'une variable rĂ©elle est dite convexe si son graphe est « tournĂ© vers le haut Â» ; on veut dire par lĂ  que si A et B sont deux points du graphe de la fonction, le segment [AB] est entièrement situĂ© au-dessus du graphe. Cela revient au mĂŞme de dire que l'Ă©pigraphe (l'ensemble des points qui sont au-dessus du graphe) est un ensemble convexe. Ă€ l'inverse, une fonction dont le graphe est « tournĂ© vers le bas Â» est dite concave (c'est alors son hypographe - l'ensemble des points qui sont en dessous du graphe - qui est convexe).

En prĂ©cisant au moyen des valeurs de la fonction ce que sont les points A et B ci-dessus, on obtient une dĂ©finition Ă©quivalente souvent donnĂ©e de la convexitĂ© d'une fonction : une fonction dĂ©finie sur un intervalle I\subset\R est convexe lorsque, pour tous x et y de I et tout t dans [0, 1] on a


f\left(t x+(1-t)y\right) \leq t f(x)+(1-t)f(y).

Lorsque l'inégalité est stricte (avec x différent de y et t dans {]0, 1[}), on parle de fonction strictement convexe.

Ces définitions se généralisent aux fonctions définies sur un espace vectoriel arbitraire.

Les fonctions convexes sont, avec les ensembles convexes, les objets constitutifs de l'analyse convexe, une discipline « intermĂ©diaire Â» entre l'algèbre linĂ©aire et l'analyse non linĂ©aire. Elles permettent de dĂ©montrer un grand nombre d'inĂ©galitĂ©s remarquables, dites inĂ©galitĂ©s de convexitĂ©. Elles jouent aussi un rĂ´le singulier en optimisation, en supprimant la distinction entre minima locaux et globaux (tout minimum local d'une fonction convexe est un minimum global).

Fonction convexe d'une variable réelle[modifier | modifier le code]

FunciĂłn convexa.png

Dans cette première section, on va supposer que l'ensemble de départ est un intervalle I de \mathbb{R}. Cette restriction permet de fournir une première initiation aux fonctions convexes d'abord plus aisée et parce que la possibilité de tracer des représentation graphiques planes facilite certainement la tâche, ensuite et surtout parce que les concepts de continuité ou dérivabilité sont significativement plus maniables pour les fonctions d'une seule variable. Cette approche montre tout de même vite ses limites, en particulier parce qu'elle n'est guère pertinente pour appliquer la théorie des fonctions convexes à l'optimisation qui en est sans doute la principale motivation.

Le lecteur qui recherche la définition d'une fonction convexe de plusieurs variables, ou définie sur un ensemble convexe d'un espace vectoriel ou affine est invité à se rendre directement à la section suivante.

DĂ©finitions[modifier | modifier le code]

DĂ©finition â€” Une fonction f d’un intervalle I de \mathbb{R} vers \mathbb{R} est dite convexe lorsque, pour tous x_1 et x_2 de I et tout \lambda dans [0, 1] on a :

 f(\lambda\, x_1+(1-\lambda)\, x_2) \leq \lambda\, f(x_1)+(1-\lambda)\, f(x_2)

Cela signifie que pour tout x_1 et x_2 de I, le segment \ [A_1, A_2] de \ \R^2, où \ A_1 = (x_1 , f(x_1)) et \ A_2 = (x_2 , f(x_2)), est situé au-dessus de la courbe représentative de f.

Une fonction concave est une fonction dont la fonction opposée est convexe.

On vĂ©rifie aussitĂ´t ce qui suit, reliant les notions d'ensemble convexe et de fonction convexe :

Remarque â€” La fonction f est convexe sur I si et seulement si \ \{(x,\, y) \in I \times \R\, | y \geq f(x)\} est un sous-ensemble convexe de \ \R^2.

Cet ensemble est appelé l'épigraphe de f.

Exemple : la fonction x\,\colon\, \mapsto |x| est convexe, parce que son Ă©pigraphe est un quart de plan (lui-mĂŞme convexe comme intersection de deux demi-plans). Il est souvent malcommode de vĂ©rifier la convexitĂ© d'une fonction dĂ©finie par une formule concrète Ă  partir de la seule dĂ©finition, on attendra donc quelques paragraphes pour donner d'autres exemples, lorsqu'on disposera d'un critère de convexitĂ© plus utilisable en pratique.

Possibilité de n'utiliser que des milieux[modifier | modifier le code]

La définition de la convexité fait apparaître des barycentres où les coefficients sont des réels arbitraires de [0,1]. Il est possible de n'utiliser que des milieux, mais il est alors indispensable d'ajouter une hypothèse supplémentaire de régularité portant sur f[1].

Proposition â€” Une fonction f continue sur I est convexe sur I si et seulement si quels que soient les Ă©lĂ©ments x_1 et x_2 de I :

f\left(\frac{x_1+x_2}{2}\right) \leq \frac{f(x_1)+f(x_2)}{2}.

Extension Ă  des barycentres de plus de deux points[modifier | modifier le code]

Article dĂ©taillĂ© : InĂ©galitĂ© de Jensen.

L'inĂ©galitĂ© de la dĂ©finition s'Ă©tend comme suit (on peut le dĂ©montrer par rĂ©currence sur l’entier p). On dĂ©nomme parfois cette version l'inĂ©galitĂ© de Jensen :

Proposition â€” Si f est convexe sur I et si x_1,\, \dots,\, x_p sont des points de I et \lambda_1,\, \dots,\, \lambda_p des rĂ©els positifs ou nuls tels que \lambda_1 + \cdots + \lambda_p = 1, alors :

f(\lambda_1\, x_1 + \cdots + \lambda_p\, x_p) \leq \lambda_1\, f(x_1) + \cdots + \lambda_p\, f(x_p).

Géométrie du graphe d'une fonction convexe[modifier | modifier le code]

On appelle parfois « lemme des trois cordes Â» ou « inĂ©galitĂ© des pentes Â» voire « inĂ©galitĂ© des trois pentes Â» le rĂ©sultat suivant[2] :

Proposition â€” Si f est convexe sur I, pour tous points x_1, x_2, x_3 de I avec x_1< x_2< x_3

\frac{f(x_2)-f(x_1)}{x_2-x_1}\leq \frac{f(x_3)-f(x_1)}{x_3-x_1}\leq \frac{f(x_3)-f(x_2)}{x_3-x_2}.

Réciproquement, si l'une des deux inégalités est vérifiée pour tous x_1, x_2, x_3 de I avec x_1< x_2< x_3 , alors f est convexe.

On trouve une démonstration ici sur la wikiversité.

Régularité des fonctions convexes[modifier | modifier le code]

Le « lemme des trois cordes Â» permet de montrer que[3] :

ThĂ©orème â€” Si f est convexe sur un intervalle ouvert I

  • f est continue, dĂ©rivable Ă  gauche et Ă  droite en tout point de I.
  • Les fonctions \ f\,'_g\,,\, f\,'_d sont croissantes sur I.
  • l’ensemble des points x oĂą f n'est pas dĂ©rivable (c'est-Ă -dire tels que \ f\,'_g(x) \neq  f\,'_d(x)) est au plus dĂ©nombrable.

Cas des fonctions dérivables[modifier | modifier le code]

On dispose des caractĂ©risations suivantes :

Proposition â€” Soit f une fonction dĂ©rivable sur un intervalle I.

  • f est convexe si et seulement si sa courbe reprĂ©sentative est au-dessus de chacune de ses tangentes ;
  • f est convexe si et seulement si sa dĂ©rivĂ©e est croissante sur I.

d'oĂą on tire le corollaire immĂ©diat fort pratique pour vĂ©rifier sans mal la convexitĂ© d'exemples spĂ©cifiques :

Corollaire â€” Soit f une fonction deux fois dĂ©rivable sur un intervalle I.

f est convexe si et seulement si sa dérivée seconde f'' est à valeurs positives ou nulles.

Ainsi on peut dĂ©sormais facilement ajouter Ă  sa collection de fonctions convexes (ou concaves) les exemples suivants :

  • la fonction \ \R \to \R,\, x \mapsto x^2 est convexe ;
  • la fonction \ \R \to \R,\, x \mapsto \exp{x} est convexe ;
  • la fonction \ \R^*_+ \to \R,\, x \mapsto \ln{x} est concave.

Stricte convexité[modifier | modifier le code]

En faisant intervenir des inégalités strictes, on dispose d'une variante de la convexité, la stricte convexité.

DĂ©finition â€” Une fonction f d’un intervalle I de \mathbb{R} vers \mathbb{R} est dite strictement convexe lorsque, pour tous x_1 et x_2 distincts dans I et tout \lambda dans ]0, 1[ on a :

 f(\lambda\, x_1+(1-\lambda)\, x_2) < \lambda\, f(x_1)+(1-\lambda)\, f(x_2)

Les rĂ©sultats Ă©noncĂ©s plus haut pour des fonctions convexes s'adaptent gĂ©nĂ©ralement sans mal aux fonctions strictement convexes. On prendra garde Ă  une nuance : de mĂŞme que les fonctions dĂ©rivables convexes sont celles qui ont une dĂ©rivĂ©e croissante, les fonctions dĂ©rivables strictement convexes sont celles qui ont une dĂ©rivĂ©e strictement croissante. En revanche, il ne faudrait pas croire que la dĂ©rivĂ©e seconde d'une fonction dĂ©rivable strictement convexe est nĂ©cessairement une fonction Ă  valeurs strictement positives : la dĂ©rivĂ©e d'une fonction strictement croissante peut s'annuler occasionnellement, ou plus exactement peut s'annuler sur un ensemble de points d'intĂ©rieur vide. Penser Ă  f\,\colon\, x\mapsto x^4 pour un exemple de fonction strictement convexe dont la dĂ©rivĂ©e seconde s'annule.

Fonction convexe définie sur un espace vectoriel[modifier | modifier le code]

DĂ©finitions[modifier | modifier le code]

Convexité[modifier | modifier le code]

On peut donner au moins deux définitions légèrement différentes d'une fonction convexe, qui reviennent essentiellement au même mais ne fournissent néanmoins pas exactement les mêmes fonctions. On prendra donc garde au contexte lors d'une invocation d'une de ces définitions pour comprendre s'il s'agit ou non de fonctions susceptibles de prendre des valeurs infinies.

DĂ©finition 1 â€” Soient E un espace vectoriel (ou affine) rĂ©el, C\subset E un convexe et f:C\to\R une fonction. On dit que f est convexe lorsque pour tous x_0 et x_1\in C et tout t\in[0,1], on a
 f((1-t) x_0+tx_1) \leqslant (1-t) f(x_0)+t f(x_1).

Dans la définition suivante, on a noté \operatorname{dom}f:=\{x\in E:f(x)<+\infty\} le domaine (effectif) d'une fonction f:E\to\bar{\R}, définie sur un ensemble E à valeurs dans la droite réelle achevée \bar{\R}:=\R\cup\{-\infty,+\infty\}.

DĂ©finition 2 â€” Soient E un espace vectoriel (ou affine) rĂ©el et f:E\to\bar{\R} une fonction. On dit que f est convexe lorsque l'une des conditions Ă©quivalentes suivantes est vĂ©rifiĂ©e :

  • l'Ă©pigraphe \operatorname{epi}\,f est convexe,
  • pour tous x_0 et x_1\in\operatorname{dom}f et tout t\in[0,1], on a
     f((1-t) x_0+tx_1) \leqslant (1-t) f(x_0)+t f(x_1).

Étant donnĂ©e une fonction convexe au sens de la dĂ©finition 1, on peut lui associer une fonction convexe au sens de la dĂ©finition 2 en la prolongeant hors de C par la valeur +\infty ; rĂ©ciproquement Ă©tant donnĂ©e une fonction convexe f:E\to\R\cup\{+\infty\} au sens de la dĂ©finition 2, il est immĂ©diat de vĂ©rifier que C:=\operatorname{dom}\,f est un convexe et la restriction de f Ă  C est alors une fonction convexe au sens de la dĂ©finition 1. Les deux transformations sont rĂ©ciproques l'une de l'autre : les deux dĂ©finitions, quoique techniquement distinctes, dĂ©crivent bien la mĂŞme notion.

Certaines sources requièrent de plus que C soit non-vide (dans la définition 1) ou que f ne soit pas la constante +\infty (dans la définition 2) pour prévenir certaines exceptions désagréables dans quelques énoncés[4].

La dĂ©finition 2 est plus rĂ©cente que la dĂ©finition 1 et fut introduite indĂ©pendamment par Rockafellar et Moreau[5]. Elle permet de dĂ©finir une fonction convexe comme un seul « objet Â» (une fonction dĂ©finie sur un espace vectoriel ayant une propriĂ©tĂ© bien particulière) et non comme un couple formĂ© d'un ensemble convexe d'un espace vectoriel et d'une fonction Ă  valeurs rĂ©elles dĂ©finie sur cet ensemble convexe. La dĂ©finition 2 est la plus communĂ©ment utilisĂ©e an analyse convexe, pour les raisons suivantes : d'une part, elle allège souvent l'expression des rĂ©sultats et, d'autre part, elle permet de ne pas devoir prĂ©ciser le convexe sur lequel est dĂ©finie une fonction convexe obtenue par l'une des constructions standards de l'analyse convexe, comme l'enveloppe supĂ©rieure, la fonction d'appui, la fonction marginale, la fonction duale en optimisation, etc.

Stricte convexité[modifier | modifier le code]

Soient E un espace vectoriel (ou affine) réel et f:E\to\R\cup\{+\infty\} une fonction. On dit que f est strictement convexe si, pour tous x_0 et x_1\in\operatorname{dom}f, avec x_0\ne x_1, et tout t\in{]0,1[}, on a


f((1-t) x_0+tx_1) < (1-t) f(x_0)+t f(x_1).

Forte convexité[modifier | modifier le code]

Soit (\mathbb{E},\|\cdot\|) un espace normé. On dit que f:\mathbb{E}\to\R\cup\{+\infty\} est fortement convexe, de module \alpha>0, si pour tout x_0 et x_1 dans le domaine de f et pour tout t\in[0,1]\subset\R, on a


f((1-t)x_0+tx_1)\leq(1-t)f(x_0)+tf(x_1)-\frac{\alpha}{2}\,t(1-t)\|x_0-x_1\|^2.

On retrouve la notion de fonction convexe lorsque \alpha=0.

Exemples de fonctions convexes[modifier | modifier le code]

Voici quelques exemples de constructions de fonctions convexes :

  • fonction affine,
  • fonction convexe polyĂ©drique dont l'Ă©pigraphe est un polyèdre convexe,
  • fonction d'appui d'un ensemble,
  • fonction indicatrice d'un ensemble convexe,
  • fonction marginale dont les valeurs sont obtenues en minimisant une seconde fonction paramĂ©trĂ©e par ses arguments,
  • fonction sous-linĂ©aire.

Voici des exemples concrets de fonctions convexes :

  • la fonction quadratique x\in\R^n\mapsto\textstyle\frac{1}{2}x^\top Ax-b^\top x est convexe si, et seulement si, la matrice A\in\R^{n\times n} est semi-dĂ©finie positive ; elle est strictement convexe si, et seulement si, A est dĂ©finie positive,
  • la fonction log-det : X\in\mathcal{S}^n_{++}\mapsto-\log\det X est strictement convexe (\mathcal{S}^n_{++} dĂ©signe l'ensemble des matrices symĂ©triques d'ordre n dĂ©finies positives).

Propriétés élémentaires[modifier | modifier le code]

Une proportion significative de rĂ©sultats valables pour des fonctions convexes d'une variable se reproduisent Ă  l'identique pour des fonctions convexes sur une partie d'un espace vectoriel, soit qu'on se ramène pour les prouver Ă  considĂ©rer la restriction de la fonction Ă  une droite, soit que la dĂ©monstration soit une simple rĂ©vision de la version Ă  une variable. En voici quelques-unes :

  • Dans un espace vectoriel topologique, une fonction qui vĂ©rifie l'inĂ©galitĂ© de convexitĂ© pour les seuls milieux et qui est continue est convexe.
  • Une fonction convexe vĂ©rifie l'inĂ©galitĂ© de Jensen.


Minorante affine[modifier | modifier le code]

La technique de minoration des fonctions convexes par des fonctions affines est une variante adaptée à l'analyse de l'utilisation des hyperplans d'appui en géométrie convexe. La forme analytique du théorème de Hahn-Banach permettrait de minorer directement une fonction convexe définie (et à valeurs finies) sur la totalité de son espace de départ. En revanche, dès que la fonction n'est pas définie partout, il faut poser quelques restrictions techniques[6].

Proposition â€” Soit E un espace vectoriel topologique, f une fonction convexe et continue dĂ©finie sur un ouvert convexe non vide U de E et x_0 un point de U. Il existe alors une fonction affine continue qui minore f et qui coĂŻncide avec elle en x_0.

On verra un peu plus bas que l'hypothèse de continuitĂ© est superflue en dimension finie (c'est une consĂ©quence de la convexitĂ©). En revanche, la condition topologique sur U est indispensable, mĂŞme en une seule variable : pour la fonction convexe f(x) = -\sqrt{1-x^2} sur [-1,1] (dont le graphe est un demi-cercle) et x_0=1, on ne peut trouver de fonction affine minorante au sens de la proposition prĂ©cĂ©dente.

Reconnaître une fonction convexe par ses dérivées[modifier | modifier le code]

Utilisation des dérivées premières[modifier | modifier le code]

Voici un premier rĂ©sultat permettant de reconnaĂ®tre la convexitĂ© d'une fonction au moyen de ses dĂ©rivĂ©es premières. On note f'(x)\cdot v la valeur que prend l'opĂ©rateur linĂ©aire continu qu'est la dĂ©rivĂ©e f'(x)\in\mathcal{L}(\mathbb{E},\R) sur le vecteur v\in\mathbb{E}. Le point 2 ci-dessous signifie que y\mapsto f(x) + f'(x)\cdot(y-x) est une minorante affine de f, exacte en x ; le point 3 exprime la monotonie de de la dĂ©rivĂ©e.

ConvexitĂ© et dĂ©rivĂ©es premières â€” Soient \mathbb{E} un espace normĂ©, \Omega un ouvert convexe de \mathbb{E} et f: \Omega \to \R une fonction dĂ©rivable. Alors, les propriĂ©tĂ©s suivantes sont Ă©quivalentes :

  1. f est convexe sur \Omega,
  2. \forall\, x,y\in\Omega : f(y) \geqslant f(x) + f'(x)\cdot(y-x),
  3. \forall\, x,y\in\Omega : (f'(y)-f'(x))\cdot(y-x)\geqslant 0.

Un résultat analogue permet de caractériser la stricte convexité d'une fonction. Il suffit de remplacer les inégalités ci-dessus par des inégalités strictes et de supposer que les points d'évaluation x et y diffèrent.

Stricte convexitĂ© et dĂ©rivĂ©es premières I â€” Soient \mathbb{E} un espace normĂ©, \Omega un ouvert convexe de \mathbb{E} et f: \Omega \to \R une fonction dĂ©rivable. Alors, les propriĂ©tĂ©s suivantes sont Ă©quivalentes :

  1. f est strictement convexe sur \Omega,
  2. \forall\, x,y\in\Omega, x\ne y : f(y) > f(x) + f'(x)\cdot(y-x),
  3. \forall\, x,y\in\Omega, x\ne y : (f'(y)-f'(x))\cdot(y-x)> 0.

En dimension finie, les inégalités ci-dessus peuvent être renforcées[7]. On y a noté B:=\{x\in\mathbb{E}:\|x\|\leqslant1\} la boule unité fermée et \beta B:=\{x\in\mathbb{E}:\|x\|\leqslant\beta\}.

Stricte convexitĂ© et dĂ©rivĂ©es premières II â€” Soient \mathbb{E} un espace vectoriel de dimension finie, f:\mathbb{E}\to\R une fonction de classe C^1 et t\in{]0,1[}. Alors les propriĂ©tĂ©s suivantes sont Ă©quivalentes :

  1. f est strictement convexe,
  2. pour tout \beta>0, il existe une fonction g_\beta:[0,2\beta]\to\R_+ continue, strictement croissante, vérifiant g_\beta(0)=0 et
    \forall\,x, y\in\beta B:\quad f(y)-f(x)\geqslant f'(x)\cdot(y-x)+(1-t)g_\beta(t\|y-x\|),
  3. pour tout \beta>0, il existe une fonction g_\beta:[0,2\beta]\to\R_+ continue, strictement croissante, vérifiant g_\beta(0)=0 et
    \forall\,x, y\in\beta B:\quad (f'(y)-f'(x))\cdot(y-x)\geqslant g_\beta(\|y-x\|).

On peut enfin caractériser la forte convexité au moyen des dérivées premières.

Forte convexitĂ© et dĂ©rivĂ©es premières â€” Soient \mathbb{E} un espace euclidien, \Omega un ouvert convexe de \mathbb{E} et f: \Omega \to \R une fonction dĂ©rivable. Alors, les propriĂ©tĂ©s suivantes sont Ă©quivalentes :

  1. f est fortement convexe sur \Omega,
  2. \forall\, x,y\in\Omega : f(y) \geqslant f(x) + f'(x)\cdot(y-x)+\frac{\alpha}{ 2}\|y-x\|^2,
  3. \forall\, x,y\in\Omega : (f'(y)-f'(x))\cdot(y-x)\geqslant \alpha\|y-x\|^2.

Utilisation des dérivées secondes[modifier | modifier le code]

On note ci-dessous f''(x)\cdot (u,v) la valeur réelle que prend l'opérateur bilinéaire continu qu'est la dérivée seconde f''(x)\in\mathcal{L}_2(\mathbb{E},\R) sur le couple de vecteurs (u,v)\in\mathbb{E}^2. On note alors f''(x)\cdot v^2:=f''(x)\cdot (v,v), pour simplifier.

ConvexitĂ© et dĂ©rivĂ©es secondes â€” Soient \mathbb{E} un espace normĂ©, \Omega un ouvert convexe de \mathbb{E} et f: \Omega \to \R une fonction deux fois dĂ©rivable. Alors f est convexe sur \Omega si, et seulement si,


\forall\, x \in \Omega,~~
\forall\, d \in \mathbb{E}:\quad
f''(x) \cdot d^2 \geqslant 0.

D'autre part, si


\forall\, x \in \Omega,~~ \forall\, d \in \mathbb{E}\setminus\{0\}:\quad
f''(x) \cdot d^2 > 0,

alors f est strictement convexe sur \Omega.

La seconde condition peut ne pas être vérifiée par une fonction strictement convexe. Par exemple, f:\R\to\R:x\mapsto x^4 est strictement convexe, mais f''(0)=0.

Fonctions convexes en dimension finie[modifier | modifier le code]

Problèmes de continuité[modifier | modifier le code]

Continuité sur un ouvert[modifier | modifier le code]

Comme en dimension 1, une fonction convexe dĂ©finie sur un ouvert de \R^n est forcĂ©ment continue en tout point de l'ouvert. La dĂ©monstration va nous donner une information plus prĂ©cise[8] :

ThĂ©orème â€” Une fonction convexe dĂ©finie (et Ă  valeurs finies) sur un ouvert de \R^n est localement lipschitzienne, et donc continue.

Discontinuités au bord[modifier | modifier le code]

À une variable, sur un intervalle non ouvert, on a vu qu'une fonction convexe n'était pas nécessairement continue.

NĂ©anmoins il est possible de la rendre continue par un procĂ©dĂ© simple : si f est convexe sur un intervalle [a,b], alors nĂ©cessairement la limite Ă  droite f^+(a) de f en a existe et est infĂ©rieure ou Ă©gale Ă  la valeur f(a). La discontinuitĂ© de f en la borne a se produit alors dans le cas oĂą f^+(a)<f(a). On peut s'en dĂ©mĂŞler en modifiant simplement la valeur de f en ce point : il suffit de la diminuer et la remplacer par f^+(a)[9].

Dès la dimension 2, les choses ne sont pas aussi confortables, comme le montre l'exemple suivant :

Soit C le disque-unitĂ© fermĂ© de \R^2 ; considĂ©rons la fonction f dĂ©finie sur C par :

\left\{\begin{matrix}f(x,y)&=&\displaystyle{x^2\over{y+1}}&\mbox{si }(x,y)\not=(0,-1)\\ f(0,-1)&=&0&\\ \end{matrix}\right.

Cette fonction f est convexe. Elle est toutefois discontinue au point (0,-1) mais ici la discontinuitĂ© ne peut ĂŞtre levĂ©e par une simple modification de la valeur f(0,-1). On constate en effet que si on tend radialement vers ce point, la fonction Ă©tant nulle sur le rayon, f(0,y) tend vers 0 ; mais un calcul facile permet de constater que, si on tend vers (0,-1) le long du cercle frontière de C, f(x,y) tend vers 2. Toutes les valeurs comprises entre 0 et 2 sont d'ailleurs valeurs d'adhĂ©rence de f au point (0,-1) et il est dĂ©finitivement illusoire d'espĂ©rer rendre cette f continue en modifiant ses valeurs sur le bord[10].

Toutefois, si l'ensemble de dĂ©finition est un polytope, les choses se passent comme sur les intervalles de \R, comme on peut le voir en appliquant le thĂ©orème suivant[11] :

ThĂ©orème â€” Une fonction convexe bornĂ©e dĂ©finie sur l'intĂ©rieur d'un polytope admet un prolongement convexe continu au polytope.

Fermeture d'une fonction convexe[modifier | modifier le code]

Une fois qu'on a compris qu'il est vain de vouloir modifier une fonction convexe f sur la frontière de son domaine de définition jusqu'à la rendre continue, on peut néanmoins choisir un jeu de valeurs sur cette frontière plus remarquable que les autres, en exigeant que le prolongement soit à la fois semi-continu inférieurement (ce qui nécessite de choisir des valeurs faibles) et convexe (ce qui nécessite de les prendre fortes).

Pour Ă©crire l'Ă©noncĂ© assez confortablement, il est ici particulièrement appropriĂ© d'utiliser des fonctions dĂ©finies sur tout \R^n et prenant Ă©ventuellement la valeur +\infty ; on appellera domaine effectif d'une telle fonction convexe l'ensemble des points oĂą elle prend une valeur finie.

ThĂ©orème â€” Soit f une fonction convexe de domaine effectif D_f\subset \R^n. On note \overline f la fonction dĂ©finie en x\in\R^n par :


\overline f(x):=\liminf_{y\to x} f(y).

La fonction \overline f est alors caractĂ©risĂ©e par l'une au choix des trois propriĂ©tĂ©s suivantes :

  1. \overline f coĂŻncide avec f en les points qui ne sont pas sur la frontière relative de D_f\, ; elle est convexe et semi-continue infĂ©rieurement ;
  2. \overline f coĂŻncide avec f en les points qui ne sont pas sur la frontière relative de D_f et, pour tout point x de la frontière relative de D_f et tout segment semi-ouvert ]x,z] inclus dans l'intĂ©rieur relatif de D_f, f(x)=\lim_{\stackrel{y\to x}{y\in]x,z]}}f(y) ;
  3. \overline f a pour épigraphe l'adhérence de l'épigraphe de f.

La fonction \overline f est appelĂ©e la fermeture de f. Les fonctions convexes Ă©gales Ă  leur fermeture sont appelĂ©es des fonctions convexes fermĂ©es ; dit autrement ce sont les fonctions convexes dont l'Ă©pigraphe est fermĂ©, ou encore autrement dit ce sont les fonctions convexes semi-continues infĂ©rieurement[12].

Fonction Ă  valeurs vectorielles[modifier | modifier le code]

On peut aussi introduire une notion de convexité pour les fonctions à valeurs vectorielles, pourvu que l'on se donne un cône dans l'espace d'arrivée de la fonction.

De façon plus précise, on suppose donnés deux espaces vectoriels \mathbb{E} et \mathbb{F}, un convexe C\subset\mathbb{E} et un cône pointé convexe K\subset\mathbb{F}. On dit que F:C\to\mathbb{F} est K-convexe si pour tous x_0 et x_1\in C et pour tout t\in[0,1], on a


F((1-t)x_0+tx_1)\in(1-t)F(x_0)+tF(x_1)-K.

Par les propriétés supposées de K, l'ensemble des fonctions K-convexes est un cône convexe de l'ensemble des fonctions de \mathbb{E} dans \mathbb{F} (parce que K est un cône convexe), contenant les fonctions affines (parce que K est pointé).

Si le cône K est également saillant, il induit sur \mathbb{F} un ordre partiel, noté \leqslant_K et défini par


y_1\leqslant_K y_2
\qquad\Longleftrightarrow\qquad
y_2-y_1\in K.

Alors l'expression ci-dessus de la K-convexité de F s'écrit aussi


F((1-t)x_0+tx_1)\leqslant_K (1-t)F(x_0)+tF(x_1),

ce qui rappelle l'inégalité de convexité familière.

Applications en physique[modifier | modifier le code]

L'analyse convexe trouve un grand nombre d'applications en physique, lorsque les potentiels énergétiques sont localement convexes (existence de solutions stables, de changements de phase). En homogénéisation, par exemple, les théories de type variationnel permettent d'estimer les solutions d'équations aux dérivées partielles elliptiques grâce à la représentation des potentiels énergétiques par transformée de Legendre. La transformée de Legendre, formulation mathématique qui représente une fonction convexe par l'ensemble de ses tangentes, permet le développement de méthodes de linéarisation[13].

Annexes[modifier | modifier le code]

Notes[modifier | modifier le code]

Les ouvrages mentionnés par des lettres entre crochets dans ces références sont ceux cités dans la section bibliographique.

  1. ↑ Ce rĂ©sultat est mentionnĂ© par [NP] p. 10, qui l'attribuent Ă  Johan Jensen et renvoient Ă  son article « Sur les fonctions convexes et les inĂ©galitĂ©s entre les valeurs moyennes Â», Acta Mathematica vol. 30 (1906), p. 175-193. La deuxième preuve ci-dessous est celle fournie dans [N-P].
  2. ↑ Ce rĂ©sultat est citĂ© par [N-P], p. 20-21, qui l'attribuent Ă  L. Calvani, renvoyant Ă  son article « Sulle funzioni converse di una o due variablili definite in aggregate qualunque Â», Rend. Circ. Mat. Palermo, vol. 41 (1916), p. 103-134.
  3. ↑ Voir [N-P], p. 21. Cet ouvrage attribue le théorème de dérivabilité à gauche et à droite à Otto Stolz, renvoyant à son traité Grundzüge der Differential und Integralrechnung, vol. 1, Teubner, Leipzig, 1893.
  4. ↑ Pour l'ensemble de cette sous-section, voir [H-L], p.74 à 76.
  5. ↑ Selon ce qu'en dit R.T. Rockafellar dans le CIM Bulletin.
  6. ↑ La proposition qui suit est énoncée dans [N-P], p. 114 (sous l'hypothèse d'un espace E normé, qui ne joue pas un rôle essentiel dans la preuve).
  7. ↑ Lemmes 1.1 et 1.2, pages 61 et 63chez Glowinski, Lions, Tremolières (1976).
  8. ↑ [H-L], p. 102-104, la minoration de la fonction convexe ayant été adaptée au vu de [N-P], p. 119.
  9. ↑ Ces remarques sont disponibles, avec leurs preuves et quelques détails, dans [N-P], p. 22.
  10. ↑ L'exemple figure dans [H-L] p. 105, avec l'explication de la convexité de f.
  11. ↑ Ce thĂ©orème est citĂ© sans dĂ©monstration par [N-P], p. 123, qui renvoie Ă  D. Gale, V. Klee et R.T. Rockafellar, « Convex functions on convex polytopes Â», Proceedings of the American Mathematical Society, vol. 19 (1968), p. 867-873.
  12. ↑ Pour l'ensemble de cette sous-sous-section, voir [H-L], p.79-80. [N-P], p. 122, mentionne également ces résultats en les attribuant à Werner Fenchel, renvoyant à Convex cones, sets and fucnctions, Princeton University Press, 1951.
  13. ↑ Voir pour un aperçu § 4 in Ivar Ekeland, Roger Temam, SIAM, 1999, Convex Analysis and Variational Problems, ISBN 0-89871-399-4.

Articles connexes[modifier | modifier le code]

  • Fonction concave
  • Fonction convexe-concave
  • Fonction logarithmiquement convexe
  • Fonction quasi-convexe

Voir aussi[modifier | modifier le code]

Sur les autres projets Wikimedia :

Bibliographie[modifier | modifier le code]

  • R. Glowinski, J. L. Lions, R. Tremolières (1976). Analyse NumĂ©rique des InĂ©quations Variationnelles - Tome 1: ThĂ©orie GĂ©nĂ©rale, Premières Applications. Dunod-Bordas, Paris.
  • (en) [H-L] - Jean-Baptiste Hiriart-Urruty et Claude LemarĂ©chal, Fundamentals of convex analysis, coll. « Grundlehren Text Editions Â», Springer, 2001 (ISBN 3540422056)
  • (en) [N-P] - Constantin Nicolescu et Lars-Erik Persson, Convex Functions and their Applications : A Contemporary Approach, coll. « Ouvrages de mathĂ©matiques de la SociĂ©tĂ© mathĂ©matique du Canada Â», vol. 23, Springer, 2006 (ISBN 978-0387243009)
  • (en) R. Tyrrell Rockafellar, Convex Analysis, Princeton University Press, 1970, ISBN 0-691-01586-4.
wikipediaCet article est issu de l'encyclopédie libre Wikipedia.
Vous pouvez consulter l'article ici ainsi que son historique.
Les textes et les images sont disponibles sous les termes de la Licence de documentation libre GNU.


maths - prof de maths - cours particuliers haut de pagehaut Retrouvez cette page sur ilemaths l'île des mathématiques
© Tom_Pascal & Océane 2014