logo

Loi de probabilité


Loi de probabilité : encyclopédie mathématiques

wikipediaCet article est issu de l'encyclopédie libre Wikipedia.
Vous pouvez consulter l'article ici ainsi que son historique.
Les textes et les images sont disponibles sous les termes de la Licence de documentation libre GNU.
Page d'aide sur l'homonymie Pour les articles homonymes, voir Loi (homonymie).
ReprĂ©sentation de trois lois de probabilitĂ©. En rouge, fonction de densitĂ© d'une loi Ă  densitĂ© : la loi normale, dite courbe de Gauss. En bleue, fonction de masse d'une loi discrète : la loi gĂ©omĂ©trique. En verte, loi mixte avec une partie discrète donnĂ©e par un atome en -5 et une partie Ă  densitĂ© donnĂ©e par une loi normale tronquĂ©e.

En théorie des probabilités et en statistique, une loi de probabilité décrit le comportement aléatoire d'un phénomène dépendant du hasard. L'étude des phénomènes aléatoires a commencé avec l'étude des jeux de hasard. Jeux de dés, tirage de boules dans des urnes, jeu de pile ou face, ont été des motivations pour comprendre et prévoir les expériences aléatoires. Ces premières approches sont des phénomènes discrets, c'est-à-dire dont le nombre de résultats possibles est fini, ou au plus dénombrable. Certaines questions ont cependant fait apparaitre des lois à support infini non dénombrable, par exemple lorsque l'on effectue un nombre infini de tirages de pile ou face, la répartition du nombre de pile obtenu se conduit comme une loi normale.

Le concept de loi de probabilité se formalise mathématiquement par des mesures, ainsi que des variables aléatoires discrètes ou continues. Le cas continu correspond à la théorie de l'intégration, alors que le cas discret fait apparaitre des calculs de sommes et de séries. Des fonctions particulières permettent de caractériser les lois de probabilité, par exemple la fonction de répartition, la fonction caractéristique, etc. Il existe également une théorie plus générale des lois de probabilité en tant que mesures finies de masse unitaire.

Des fluctuations ou de la variabilitĂ© sont prĂ©sentes dans presque toute valeur qui peut ĂŞtre mesurĂ©e dans un phĂ©nomène ; de plus presque toutes les mesures ont une part d'erreur intrinsèque. Les lois de probabilitĂ©s permettent de modĂ©liser ces incertitudes et de dĂ©crire des phĂ©nomènes physiques, biologiques, Ă©conomiques, etc. Le domaine de la statistique permet de trouver des lois de probabilitĂ©s adaptĂ©es aux phĂ©nomènes alĂ©atoires.

Il existe beaucoup de lois de probabilités différentes. Une loi importante est la loi normale, elle approche le comportement asymptotique de nombreuses lois de probabilités puisque qu'elle apparait dans le théorème central limite. D'autres lois sont plus complexes, certaines lois réelles sont ni discrètes, ni continues.

Sommaire

[modifier] Définition informelle

Une loi de probabilitĂ© dĂ©crit de manière thĂ©orique le caractère alĂ©atoire d'une expĂ©rience qui est considĂ©rĂ© comme alĂ©atoire[1],[2]. « La notion d'"expĂ©rience alĂ©atoire" est dĂ©gagĂ©e pour dĂ©signer un processus rĂ©el de nature expĂ©rimentale, oĂą le hasard intervient, avec des issues possibles bien identifiĂ©es[3]. Â». Par exemple, lors d'un jetĂ© de dĂ© (c'est l'Ă©vènement alĂ©atoire), le rĂ©sultat est un chiffre de 1 Ă  6, et il est gĂ©nĂ©ralement admis que chaque rĂ©sultat a la mĂŞme chance d'apparaĂ®tre, la loi de probabilitĂ© est donc : chacun des 6 chiffres est Ă©quiprobable avec probabilitĂ© 1/6.

Historiquement, les lois de probabilitĂ© ont Ă©tĂ© Ă©tudiĂ©es dans les jeux de hasard : jeux de dĂ©s, jeux de cartes, etc. Les rĂ©sultats possibles de ces phĂ©nomènes sont en nombre fini, la loi de probabilitĂ© est dite discrète. Donner la loi de probabilitĂ© revient Ă  donner la liste des valeurs possibles avec leurs probabilitĂ©s associĂ©es[4]. Elle est alors donnĂ©e sous forme de formule, de tableau de valeurs, d'arbre de probabilitĂ©, ou de fonctions (dĂ©taillĂ©es dans les sections suivantes).

Dans un contexte plus général, c'est-à-dire dans le cas où le nombre de valeurs possibles du phénomène aléatoire n'est pas fini mais infini (dénombrable ou non), la loi de probabilité décrit toujours la répartition des chances pour des résultats possibles mais est caractérisée par des fonctions (densité de probabilité, fonction de répartition, entre autres) ou plus généralement par des mesures.

[modifier] Historique

La planche de Galton, imaginée en 1889, permet de visualiser la courbe de Gauss comme loi limite.
Article dĂ©taillĂ© : ProbabilitĂ©.

L'utilisation du hasard existe depuis l'antiquitĂ© notamment dans les jeux de hasard, les paris sur les risques des transports maritimes ou les rentes viagères[5]. Cependant une des premières rĂ©fĂ©rences connues Ă  des calculs de probabilitĂ©s est un calcul Ă©lĂ©mentaire sur La Divine ComĂ©die qui n'apparait qu'au XVe siècle pendant la Renaissance[6]. Les premiers traitĂ©s commencent Ă  former le dĂ©but de la thĂ©orie des probabilitĂ©s, principalement basĂ©e sur des probabilitĂ©s combinatoires. les problèmes se posent ainsi, Ă  propos de la durĂ©e d'un jeu de carte :

« Sur la durĂ©e des parties que l'on joue en rabattant... On demande combien il y a Ă  parier que la partie qui peut durer Ă  l'infini sera finie en un certain nombre dĂ©terminĂ© de coups au plus. Â»

— Essay, de Montmort, 1713[7]

On reconnait ici la probabilité (à parier) qu'une variable (la durée de la partie) soit plus petite qu'une valeur (certain nombre déterminé), il s'agit de la fonction de répartition de la loi de probabilité de la durée d'une partie.

C'est dans la thèse de Nicolas Bernoulli, publiĂ©e en 1711, qu'apparait pour la première fois la loi uniforme[8]. Certaines autres lois font alors leurs apparition comme la loi binomiale ou la loi normale mĂŞme si leurs approches ne sont pas complètement rigoureuses[8]. Par exemple, la loi normale est construite par Abraham de Moivre grâce Ă  la courbe de Gauss par une approximation numĂ©rique[9]. Au XVIIIe siècle, d'autres idĂ©es liĂ©es aux lois de probabilitĂ© Ă©mergent Ă©galement[8] comme l'espĂ©rance d'une variable alĂ©atoire discrète avec Jean le Rond D'Alembert ou les probabilitĂ©s conditionnelles avec Thomas Bayes. Quelques lois de probabilitĂ©s continues sont Ă©noncĂ©es dans un mĂ©moire de Joseph-Louis Lagrange en 1770[8].

La définition formelle des mesures de probabilités commence en 1896 avec une publication de Émile Borel[10] et va continuer avec plusieurs autres mathématiciens tels que Henri-Léon Lebesgue, Maurice René Fréchet, Paul Lévy et notamment Andreï Kolmogorov qui formula les axiomes des probabilités en 1933.

L'utilisation rigoureuse des lois de probabilitĂ©s a pu alors se dĂ©velopper au dĂ©but du XXe siècle dans des sciences appliquĂ©es telles que la biomĂ©trie avec Karl Pearson par exemple[11] ou la physique statistique avec Ludwig Boltzmann[12].

[modifier] Définition mathématique

En théorie des probabilités, une loi de probabilité est une mesure positive \scriptstyle\ \mathbb{P}\ sur un espace mesurable \scriptstyle\ (\Omega, \mathcal A)\ , telle que \scriptstyle\ \mathbb{P}(\Omega) = 1. Le triplet \scriptstyle\ (\Omega, \mathcal A,\, \mathbb{P})\ est appelé espace probabilisé. Une loi de probabilité est également appelée mesure de probabilité dans le cas d'une approche plutôt théorique, ou distribution de probabilité pour une étude plus appliquée[13].

Une manière usuelle d'expression d'une loi est l'utilisation d'une variable aléatoire puisque, pour toute loi de probabilité \scriptstyle\ \mathbb{P}\ sur \scriptstyle\ (\Omega, \mathcal A)\ , il existe[14] une variable aléatoire X définie sur un espace probabilisé (potentiellement différent de \scriptstyle\ (\Omega, \mathcal A)\ ) et de loi \scriptstyle\ \mathbb{P}\ .

Les lois les plus couramment Ă©tudiĂ©es en thĂ©orie des probabilitĂ©s sont les lois Ă  valeurs rĂ©elles ; elles peuvent ĂŞtre reprĂ©sentĂ©es Ă  l'aide d'une variable alĂ©atoire rĂ©elle par la dĂ©finition suivante.

DĂ©finition[15] â€” Soit une variable alĂ©atoire rĂ©elle sur l'espace probabilisĂ© \scriptstyle\ (\Omega, \mathcal A,\, \mathbb{P}), c'est-Ă -dire une fonction mesurable \scriptstyle\ X : (\Omega,\mathcal A) \to (\mathbb R,\mathcal B_{\mathbb R}).
La loi de probabilitĂ© de la variable alĂ©atoire \scriptstyle\ X\ est la mesure de probabilitĂ©, notĂ©e \ \scriptstyle\mathbb{P}_X\ , dĂ©finie sur l'espace mesurable \ \scriptstyle(\R,\, \mathcal B_\R) par :

\mathbb{P}_X(B) = \mathbb{P}\left(X^{-1}(B)\right) = \mathbb{P}\left(X\in B\right),

pour tout borĂ©lien \ \scriptstyle B\in \mathcal B_{\mathbb R}. Autrement dit, \ \scriptstyle\mathbb{P}_X\ est la mesure image (en) de \scriptstyle\ \mathbb{P}\ par \scriptstyle\ X\ .

Ainsi, pour définir la loi d'une variable aléatoire, on transporte la loi de probabilité \scriptstyle \mathbb P sur \scriptstyle \Omega en une mesure \scriptstyle \mathbb P_X sur \scriptstyle \mathbb R.

La reprĂ©sentation d'une loi par une variable alĂ©atoire n'est pas unique[16]. Autrement dit, deux variables alĂ©atoires diffĂ©rentes, ou mĂŞme dĂ©finies sur des espaces diffĂ©rents, peuvent avoir la mĂŞme loi. Deux variables alĂ©atoires rĂ©elles \scriptstyle\ X\ et \scriptstyle\ Y\ ont mĂŞme loi si \ \scriptstyle\mathbb{P}_X\ =\ \scriptstyle\mathbb{P}_Y\ (en terme d'Ă©galitĂ© de mesures). C'est-Ă -dire : \scriptstyle \mathbb{P}_X(B)\ = \mathbb{P}_Y(B) pour tout borĂ©lien B. Le thĂ©orème suivant permet d'utiliser une autre caractĂ©risation :

ThĂ©orème de transfert[14] (ou de transport[17]) â€” Soit une variable alĂ©atoire rĂ©elle \scriptstyle\ X : \Omega \to\R.\ Alors,

\mathbb{E}\left[\phi(X)\right] \stackrel{def}{=} \int_\Omega~\phi(X(\omega))~\mathbb{P}(d\omega) = \int_\R~\phi(x)~\mathbb{P}_X(dx),

pour toute fonction \scriptstyle\ \phi\ de \scriptstyle\ \R\ dans \scriptstyle\ \R\ telle qu'au moins une des deux intégrales ait un sens.

L'intégrale apparaissant dans le dernier terme est l'intégrale, au sens de la théorie de la mesure, de la fonction φ par rapport à la mesure \scriptstyle\mathbb{P}_X.\ Cette intégrale prend la forme d'une somme ou d'une intégrale dans les deux cas classiques de lois discrètes et de lois à densité, voir les sections ci-dessous.

Ainsi, deux variables alĂ©atoires rĂ©elles \scriptstyle\ X\ et \scriptstyle\ Y\ ont mĂŞme loi si : \scriptstyle \mathbb{E}\left[\phi(X)\right]\ = \mathbb{E}\left[\phi(Y)\right] pour toute fonction \scriptstyle\ \phi:\mathbb R \rightarrow \mathbb R telle qu'au moins un des deux termes de l'Ă©galitĂ© ait un sens.

[modifier] Loi multidimensionnelle

Loi normale bidimensionnelle, ou produit de deux lois normales unidimensionnelles.
Article dĂ©taillĂ© : Distribution marginale.

Intuitivement, une loi de probabilité est dite multidimensionnelle, ou n-dimensionnelle[18], lorsque la loi décrit plusieurs valeurs (aléatoires) d'un phénomène aléatoire. Par exemple lors du jet de deux dés, la loi de probabilité des deux résultats obtenus est une loi bidimensionnelle. Le caractère multidimensionnel apparait ainsi lors du transfert, par une variable aléatoire, de l'espace probabilisé \scriptstyle (\Omega,\mathcal A) vers un espace numérique \scriptstyle E^n de dimension n. Dans l'exemple des deux dés, la dimension est n=2 et l'espace \scriptstyle E^2 est \scriptstyle \{1,\dots,6\}\times \{1,\dots,6\}. La loi est également appelée loi jointe[19].

Un exemple important de loi multidimensionnelle est la loi de probabilité produit \scriptstyle \mathbb P=\mathbb P_1\otimes \mathbb P_2 où \scriptstyle \mathbb P_1 et \scriptstyle \mathbb P_2 sont deux lois unidimensionnelles. Cette loi de probabilité est la loi d'un couple de variables aléatoires indépendantes[20], c'est le cas de l'exemple des deux dés.

DĂ©finition â€” Soit une variable alĂ©atoire X sur l'espace probabilisĂ© \scriptstyle\ (\Omega, \mathcal A,\, \mathbb{P}), Ă  valeurs dans \scriptstyle\mathbb{R}^n muni de la tribu borĂ©lienne produit \scriptstyle\ \mathcal B_{\mathbb R}^{\otimes n}. La loi de la variable alĂ©atoire \scriptstyle\ X\ est la mesure de probabilitĂ© \ \scriptstyle\mathbb{P}_X\ dĂ©finie par :

\mathbb{P}_X(B) = \mathbb{P}\left(X^{-1}(B)\right) = \mathbb{P}\left(X\in B\right),

pour tout \ \scriptstyle B\in \mathcal B_{\mathbb R}^{\otimes n}.

La variable alĂ©atoire X est alors identifiĂ©e[21] Ă  un vecteur alĂ©atoire Ă  n dimensions : \scriptstyle X=(X_1,X_2,\dots,X_n). Le thĂ©orème de Cramer-Wold[22] assure que la loi (n-dimensionnelle) de ce vecteur alĂ©atoire est entièrement dĂ©terminĂ©e par les lois (unidimensionnelles) de toutes les combinaisons linĂ©aires de ces composantes : \scriptstyle \sum_{i=1}^na_iX_i pour tous \scriptstyle a_1,a_2,\dots,a_n.

Les deux coordonnées (dimension 1 et dimension 2) des points s'approchent chacune d'une loi normale. C'est-à-dire qu'il s'agit d'une simulation de loi bidimensionnelle dont les deux lois marginales sont normales.
Cas d'une loi à densité

Une loi bidimensionnelle (ou n-dimensionnelle) est dite[23] Ă  densitĂ© sur \scriptstyle \mathbb R^2 si la loi est absolument continue par rapport Ă  la mesure de Lebesgue sur \scriptstyle \mathbb R^2, c'est-Ă -dire si la loi de la variable alĂ©atoire correspondante s'Ă©crit sous la forme :

\mathbb P(X\in B)=\iint_B f_X(x_1,x_2)dx_1 \, d x_2 pour tout borélien \scriptstyle A\in \mathcal B_{\mathbb R^2}.
Lois marginales

Intuitivement, la loi marginale d'un vecteur alĂ©atoire est la loi de probabilitĂ© d'une de ses composantes. Pour l'obtenir, on projette la loi sur l'espace unidimensionnel de la coordonnĂ©e recherchĂ©e. La loi de probabilitĂ© de la i-ème coordonnĂ©e d'un vecteur alĂ©atoire est appelĂ©e la i-ème loi marginale[24]. La loi marginale \scriptstyle \mathbb P_i de \scriptstyle \mathbb P s'obtient par la formule :

\mathbb P_i(A) = \mathbb P_{X_i}(A) = \iint { 1}_{\omega_i\in A} \mathbb P(\mathrm{d}(\omega_1,\dots,\omega_n)) pour tout borélien \scriptstyle A\in \mathcal B_{\mathbb R}.

Les lois marginales d'une loi à densité s'expriment à l'aide de leurs densités marginales.

[modifier] Loi conditionnelle

Exemple d'utilisation d'une loi conditionnelle : + signifie que l'individu est positif au test de drogue, U signifie que l'individu est consommateur de drogue. Ainsi \scriptstyle \mathbb P(+|U) est la probabilitĂ© que le test soit positif sur un individu consommateur de drogue.
Articles dĂ©taillĂ©s : ProbabilitĂ© conditionnelle et EspĂ©rance conditionnelle.

Intuitivement, une loi de probabilité conditionnelle permet de décrire le comportement aléatoire d'un phénomène lorsque l'on connait une information sur ce processus. Autrement dit, la probabilité conditionnelle permet d'évaluer le degré de dépendance stochastique entre deux évènements[25]. Par exemple, lors d'un lancer de dés, la loi conditionnelle permet de donner la loi de la somme des résultats sachant que l'un des deux dés a donné un résultat d'au moins quatre.

Définition sur les évènements

La probabilitĂ© conditionnelle se dĂ©finit[26], de manière la plus intuitive, sur les Ă©vènements par la probabilitĂ© \scriptstyle \mathbb P_B d'un Ă©vènement A conditionnellement Ă  un autre Ă©vènement B : \scriptstyle \mathbb P_B(A) := \mathbb P(A\cap B)/\mathbb P(B), pour tout A et B de la tribu sous-jacente tels que \scriptstyle \mathbb P(B)\neq 0. La loi de probabilitĂ©[27] \scriptstyle \mathbb P_B(\cdot) est utilisĂ©e dans les probabilitĂ©s et statistique Ă©lĂ©mentaires, pour la formule des probabilitĂ©s totales ou le thĂ©orème de Bayes par exemple.

Définition pour les variables aléatoires

La probabilitĂ© conditionnelle est Ă©galement dĂ©finie pour les variables alĂ©atoires. On Ă©tudie alors la loi d'une variable X conditionnellement Ă  une variable Y. Lorsque \scriptstyle\mathbb P(Y=y)>0, la loi de X sachant Y=y est dĂ©finie par[27] :

\mathbb P(X\in A|Y=y)=\frac{\mathbb P(X\in A , Y=y)}{\mathbb P(Y=y)}.

Cependant cette définition n'est pas valide si la loi de Y est à densité puisque \scriptstyle\mathbb P(Y=y)=0, pour tout y. La définition suivante est valide pour tout couple de variables aléatoires.

DĂ©finition[28] â€”  Soit \scriptstyle(X,Y) un couple de variables alĂ©atoires rĂ©elles. Il existe une loi de probabilitĂ© \scriptstyle \mathbb P^Y, appelĂ©e loi conditionnelle de \scriptstyle X sachant \scriptstyle Y, ou sachant \scriptstyle Y=y, dĂ©finie par, pour toute fonction borĂ©lienne bornĂ©e \scriptstyle\phi :

\mathbb E(\phi(X)|Y) = \int \phi(x) \mathbb P^Y(d\,x) , presque sûrement.

La loi est également notée \scriptstyle \mathcal L(X|Y) ou \scriptstyle \mathcal L(X|Y=y). L'égalité précédente est une égalité entre variables aléatoires[29].

Définition pour les tribus

De manière plus gĂ©nĂ©rale, la loi de probabilitĂ© se dĂ©finit Ă  partir de l'espĂ©rance conditionnelle d'une variable alĂ©atoire X sachant une tribu \scriptstyle \mathcal G. Cette espĂ©rance conditionnelle est l'unique variable alĂ©atoire \scriptstyle \mathcal G-mesurable, notĂ©e \scriptstyle \mathbb E(X|\mathcal G) et vĂ©rifiant[26] : \scriptstyle \mathbb E[Z\mathbb E(X|\mathcal G)]=\mathbb E[ZX] pour toute Z, variable \scriptstyle \mathcal G-mesurable. La loi conditionnelle est alors dĂ©finie par[30] :

\mathbb P(A|\mathcal G)=\mathbb E[1_A|\mathcal G] oĂą 1_A est la fonction indicatrice.
Définition pour les lois à densité

Dans le cas des lois Ă  densitĂ©, il existe une densitĂ© conditionnelle d'une loi par rapport Ă  l'autre, et inversement. Si \scriptstyle (x,y)\mapsto f(x,y) est la densitĂ© de la loi bidimensionnelle, les deux densitĂ©s conditionnelles sont alors donnĂ©es par[31] :

f(x|y)=\frac{f(x,y)}{f_Y(y)}=\frac{f(x,y)}{\int f(x,y)dx} et f(y|x)=\frac{f(x,y)}{f_X(x)}=\frac{f(x,y)}{\int f(x,y)dy}.

Ici, \scriptstyle f_X et \scriptstyle f_Y sont les deux lois marginales de X et Y respectivement. En remplaçant les intégrales par des sommes, on obtient des formules similaires dans le cas où les lois marginales sont discrètes ou lorsque la loi marginale de X est discrète et celle de Y est à densité, ou inversement[32].

[modifier] Loi Ă  valeurs dans un espace de Banach

Puisque \scriptstyle \mathbb R est un espace de Banach, les lois à valeurs dans un espace de Banach généralisent les lois à valeurs réelles. La définition est alors similaire[33].

DĂ©finition â€” Soit une variable alĂ©atoire sur l'espace probabilisĂ© \scriptstyle\ (\Omega, \mathcal A,\, \mathbb{P}) et Ă  valeurs dans un espace de Banach \scriptstyle E muni de la tribu \scriptstyle \mathcal B engendrĂ©e par les ensembles ouverts de \scriptstyle E. La loi de probabilitĂ© de la variable alĂ©atoire \scriptstyle\ X\ est la mesure de probabilitĂ© \ \scriptstyle\mathbb{P}_X\ dĂ©finie sur l'espace mesurable \ \scriptstyle(E, \mathcal B) par :

\mathbb{P}_X(B) = \mathbb{P}\left(X^{-1}(B)\right) = \mathbb{P}\left(X\in B\right),

pour tout \ \scriptstyle B\in\mathcal B .

Pour obtenir de bonnes propriĂ©tĂ©s, il est courant de considĂ©rer des mesures de probabilitĂ©s tendues (en), c'est-Ă -dire qui intuitivement sont concentrĂ©es sur un ensemble compact, et de supposer que l'espace de Banach est sĂ©parable[34].

Un exemple possible d'espace de Banach est l'espace des fonctions continues \scriptstyle \mathcal C(\mathbb R^+,\mathbb R) . Un processus stochastique est une famille de variables alĂ©atoires \scriptstyle (X_t)_{t\in T} indexĂ©es par un ensemble d'indices T. Une dĂ©finition possible de la loi de probabilitĂ© d'un tel processus est la donnĂ©e des lois finies-dimensionnelles[35], c'est-Ă -dire la loi de probabilitĂ© multidimensionnelle des vecteurs \scriptstyle (X_{t_1},X_{t_2},\dots,X_{t_n}) lorsque \scriptstyle t_1,t_2,\dots,t_n\in T. La loi peut alors ĂŞtre Ă©tendue par le thĂ©orème d'extension de CarathĂ©odory pour le processus entier. Prenons l'exemple du mouvement brownien \scriptstyle (B_t)_{t\in \mathbb R_+} qui est Ă  trajectoires continues, sa loi de probabilitĂ© est la mesure de Wiener[36], gĂ©nĂ©ralement notĂ©e W :

W(A)=\mathbb P((B_t)_{t\geq0}\in A) , pour tout A sous-ensemble de \scriptstyle \mathcal C(\mathbb R^+,\mathbb R) .

[modifier] Espace des lois de probabilité

Une loi de probabilitĂ© est une mesure de masse totale unitaire. L'ensemble des lois de probabilitĂ© est donc un sous-espace de l'espace des mesures finies. Cet espace est souvent notĂ©[37] \scriptstyle \mathcal P(\mathbb R) ou \scriptstyle \mathcal M_1(\mathbb R) pour les lois de probabilitĂ© rĂ©elles. Dans la suite de cette section, les propriĂ©tĂ©s de cet espace sont dĂ©taillĂ©es pour les lois de probabilitĂ©s rĂ©elles ; elles sont cependant vraies sur les espaces de Banach.

On peut munir cet espace d'une topologie appelĂ©e la topologie faible[37]. Cette topologie dĂ©finit donc une convergence faible des lois de probabilitĂ© : une suite de lois de probabilitĂ© \scriptstyle (\mathbb P_n,n=1,2\dots) converge faiblement (weakly en anglais) vers une loi de probabilitĂ© \scriptstyle \mathbb P si :

\lim_{n\rightarrow \infty}\int\phi(\omega)\mathbb P_n(d\omega)=\int \phi(\omega)\mathbb P(d\omega) pour toute fonction \phi continue bornée.

La convergence est notĂ©e[37] : \scriptstyle \mathbb P_n \xrightarrow{w} \mathbb P. Cette convergence se rĂ©percute, par le thĂ©orème de transfert, sur les variables alĂ©atoires \scriptstyle (\mathbb X_n,n=1,2\dots) de lois respectives \scriptstyle (\mathbb P_n,n=1,2\dots); la convergence de variables alĂ©atoires est alors appelĂ©e convergence en loi (ou en distribution ou faible) et est notĂ©e \scriptstyle X_n \xrightarrow{\mathcal{L}} X ou \scriptstyle X_n \xrightarrow{\mathcal{D}} X. Si la convergence faible des variables alĂ©atoires est souvent utilisĂ©e, elle ne concerne en fait que leur loi.

L'espace des lois de probabilités muni de cette topologie faible est[38] un espace métrique, complet et séparable (dans le cas d'un espace de Banach également séparable), ce qui en fait un espace polonais.

[modifier] Classification des lois de probabilité sur la droite réelle

Les lois de probabilités les plus courantes dans les applications sont les lois dites discrètes, c'est-à-dire à support fini ou dénombrable, et les lois dites à densité. Il existe cependant des lois de probabilité ni discrètes ni à densité.

[modifier] Lois discrètes

[modifier] Définition

Le support de cette loi discrète est composé des singletons {1}, {3} et {7}, les probabilités associées sont respectivement 0,2, 0,5 et 0,3.

Une loi est dite discrète si son support est un ensemble fini ou infini dĂ©nombrable : \scriptstyle \operatorname{supp}(\mathbb P)=\{x_1,x_2,\dots\}. Dans ce cas, il suffit de dĂ©finir la liste des masses \scriptstyle \mathbb P(\{x_i\})=p_i sur les singletons pour dĂ©finir la loi[15] : \scriptstyle\left((x_1,p_1), (x_2,p_2), \dots  \right). La mesure de probabilitĂ© discrète est alors, par dĂ©finition, une combinaison linĂ©aire finie ou dĂ©nombrable de masses de Dirac[16],[23] : \displaystyle \mathbb P=\sum_{i\in I}p_i\delta_{x_i}.

Une loi discrète peut être représentée par un diagramme en bâtons[13].

Dans le cas où la loi est définie à partir d'une variable aléatoire X, un critère suffisant pour que la loi soit discrète est que l'image \scriptstyle X(\Omega) de X soit un ensemble au plus dénombrable, la loi discrète \scriptstyle \mathbb P_X est alors la loi d'une variable aléatoire discrète[13],[15].

D'un point de vue pratique, les calculs de probabilitĂ©s liĂ©es Ă  une variable alĂ©atoire \scriptstyle\ X\ de loi discrète font alors intervenir des calculs de sommes finies ou de sĂ©ries : \scriptstyle \mathbb{P}\left(X\in A\right)=\sum_{x\in A\cap S}\ \mathbb{P}\left(X=x\right), oĂą \scriptstyle\ S\ est le support de X, c'est-Ă -dire l'ensemble des rĂ©els \scriptstyle\ a\ tels que \scriptstyle\ \mathbb{P}\left(X=a\right)>0. Ceci vient du fait que, dans le cas des variables discrètes, le thĂ©orème de transfert s'exprime sous la forme : \scriptstyle\int_{\mathbb{R}}\phi(x)\mathbb{P}_X(dx)=\sum_{x\in S}\phi(x)\mathbb{P}\left(X=x\right).

[modifier] Exemples

Voici une liste non exhaustive de lois de probabilités discrètes à support fini ou dénombrable.

Masse de Dirac
Article dĂ©taillĂ© : Distribution de Dirac.

La masse de Dirac est la plus simple des lois discrètes au sens où le support de la loi ne contient qu'une valeur[39]. Si une variable aléatoire est de loi de Dirac \scriptstyle \delta_x, alors X vaut x avec une probabilité égale à 1. Cette loi modélise un phénomène déterministe (non aléatoire) puisque le résultat de l'expérience est (presque sûrement) égal à la valeur connue x.

Loi uniforme discrète
Article dĂ©taillĂ© : Loi uniforme discrète.

La loi uniforme discrète modĂ©lise un phĂ©nomène alĂ©atoire dont les rĂ©sultats sont Ă©quiprobables. C'est le cas,par exemple, d'un lancer d'un dĂ©. Si le support de la loi est l'ensemble Ă  n Ă©lĂ©ments \scriptstyle \{x_1,x_2,\dots, x_n\} , alors la loi est dĂ©finie par : \scriptstyle \mathbb P(X = x_1) = \mathbb P(X = x_2) = ... =\scriptstyle \mathbb P(X = x_n)=1/n. Cette loi ne dĂ©pend que du cardinal fini n du support.

La mesure de probabilitĂ© s'Ă©crit : \scriptstyle \mathbb P=\frac{1}{n}\delta_{x_1}+\frac{1}{n}\delta_{x_2}+ \dots + \frac{1}{n}\delta_{x_n}, oĂą \scriptstyle\delta est la mesure de Dirac.

Loi de Bernoulli
Article dĂ©taillĂ© : Loi de Bernoulli.

La loi de Bernoulli correspond à une expérience à deux issues (succès–échec), généralement codées respectivement par les valeurs 1 et 0. La loi est définie par \scriptstyle \mathbb P(X = 1) = 1-\mathbb P(X=0) = p où \scriptstyle p\in[0,1] est la probabilité de succès. Cette loi est [16] \scriptstyle \mathbb P=(1-p)\delta_0 + p\delta_1 et ne dépend que du paramètre p.

Loi binomiale
Article dĂ©taillĂ© : Loi binomiale.

C'est la loi du nombre de succès obtenus Ă  l'issue de n Ă©preuves de Bernoulli indĂ©pendantes de paramètre \scriptstyle p \in [0,1], autrement dit c'est la somme de n variables alĂ©atoires de loi de Bernoulli. Cette loi Ă  support fini est dĂ©finie par : \scriptstyle \mathbb P(X = k)={n\choose k} p^k(1-p)^{n-k} pour tout \scriptstyle k=0,\dots ,n.

Loi géométrique
Article dĂ©taillĂ© : Loi gĂ©omĂ©trique.

C'est la loi qui modĂ©lise le temps du premier succès dans une sĂ©rie d'Ă©preuves de Bernoulli indĂ©pendantes Ă  probabilitĂ© de succès \scriptstyle p \in [0,1]. Cette loi Ă  support infini dĂ©nombrable est donnĂ©e par : \scriptstyle \mathbb P(X = n)=(1-p)^{n-1}p, \  n\in \mathbb{N}^*. Cette loi est l'unique loi discrète Ă  possĂ©der la propriĂ©tĂ© de perte de mĂ©moire.

Loi de Poisson
Article dĂ©taillĂ© : Loi de Poisson.

La loi de Poisson est la loi qui dĂ©crit le comportement du nombre d'Ă©vènements se produisant dans un laps de temps fixĂ©. Cette loi Ă  support infini dĂ©nombrable dĂ©pend d'un paramètre souvent notĂ© \scriptstyle \lambda > 0 ; elle est dĂ©finie par : \scriptstyle \mathbb P(X = k) = \frac{\lambda ^ k}{k!} \exp (-\lambda), \, \text{ pour tout } k \in \mathbb{N}.

Loi hypergéométrique
Article dĂ©taillĂ© : Loi hypergĂ©omĂ©trique.

La loi hypergĂ©omĂ©trique modĂ©lise un tirage simultanĂ© de n boules dans une urne contenant une proportion pA de boules gagnantes et une proportion (1-p)A de boules perdantes, pour un nombre total A de boules. La loi dĂ©crit le nombre de boules gagnantes extraites. Cette loi Ă  support fini dĂ©pend des trois paramètres \scriptstyle n\in \mathbb N^*, \scriptstyle p\in [0,1] et \scriptstyle A^\in \mathbb N^*, et est dĂ©finie par : \scriptstyle \mathbb P(X = k) = \frac{{pA\choose k}{(1-p)A\choose n-k}}{{A\choose n}}  \, \text{ pour tout } k \in \{0,1,\dots n\}.

[modifier] Lois à densité

[modifier] Définition

Article dĂ©taillĂ© : DensitĂ© de probabilitĂ©.
La courbe rouge, est la densité de probabilité de la loi normale centrée réduite. Elle est appelée courbe de Gauss ou courbe en cloche.

Lorsque la loi de probabilitĂ© est absolument continue par rapport Ă  la mesure de Lebesgue sur \ \scriptstyle\mathbb{R}\ , la loi, ainsi qu'une variable alĂ©atoire associĂ©e, sont dites continues, ou Ă  densitĂ©[23]. Dans ce cas, en vertu du ThĂ©orème de Radon-Nikodym, la mesure \scriptstyle\ \mathbb{P}_X\ possède une densitĂ© de probabilitĂ©, gĂ©nĂ©ralement notĂ©e \scriptstyle\ f_X\ , par rapport Ă  la mesure de Lebesgue. Autrement dit, la formule suivante dĂ©finit la loi \scriptstyle\ \mathbb{P}_X\  :

\mathbb{P}\left(X\in A\right)=\int_{A}\ f_X(x)\,dx \; , pour tout borélien \scriptstyle A\in \mathcal B_{\mathbb R}.

L'Ă©galitĂ© ci-dessus est la spĂ©cialisation du thĂ©orème de transfert, mais cette fois, au cas particulier des variables Ă  densitĂ©, puisque dans ce cas particulier, on a : \scriptstyle \int_{\mathbb{R}}\phi(x)\mathbb{P}_X(dx)=\int_{\mathbb{R}}\phi(x)f_X(x)dx. Pour Ă©tudier les propriĂ©tĂ©s de ces lois Ă  densitĂ© (moments, fonction caractĂ©ristique, transformĂ©e de Laplace, etc), il faut alors utiliser la thĂ©orie de l'intĂ©gration[40].

Une loi à densité s'annule sur les singletons[41], c'est-à-dire que la loi vérifie \scriptstyle\ \mathbb{P}\left(X=a\right)=0\ pour tout nombre réel \scriptstyle\ a.\ Toutefois, cette dernière propriété, qui oppose les variables à densité aux variables discrètes, n'est pas caractéristique des variables à densité.

[modifier] Exemples

Loi uniforme
Article dĂ©taillĂ© : Loi uniforme continue.

La loi uniforme sur un intervalle indique, intuitivement, que toutes les valeurs de l'intervalle ont les mĂŞmes chances d'apparaĂ®tre. Plus formellement, chaque sous-intervalle \scriptstyle [c,d] \subset [a,b] a une probabilitĂ© Ă©gale Ă  la mesure de Lebesgue de [c,d] (multipliĂ©e par une constante) d'apparaĂ®tre. La loi uniforme ne dĂ©pend que de l'intervalle, son support est compact et sa densitĂ© est donnĂ©e par : \scriptstyle f_X (x) = \frac{1}{b-a} pour tout \scriptstyle x\in [a,b].

Loi exponentielle
Article dĂ©taillĂ© : Loi exponentielle.

La loi exponentielle est la loi communĂ©ment utilisĂ©e pour modĂ©liser le temps de vie d'un phĂ©nomène puisque c'est l'unique loi Ă  densitĂ© possĂ©dant la propriĂ©tĂ© de perte de mĂ©moire. En ce sens elle est l'analogue continu de la loi gĂ©omĂ©trique. Cette loi Ă  support semi-infini ne dĂ©pend que d'un paramètre (parfois appelĂ© l'intensitĂ©), sa densitĂ© est donnĂ©e par : \scriptstyle f_X (x) = \lambda \exp(-\lambda x) pour tout \scriptstyle x>0.

Loi normale
Article dĂ©taillĂ© : Loi normale.

La loi normale, ou loi gaussienne, est une loi centrale en thĂ©orie des probabilitĂ©s et en statistique. Elle dĂ©crit le comportement des sĂ©ries d'expĂ©riences alĂ©atoires lorsque le nombres d'essais est très grand. C'est la loi limite dans le thĂ©orème central limite, elle est Ă©galement l'unique loi stable de paramètre 2. La loi normale est caractĂ©risĂ©e par sa moyenne (qui est Ă©galement sa mĂ©diane) et par son Ă©cart-type, son support est la droite rĂ©elle. Sa densitĂ© est symĂ©trique et sa forme est communĂ©ment appelĂ©e la courbe de Gauss ou courbe en cloche : \scriptstyle f_X (x) = \frac{1}{\sigma\sqrt{2\pi}} \exp{ \left ( - \frac{(x-m)^2}{2 \sigma^2} \right )}.

Loi de Cauchy
Article dĂ©taillĂ© : Loi de Cauchy.

La loi de Cauchy est la loi stable de paramètre 1, ce qui lui donne de bonnes propriĂ©tĂ©s. Elle est cependant un exemple typique de loi n'admettant pas de moments, en particulier ni moyenne, ni variance. Son support est la droite rĂ©elle et sa densitĂ© est symĂ©trique et dĂ©finie par : \scriptstyle f_X(x)=\frac{1}{\pi}\frac{1}{1+x^2}\,.

Loi de Tukey-Lambda
Article dĂ©taillĂ© : Loi de Tukey-Lambda.

La loi de Tukey-Lambda est une loi Ă  densitĂ© mais cette dernière n'a pas d'expression analytique. Cette loi dĂ©pend d'un paramètre, son support est soit un intervalle bornĂ© centrĂ© Ă  l'origine, soit la droite rĂ©elle (en fonction du paramètre). La loi de Tuckey-Lambda est dĂ©finie Ă  partir de ses quantiles : \scriptstyle G(p) = {p^\lambda - (1-p)^\lambda\over \lambda}.

[modifier] Familles de lois

Certaines lois sont regroupĂ©es par famille par rapport Ă  certaines propriĂ©tĂ©s. Une loi est dite de la famille exponentielle Ă  un paramètre[42] si sa densitĂ© de probabilitĂ© ou sa fonction de masse ne dĂ©pend que d'un paramètre \scriptstyle \theta et est de la forme :

f(y)=\begin{cases} a(\theta)b(y)e^{-c(\theta)d(y)} & \text{ si }\alpha<y<\beta \\ 0 & \text{ sinon.}  \end{cases}

Cette famille regroupe beaucoup de lois classiques : loi normale, loi exponentielle, loi gamma, loi du χ², loi bĂŞta, loi de Bernoulli, loi de Poisson, etc.

Une loi est dite de la famille puissance Ă  deux paramètres[42] \scriptstyle \alpha et \scriptstyle \theta si sa densitĂ© est de la forme :

f(y)=\begin{cases}\displaystyle \alpha \frac{y^{\alpha-1}}{\theta^\alpha} & \text{ si }0 \leq y \leq \theta \\ 0 & \text{ sinon.}  \end{cases}

[modifier] Autres cas

Il existe des lois de probabilité qui ne sont ni discrètes, ni à densité, elles sont parfois appelées lois mixtes[43] ou lois singulières[44].

Fonction de répartition d'une loi mixte.

Un premier exemple est une loi de probabilitĂ© obtenue en "mĂ©langeant" une loi discrète et une loi Ă  densitĂ©. Par exemple en considĂ©rant la loi de la somme de deux variables alĂ©atoires, l'une discrète, l'autre Ă  densitĂ©[44] :

\mathbb P(dx)=\lambda f(x)dx+(1-\lambda)\sum p_k \delta_{x_k}(dx) oĂą \lambda\in ]0,1[.

La présence de \scriptstyle \lambda assure de garder \scriptstyle \mathbb P(\Omega)=1. La fonction de répartition est une fonction continue par morceaux[45], mais non constante par morceaux qui est le cas des fonctions de répartition des lois discrètes.

Intuitivement, cela correspond à un phénomène aléatoire dont la loi est à densité. Cependant l'appareil de mesure ne peut mesurer les données qu'à partir d'un certain seuil c. toutes les mesures non détectées par l'appareil seront assignées à c, ainsi la loi est nulle sur toute partie "plus petite" que c alors qu'un saut apparait au singleton c. Les mesures suivent la loi à densité pour les valeurs plus grandes que c[43]. Dans cet exemple la fonction de répartition est discontinue en c.

Fonction de répartition de la loi de Cantor.

Le deuxième exemple est une loi singulière dont la fonction de rĂ©partition est continue mais non absolument continue. La loi de Cantor est dĂ©finie Ă  partir de l'ensemble de Cantor : \scriptstyle \left\{ \sum_{n=1}^{\infty} \frac{x_n}{3^n} \ | \,x_n \in \{ 0,2 \} \right\}. Lorsque \scriptstyle X_n sont des variables indĂ©pendantes et identiquement distribuĂ©es de loi uniforme discrète sur \scriptstyle \{0,2\}, alors

X=\sum_{n=1}^{\infty} \frac{X_n}{3^n}

est une variable aléatoire de loi de Cantor[46]. Cette loi de probabilité[47] s'écrit sous la forme \scriptstyle \mathbb P=(\frac{1}{2}\delta_0+\frac{1}{2}\delta_2)^{\otimes \mathbb N}, c'est la loi uniforme sur l'ensemble de Cantor. Sa fonction de répartition est l'escalier de Cantor, elle est dérivable presque partout et de dérivée nulle presque partout[46].

Ce type de loi n'est pas très courant dans les applications, les lois continues ne contiennent pas de partie singulière[44]. L'ensemble de Cantor apparait toutefois dans certains exemples bien connus : l'ensemble des zĂ©ros du mouvement brownien est un ensemble de type Cantor.

D'un point de vue plus gĂ©nĂ©ral, toute loi de probabilitĂ© \scriptstyle \mathbb P peut se dĂ©composer en une somme de trois lois de probabilitĂ©[44], une loi discrète \scriptstyle \mathbb P_{d}, une loi absolument continue (ou Ă  densitĂ©) \scriptstyle \mathbb P_{ac} et une loi singulière \scriptstyle \mathbb P_{sing} :

 \mathbb P=\alpha \mathbb P_d+\beta \mathbb P_{ac}+\gamma \mathbb P_{sing} , oĂą \scriptstyle \alpha+\beta+\gamma=1.

[modifier] Caractérisation de la loi de probabilité d'une variable aléatoire réelle

Il existe plusieurs fonctions à variables réelles ou complexes qui caractérisent les lois de probabilités. Les propriétés de certaines de ces fonctions permettent de déduire des propriétés pour les lois comme les moments ou une caractérisation de la convergence en loi.

[modifier] Caractérisation à l'aide de la fonction de répartition

Fonction de répartition de la loi normale centrée réduite.
Article dĂ©taillĂ© : Fonction de rĂ©partition.

D'après le lemme de classe monotone, les ensembles \scriptstyle ]-\infty,x] (appelĂ©s pavĂ©s) engendrent[48] la tribu borĂ©lienne \scriptstyle \mathcal B_{\mathbb R}, il suffit alors de dĂ©finir une loi de probabilitĂ© sur les pavĂ©s. La fonction \scriptstyle F:x\mapsto \mathbb P(]-\infty,x]) est appelĂ©e la fonction de rĂ©partition de la loi \scriptstyle \mathbb P, elle en est caractĂ©ristique, c'est-Ă -dire : deux lois de probabilitĂ©s sont Ă©gales si et seulement si les fonctions de rĂ©partitions sont Ă©gales[48].

Plus généralement, toute fonction F croissante, continue à droite en tout point et telle que \scriptstyle F(x)\underset{x\rightarrow -\infty}{\longrightarrow}0 et \scriptstyle F(x)\underset{x\rightarrow +\infty}{\longrightarrow}1, est appelée fonction de répartition et définit[49], de manière unique, une loi de probabilité sur \scriptstyle \mathbb R.

Dans le cas où la loi de probabilité est définie à partir d'une variable aléatoire, le théorème de transfert (voir ci-dessus) assure[50] qu'il est suffisant de définir la loi par la fonction \scriptstyle \mathbb E[\phi(X)] pour les fonctions indicatrices \scriptstyle \phi=1_{]-\infty,x]}.

Un des avantages de cette fonction est qu'elle existe pour toute loi de probabilité, elle n'a cependant pas toujours d'expression analytique comme pour la loi normale par exemple. Cette caractérisation permet de pourvoir effectuer des calculs plus aisément et permet également de caractériser[51] la convergence des lois de probabilités via le théorème porte-manteau.

[modifier] Caractérisation à l'aide de la fonction caractéristique

Fonction caractéristique de la loi uniforme continue sur [-1,1].
Articles dĂ©taillĂ©s : Fonction caractĂ©ristique d'une variable alĂ©atoire et TransformĂ©e de Fourier.

La fonction caractĂ©ristique d'une loi de probabilitĂ© \scriptstyle \mathbb P est la transformĂ©e de Fourier de la mesure : \scriptstyle \phi(\lambda)= \int e^{i\lambda x}\mathbb P(dx). Comme son nom l'indique, la fonction caractĂ©ristique caractĂ©rise la loi[51],[52], c'est-Ă -dire : deux lois de probabilitĂ© sont Ă©gales si et seulement si leurs fonctions caractĂ©ristiques sont Ă©gales.

Dans le cas où la loi de probabilité est définie à partir d'une variable aléatoire, la fonction caractéristique est en fait la fonction du théorème de transfert (voir ci-dessus) lorsque la fonction intégrée est \scriptstyle x\mapsto e^{i\lambda x}.

Un des avantages de la fonction caractéristique est qu'elle existe pour toute loi de probabilité[51] De plus, en utilisant la formule d'inversion de la transformée de Fourier[52], la loi de probabilité s'obtient à partir de la fonction caractéristique. Cette caractérisation permet également de caractériser[51] la convergence des lois de probabilités via le théorème porte-manteau.

[modifier] Caractérisation à l'aide de la fonction génératrice des moments

Fonction génératrice des moments de la loi uniforme continue sur [-1,1].
Articles dĂ©taillĂ©s : Fonction gĂ©nĂ©ratrice des moments et TransformĂ©e de Laplace.

La fonction gĂ©nĂ©ratrice des moments d'une loi de probabilitĂ© \scriptstyle \mathbb P est la "symĂ©trie" de la transformĂ©e de Laplace de la mesure[46],[53] : \scriptstyle m(t) = \mathcal L(\mathbb P)(-t) = \int e^{tx}\mathbb P(dx); lorsque la fonction \scriptstyle e^{tx} est intĂ©grable par rapport Ă  \scriptstyle \mathbb P. La fonction gĂ©nĂ©ratrice des moments caractĂ©rise la loi de probabilitĂ© si elle existe sur un intervalle contenant l'origine[51].

Un des avantages de cette fonction gĂ©nĂ©ratrice des moments est qu'elle permet de retrouver les moments de la loi de probabilitĂ© par les dĂ©rivĂ©es[53] : \scriptstyle m^{(n)}(0)=\mu_n. De plus, pour des lois dĂ©finies Ă  partir de variables alĂ©atoires, cette fonction permet aisĂ©ment de montrer l'indĂ©pendance des variables[53]. Cette caractĂ©risation permet Ă©galement de caractĂ©riser[51] la convergence des lois de probabilitĂ©s via le thĂ©orème porte-manteau.

Article dĂ©taillĂ© : Fonction gĂ©nĂ©ratrice des probabilitĂ©s.

Il existe un cas particulier pour le cas des lois discrètes. La fonction gĂ©nĂ©ratrice des probabilitĂ©s d'une loi de probabilitĂ© discrète \scriptstyle \mathbb P=\sum p_k\delta_k est dĂ©finie[53] comme l'espĂ©rance de la sĂ©rie gĂ©nĂ©ratrice : \scriptstyle g(t)=\sum t^k p_k, sous rĂ©serve d’existence de cette sĂ©rie. Cette fonction gĂ©nĂ©ratrice caractĂ©rise la loi de probabilitĂ©[53].

[modifier] Autres caractérisations

Exemple de quantiles.
Articles dĂ©taillĂ©s : Quantile et MĂ©thode de la transformĂ©e inverse.

Certaines lois de probabilitĂ© sont plus faciles Ă  dĂ©finir, via leur fonction quantile. La fonction quantile est[54] la fonction \scriptstyle F^\leftarrow qui donne le p-quantile de la loi pour toute valeur \scriptstyle u\in [0,1]. Intuitivement, \scriptstyle F^\leftarrow(u) est la valeur telle qu'une proportion u des valeurs possibles de la loi lui soient infĂ©rieures. Pour \scriptstyle u=1/2, \scriptstyle F^\leftarrow(1/2) est la mĂ©diane de la loi. Plus formellement[55] :

F^\leftarrow(u)=\inf\{x \ |\ \mathbb P(X\leq x)>u\}, pour \scriptstyle u\in ]0,1[ et où X est une variable aléatoire de loi \scriptstyle \mathbb P.

C'est l'inverse continue à droite de la fonction de répartition de la loi. Lorsque la loi est à densité, la fonction quantile est la fonction réciproque de la fonction de répartition[54].

Cette fonction est caractéristique de la loi associée[55] \scriptstyle \mathbb P au sens où, si U est une variable aléatoire de loi uniforme continue sur [0,1], alors \scriptstyle F^\leftarrow(U) est une variable aléatoire de loi \scriptstyle \mathbb P initiale.

Cette caractérisation est particulièrement utile pour simuler des lois de probabilité[56] puisqu'il suffit alors de simuler une loi uniforme continue (voir la section ci-dessous sur la simulation des lois de probabilités). De plus certaines lois n'ont pas de fonction de répartition explicite mais sont définies à partir de leurs quantiles, c'est le cas de la loi de Tukey-Lambda.

[modifier] Utilisations

La répartition statistique d'une variable au sein d'une population est souvent voisine des modèles mathématiques des lois de probabilités[57]. Il est souvent intéressant, pour des raisons théoriques et pratiques, d'étudier le modèle probabiliste, dit théorique[58]. L'étude commence alors par une sélection au hasard de plusieurs valeurs ou individus. Si la méthode utilisée est parfaite, c'est-à-dire que ces valeurs observées sont issues d'une sélection équiprobable[57], alors elles sont des variables aléatoires et l'étude du phénomène revient à étudier la loi de probabilité.

[modifier] Simulation d'une loi de probabilité

Simulation de la loi uniforme continue sur le carré unitaire. On remarque ici l'imperfection des 10000 valeurs pseudo-aléatoires par la présence de zones moins denses.
Article dĂ©taillĂ© : GĂ©nĂ©rateur de nombres pseudo-alĂ©atoires.

Afin d'Ă©tudier les lois de probabilitĂ©, il est important de pouvoir les simuler, ceci est dĂ» notamment Ă  l’utilisation de l'informatique dans les sciences. Comme indiquĂ© ci-dessus, les lois de probabilitĂ© sont caractĂ©risĂ©es par la fonction quantile via une variable alĂ©atoire de loi uniforme continue. Cette mĂ©thode gĂ©nĂ©rale comprend deux Ă©tapes[59] : la gĂ©nĂ©ration de valeurs dites pseudo-alĂ©atoires de loi uniforme et l'inversion de la fonction de rĂ©partition de la loi Ă©tudiĂ©e. Cette deuxième Ă©tape n'a pas Ă©vidente Ă  rĂ©aliser pour toutes les lois, d'autres mĂ©thodes sont alors utilisĂ©es.

« Quiconque considère des mĂ©thodes arithmĂ©tiques pour produire des nombres alĂ©atoires est, bien sĂ»r, en train de commettre un pĂ©chĂ©. Â»

— John von Neumann

Simulation de la loi uniforme

Pour obtenir des valeurs suivant la loi uniforme continue, l'ordinateur simule des valeurs de la loi uniforme discrète. Plusieurs mĂ©thodes ont Ă©tĂ© utilisĂ©es[60] : l'utilisation de tables de donnĂ©es qui pouvaient en contenir plus d'un million est de moins en moins utilisĂ©e ; l'utilisation de processus physique comme la crĂ©ation d'un bruit Ă©lectronique est assez couteuse pour la rĂ©cupĂ©ration des donnĂ©es ; l'utilisation d'algorithmes arithmĂ©tiques est la mĂ©thodes la plus simple. Ces algorithmes Ă©tant dĂ©terministes (non-alĂ©atoires), les valeurs obtenues sont appelĂ©es pseudo-alĂ©atoires. De nombreux algorithmes ont Ă©tĂ© créés pour amĂ©liorer l'indĂ©pendance entre les valeurs et leur rĂ©partition dans l'intervalle [0,1].

Simulation des autres lois

Lorsque la fonction de rĂ©partition est inversible, on utilise la caractĂ©risation par la fonction quantile. Donnons quelques exemples dans le cas oĂą cette fonction n'est pas inversible : la mĂ©thode de Box-Muller permet de simuler la loi normale[61], la mĂ©thode de rejet de von Neumann est fondĂ© sur un test statistique et est applicable pour plusieurs lois[62], d'autres mĂ©thodes spĂ©cifiques aux lois existent[63].

Exemple

Un exemple célèbre d'utilisation d'une simulation de loi de probabilité est la méthode de Monte-Carlo, par exemple pour approcher la valeur de π. La méthode consiste a simuler un grand nombre de valeurs suivant une loi uniforme continue sur [0,1] et de compter la proportion des couples \scriptstyle (x,y) d'entre eux qui vérifient \scriptstyle x^2+y^2\leq 1. Cette proportion se rapproche de π/4 lorsque le nombre de point tend vers l'inifni[64].

[modifier] Approximation d'une loi de probabilité

Illustration du théorème central limite. Les données empiriques sont les valeurs possibles de la somme de n dés. Lorsque n augmente, les histogrammes convergent vers la courbe de Gauss qui est la densité de la loi normale.

Plusieurs approximations d'une loi de probabilité existent en utilisant les différentes caractérisations détaillées ci-dessus. C'est généralement les techniques utilisées dans les cas pratiques. La première étape est la récolte des données, ce qui permet de construire les objets empiriques comme la fonction de répartition empirique. Ces derniers sont parfois appelés, par abus de langage, des lois de probabilité mais ce sont en fait des lois empiriques appelées distributions statistiques[57]. Des théorèmes limites ou des tests statistiques permettent finalement d'identifier la meilleure loi de probabilité qui modélise le phénomène aléatoire initial[58].

« Les probabilitĂ©s doivent ĂŞtre regardĂ©es comme analogues Ă  la mesure des grandeurs physiques, c'est-Ă -dire qu'elles ne peuvent jamais ĂŞtre connues exactement mais seulement avec une certaine approximation Â»

— Ă‰mile Borel[65]

Par la fonction de répartition

Le test statistique de Kolmogorov-Smirnov, basée sur le théorème porte-manteau, permet d'identifier la fonction de répartition empirique calculée à partir des données à une fonction de répartition d'une loi de probabilité, en fonction d'un taux de rejet. L'avantage de la convergence des fonctions de répartition est que ces fontions existent pour toutes lois de probabilités. Cette convergence permet en particulier d'approcher une loi à densité par une suite de lois discrètes[66].

Convergence des autres fonctions caractéristiques

Différents théorèmes de convergence de variables aléatoires permettent de construire une suite de lois de probabilité qui converge vers une loi donnée, ou inversement de construire une loi comme limite de lois de probabilité. Le théorème central limite concerne la loi normale pour loi limite. Le théorème de continuité de Paul Lévy concerne la convergence des fonctions caractéristiques.

Exemple de droite de Henry dans un diagramme Quantile-Quantile qui permet de comparer visuellement les quantiles empiriques aux quantiles théoriques. Ici la loi normale n'est pas adéquat.
Régression quantile

La régression quantile permet d'approcher les quantiles de la loi par les quantiles empiriques, c'est-à-dire calculés à partir d'éventuelles données. On peut utiliser un test statistique pour comparer les quantiles empiriques (observés) avec les quantiles de la loi qui est supposée modéliser le phénomène.

Cette approche est particulièrement utile pour étudier certaines lois qui ne sont pas connues explicitement par leur densité ou leur fonction de répartition mais par leurs quantiles, c'est le cas de la loi de Tukey-Lambda.

Tests statistiques

Plusieurs tests statistiques existent pour comparer deux lois. Plus prĂ©cisĂ©ment, les tests d'adĂ©quation permettent de comparer une loi empirique (c'est-Ă -dire calculĂ©e Ă  partir des donnĂ©es issue d'Ă©chantillons) Ă  une loi de probabilitĂ© dite a priori qui est censĂ©e modĂ©liser le phĂ©nomène Ă©tudiĂ©. Les deux principaux tests sont : le test de Kolmogorov-Smirnov mentionnĂ© ci dessus qui compare les fonctions de rĂ©partition, et le test d'adĂ©quation du χ² qui compare les effectifs observĂ©s avec une loi du χ². Parmi ces tests, ceux qui concernent la loi normale sont dits tests de normalitĂ©.

D'autres tests, les tests d’homogĂ©nĂ©itĂ©, permettent de comparer deux lois empiriques pour savoir si elles sont issues du mĂŞme phĂ©nomène, ou de manière Ă©quivalente, si elles peuvent ĂŞtre modĂ©lisĂ©es par la mĂŞme loi de probabilitĂ© a priori. Ces tests comparent certaines propriĂ©tĂ©s des lois empiriques par rapport Ă  la propriĂ©tĂ© de la loi a priori. Ce sont des tests utilisĂ©s dans la pratique puisqu'ils permettent de comparer non pas des lois entières mais des valeurs issues des lois[67] : le test de Fisher estime le rapport des variances empiriques via la loi de Fisher[67], le test de Student estime la moyenne empirique via la loi de Student[68], etc.

[modifier] Maximum d'entropie

Les lois de probabilitĂ© permettent de reprĂ©senter des phĂ©nomènes alĂ©atoires. L'entropie de Shannon d'une loi de probabilitĂ© a Ă©tĂ© introduite en thermodynamique pour quantifier l'Ă©tat de dĂ©sordre molĂ©culaire d'un système[69]. Le but est de reprĂ©senter par une fonction la quantitĂ© d'information de la loi de probabilitĂ©. L'entropie a d'abord Ă©tĂ© dĂ©finie pour les lois discrètes puis Ă©tendue pour les lois Ă  densitĂ©. Pour une loi discrète \scriptstyle \mathbb P_1=\sum_{i\leq n}p_i\delta_{x_i} et une loi \scriptstyle \mathbb P_2 de densitĂ© \scriptstyle f, l'entropie H est dĂ©finie respectivement par[69],[70] :

H(\mathbb P_1)=-\sum_{i=1}^n p_i \log_2(p_i) et H(\mathbb P_2)=-\int_{\mathbb R}f(x)\ln(f(x))dx.
  • La loi normale est celle d'entropie maximale parmi toutes les lois possibles ayant mĂŞme moyenne et mĂŞme Ă©cart-type[12].
  • La loi gĂ©omĂ©trique est celle d'entropie maximale parmi toutes lois discrètes de mĂŞme moyenne[12].
  • La loi uniforme est celle d'entropie maximale parmi les lois Ă  support bornĂ©.
  • La loi exponentielle est celle d'entropie maximale parmi les lois portĂ©es par \ \scriptstyle\mathbb{R}_+\ et ayant la mĂŞme moyenne[12].
  • Les lois de la famille puissance comme celle de Zipf sont d'entropie maximale parmi celles auxquelles on impose la valeur du logarithme d'une moyenne.

En quelque sorte, ces lois ne contiennent pas plus d'information que ce qui est obligatoire. Ce sont les moins prévenues de toutes les lois compatibles avec les observations ou les contraintes, et donc les seules admissibles objectivement comme distributions de probabilités a priori lorsque ces valeurs sont imposées et seules connues. Cette propriété joue un grand rôle dans les méthodes bayésiennes.

[modifier] Exemples de modélisation

Les lois de probabilité sont utilisées pour représenter les phénomènes observés. Une loi de probabilité, dite a priori, est supposée modéliser les données récupérées, des tests statistiques sont alors réalisés pour affirmer ou infirmer la concordance de la loi de probabilité avec les données.

Dans bien des domaines, les méthodes ont évoluées et de meilleures lois de probabilité ont été créées afin de mieux correspondre au problème posé. Voici une liste non exhaustive d'exemples concrets qui proposent des modélisations.

En économie

La bourse est une institution qui permet d'échanger des biens ou des titres. Afin de mieux estimer le prix futur d'un bien ou d'un titre, une étude de l'évolution historique de son prix est réalisée, notamment par la modélisation des variations des cours des prix. Ces variations ont d'abord été modélisées par une loi normale (Bachelier, 1900), puis une amélioration a été faite avec les lois stables de Pareto (Mandelbrot, 1963). Depuis, de nouveaux modèles sont toujours recherchés pour améliorer la perception des risques[a 1].

En jeux de hasard

Pour jouer au loto français, il faut choisir six numéros parmi les quarante neuf possibles. Si les joueurs choisissent leurs numéros au hasard, c'est-à-dire avec une loi uniforme, alors le nombre de gagnant suit une loi de Poisson. Grâce à cette considération, une étude peut être réalisée puisque le nombre de gagnants est une donnée connue. Il apparait que le choix n'est pas uniforme mais que les petits numéros ont été plus choisis[a 2].

En maintenance

Une bonne comprĂ©hension de la dĂ©gradation permet d'amĂ©liorer la performance de la maintenance. Plusieurs lois a priori ont Ă©tĂ© utilisĂ©es pour modĂ©liser l'Ă©volution de la fissure des chaussĂ©es : la loi exponentielle, la loi de Weibull, la loi log-normale, la loi log-logistique, etc. Cette dernière semble convenir le mieux en utilisant une mĂ©thode de maximum de vraisemblance[a 3].

En médecine

Pour tester l'efficacitĂ© des mĂ©dicaments, un essai clinique est rĂ©alisĂ© auprès de d'un Ă©chantillon d'utilisateurs. Cette mĂ©thode fait partie de la thĂ©orie de la dĂ©cision. Une des mĂ©thodes est de sĂ©lectionner un malade de rĂ©aliser un test avec deux issues (succès ou Ă©chec), c'est-Ă -dire de modĂ©liser par une loi de Bernoulli, puis de recommencer le plus de fois possibles ; c'est la mĂ©thode des urnes de Bernoulli. Une meilleure mĂ©thode est d'utiliser la loi hypergĂ©omĂ©trique, ce choix permet de ne considĂ©rer qu'une population d'individus de taille fixĂ©e prĂ©alablement[a 4].

En météorologie

En hydrologie, la pluviométrie est l'étude de la quantité d'eau issue de la pluie tombée en un point du sol pendant une durée de temps fixée. Le choix de la loi a priori ne fait pas consensus au sein de la communauté scientifique internationale. Certains auteurs préconisent l'utilisation de la loi log-normale qui s'ajuste bien pour les petites valeurs. D'autres proposent la loi gamma qui s'ajuste bien sur les valeurs expérimentales. L'utilisation de la loi de Pareto a son intérêt pour représenter les valeurs moyennes[a 5].

[modifier] Notes et références

  1. ↑ Wackerly, Mendenhall et Schaeffer 2008, p. 20
  2. ↑ BarbĂ© et Ledoux 2007, p. 41
  3. ↑ Henry 2001, p. 163
  4. ↑ Wackerly, Mendenhall et Schaeffer 2008, p. 86
  5. ↑ Henry 2001, p. 14
  6. ↑ Dalang 2008, p. 127
  7. ↑ Henry 2001, p. 34
  8. ↑ a, b, c et d Dalang 2008, p. 128
  9. ↑ Henry 2001, p. 42
  10. ↑ Henry 2001, p. 55
  11. ↑ Henry 2001, p. 54
  12. ↑ a, b, c et d Caumel 2011, p. 137
  13. ↑ a, b et c .Ruegg 1994, p. 35
  14. ↑ a et b Ducel 1996, p. 8
  15. ↑ a, b et c Saporta 2006, p. 16
  16. ↑ a, b et c BarbĂ© et Ledoux 2007, p. 45
  17. ↑ BarbĂ© et Ledoux 2007, p. 54
  18. ↑ Yaglom 2004, p. 1
  19. ↑ Saporta 2006, p. 69
  20. ↑ Saporta 2006, p. 22
  21. ↑ Saporta 2006, p. 85
  22. ↑ Saporta 2006, p. 87
  23. ↑ a, b et c Ducel 1996, p. 9
  24. ↑ BarbĂ© et Ledoux 2007, p. 51
  25. ↑ Ruegg 1994, p. 20
  26. ↑ a et b Klebaner 2005, p. 44
  27. ↑ a et b BarbĂ© et Ledoux 2007, p. 150
  28. ↑ BarbĂ© et Ledoux 2007, p. 162
  29. ↑ BarbĂ© et Ledoux 2007, p. 160
  30. ↑ Klebaner 2005, p. 46
  31. ↑ Saporta 2006, p. 77
  32. ↑ Saporta 2006, p. 80
  33. ↑ Ledoux et Talagrand 2002, p. 37
  34. ↑ Ledoux et Talagrand 2002, p. 38
  35. ↑ Klebaner 2005, p. 47
  36. ↑ Klebaner 2005, p. 139
  37. ↑ a, b et c Ledoux et Talagrand 2002, p. 39
  38. ↑ Ledoux et Talagrand 2002, p. 40
  39. ↑ BarbĂ© et Ledoux 2007, p. 13
  40. ↑ Ducel 1996, p. 7
  41. ↑ Ruegg 1994, p. 52
  42. ↑ a et b Wackerly, Mendenhall et Schaeffer 2008, p. 463
  43. ↑ a et b Bogaert 2006, p. 71
  44. ↑ a, b, c et d Klebaner 2005, p. 36
  45. ↑ Bogaert 2006, p. 72
  46. ↑ a, b et c Klebaner 2005, p. 37
  47. ↑ Ledoux et Talagrand 2002, p. 22
  48. ↑ a et b BarbĂ© et Ledoux 2007, p. 52
  49. ↑ Saporta 2006, p. 17
  50. ↑ Klebaner 2005, p. 34
  51. ↑ a, b, c, d, e et f Klebaner 2005, p. 38
  52. ↑ a et b Saporta 2006, p. 57
  53. ↑ a, b, c, d et e Saporta 2006, p. 60
  54. ↑ a et b Bogaert 2006, p. 88
  55. ↑ a et b BarbĂ© et Ledoux 2007, p. 50
  56. ↑ BarbĂ© et Ledoux 2007, p. 49
  57. ↑ a, b et c Saporta 2006, p. xxviii
  58. ↑ a et b Ruegg et 1994 p37
  59. ↑ Jedrzejewski 2009, p. 187
  60. ↑ Jedrzejewski 2009, p. 182
  61. ↑ Jedrzejewski 2009, p. 188
  62. ↑ Jedrzejewski 2009, p. 189
  63. ↑ Jedrzejewski 2009, p. 191
  64. ↑ Jedrzejewski 2009, p. 215
  65. ↑ Henry 2001, p. 194
  66. ↑ Bogaert 2006, p. 70
  67. ↑ a et b Saporta 2006, p. 340
  68. ↑ Saporta 2006, p. 342
  69. ↑ a et b Caumel 2011, p. 135
  70. ↑ Caumel 2011, p. 136
Articles
  1. ↑ Michel Albouy et A. Sinani, « L'efficience des bourses de province françaises Â», dans Journal de la sociĂ©tĂ© statistique de Paris, vol. 122, no 4, 1981, p. 200-214 [texte intĂ©gral (page consultĂ©e le 14/05/12)] 
  2. ↑ P. Roger et M.-H. Broihanne, « Les joueurs de loto français choisissent-ils leurs numĂ©ros au hasard? Â», dans Revue de statistique appliquĂ©e, vol. 54, no 3, 2006, p. 83-98 [texte intĂ©gral (page consultĂ©e le 13/05/12)] 
  3. ↑ E. Courilleau et J. M. Marion, « Comparaison de modèles d'estimation de la fonction de survie appliquĂ©e Ă  des donnĂ©es routières. Â», dans Revue de statistique appliquĂ©e, vol. 47, no 1, 1999, p. 81-97 [texte intĂ©gral (page consultĂ©e le 13/05/12)] 
  4. ↑ F. Boutros-Toni, « L'analyse sĂ©quentielle exhaustive. Application en mĂ©decine. Â», dans Revue de statistique appliquĂ©e, vol. 29, no 4, 1981, p. 31-50 [texte intĂ©gral (page consultĂ©e le 13/05/12)] 
  5. ↑ J. de Reffye, « Ă‰tude phĂ©nomĂ©nologique des prĂ©cipitations pluvieuses. ModĂ©lisation mathĂ©matiques des intensitĂ©s de pluie en un point du sol. Â», dans Revue de statistique appliquĂ©e, vol. 30, no 3, 1982, p. 39-63 [texte intĂ©gral (page consultĂ©e le 13/05/12)] 

[modifier] Voir aussi

[modifier] Bibliographie

  • (fr) Alan Ruegg, Autour de la modĂ©lisation en probabilitĂ©s, Presses Polytechniques et universitaires romandes, 1994, 4e Ă©d., 157 p. (ISBN 2-88074-286-2) [lire en ligne] .Ouvrage utilisĂ© pour la rĂ©daction de l'article
  • (fr) Yves Ducel, Les probabilitĂ©s Ă  l'agrĂ©gation externe de mathĂ©matiques : Guide pour une rĂ©vision, Presses Univ Franche-ComtĂ©, 1996, 42 p. (ISBN 2-909963-08-X) [lire en ligne] .Ouvrage utilisĂ© pour la rĂ©daction de l'article
  • (fr) Michel Henry, ProbabilitĂ©s et statistique, Presses Univ Franche-ComtĂ©, 2001, 262 p. [lire en ligne] .Ouvrage utilisĂ© pour la rĂ©daction de l'article
  • (en) Michel Ledoux et Michel Talagrand, Probability in Banach spaces, Springer, 2002, 485 p. (ISBN 3-540-52013-9) [lire en ligne] .Ouvrage utilisĂ© pour la rĂ©daction de l'article
  • (en) A.M. Yaglom, An Introduction to the Theory of Stationary Random Functions, Dover Phoenix Editions, 2004, 205 p. (ISBN 0-486-49571-X) [lire en ligne] .Ouvrage utilisĂ© pour la rĂ©daction de l'article
  • (en) Fima Klebaner, Introduction to Stochastic Calculus With Applications, Imperial College Press, 2005, 416 p. (ISBN 1-86094-555-4) [lire en ligne] .Ouvrage utilisĂ© pour la rĂ©daction de l'article
  • (fr) Gilbert Saporta, ProbabilitĂ©s, Analyse des donnĂ©es et Statistiques, Paris, Editions Technip, 2006, 622 p. (ISBN 978-2-7108-0814-5) [lire en ligne] .Ouvrage utilisĂ© pour la rĂ©daction de l'article
  • (fr) Patrick Bogaert, ProbabilitĂ©s pour scientifiques et ingĂ©nieurs, Paris, Editions De Boeck, 2006, 387 p. (ISBN 2-8041-4794-0) [lire en ligne] .Ouvrage utilisĂ© pour la rĂ©daction de l'article
  • (fr) Philippe BarbĂ© et Michel Ledoux, ProbabilitĂ©, EDP Sciences, 2007, 241 p. (ISBN 978-2-86883-931-2) [lire en ligne] .Ouvrage utilisĂ© pour la rĂ©daction de l'article
  • (en) Wackerly, Mendenhall et Schaeffer, Mathematical Statistics with applications, Brooks Cole, 2008, 7e Ă©d., 922 p. [lire en ligne] .Ouvrage utilisĂ© pour la rĂ©daction de l'article
  • (fr) Dalang et Conus, Introduction Ă  la thĂ©orie des probabilitĂ©s, Presses polytechniques et universitaires romandes, 2008, 204 p. (ISBN 978-2-88074-794-7) [lire en ligne] .Ouvrage utilisĂ© pour la rĂ©daction de l'article
  • (fr) Jedrzejewski, Modèles AlĂ©atoires et Physique Probabiliste, Springer, 2009, 572 p. (ISBN 978-2-287-99307-7) [lire en ligne] .Ouvrage utilisĂ© pour la rĂ©daction de l'article
  • (fr) Caumel, ProbabilitĂ©s et processus stochastiques, Springer, 2011, 303 p. (ISBN 978-2-8178-0162-9) [lire en ligne] .Ouvrage utilisĂ© pour la rĂ©daction de l'article

[modifier] Articles connexes

  • Variable alĂ©atoire
  • Distribution (mathĂ©matiques)
  • Mesures secondaires
  • DensitĂ© de probabilitĂ©
wikipediaCet article est issu de l'encyclopédie libre Wikipedia.
Vous pouvez consulter l'article ici ainsi que son historique.
Les textes et les images sont disponibles sous les termes de la Licence de documentation libre GNU.


maths - prof de maths haut de pagehaut Retrouvez cette page sur ilemaths l'île des mathématiques
© Tom_Pascal & Océane 2012