Densité de probabilité : encyclopédie mathématiques
Cet article est issu de l'encyclopédie libre Wikipedia.
Sommaire |
Définition — En mathématiques statistiques ou en probabilité, on dit qu'une fonction est une densité de probabilité d'une variable aléatoire réelle
si, pour tout réel
La probabilité se calcule alors par la relation suivante :
En traçant la représentation graphique de la densité de probabilité, la probabilité se lit comme l'aire sous la courbe sur l'intervalle
La définition qui suit est une reformulation de la définition intégrale proposée en début d'article. C'est la définition utilisée en général par les physiciens, en particulier ceux issus du domaine de la physique statistique.
Si est un nombre réel positif infiniment petit, alors la probabilité que
soit inclus dans l'intervalle
est égale Ã
soit:
Cette "définition" est très utile pour comprendre intuitivement à quoi correspond une densité de probabilité, et est correcte dans beaucoup de cas importants. On peut tracer une analogie avec la notion de densité de masse, ou encore avec la notion de densité de population. Une formulation plus mathématique serait
ce qui permet de comprendre en quoi la définition donnée en physique n'est pas complètement rigoureuse :
et il est alors facile de vérifier que si possède une limite à droite en
, notons-lÃ
on a alors
ce qui corrobore la définition physique lorsque est continue à droite en
mais la met en défaut quand
Bien sûr, les densités de probabilités usuelles sont continues à droite sauf éventuellement en un nombre fini (et en un petit nombre) de points.
Notons que ce genre d'interprétation infinitésimale (ou issue de la physique) s'étend aux dimensions voir la section suivante.
Soit une suite de 9 v.a. r. i.i.d. de même densité
et de même fonction de répartition
Notons
la médiane de cette suite. Alors :
On peut voir cela comme une suite de 9 expériences aléatoires indépendantes faites dans les mêmes conditions, avec à chaque fois 3 issues : "", "
" et "
", de probabilités respectives
et
donc la probabilité ci dessus est donnée par la loi multinomiale de paramètres 3, 9 et
Ainsi :
et la densité de est
Nota : Un résultat plus général se trouve sur la page "Statistique d'ordre".
En vertu d'un théorème dû à Borel, la fonction de répartition d'une variable aléatoire réelle étant croissante, est dérivable presque partout sur
, et la dérivée ainsi obtenue est positive et intégrable sur
, d'intégrale inférieure ou égale à 1.
Critère 1 — possède une densité de probabilité si et seulement si l'intégrale de la dérivée de la fonction de répartition est exactement égale à 1. Cette dérivée est alors une des densités de probabilité de
Critère 2 — Si la fonction de répartition de est de classe
par morceaux sur
et est, d'autre part, continue sur
, alors la dérivée de la fonction de répartition de
est une des densités de probabilité de
Une solution plus rigoureuse mais plus lourde est de calculer la fonction de répartition de la médiane, puis de la dériver. On reconnait un schéma de Bernoulli : le nombre d'indices tels que
suit une loi binomiale de paramètres 9 et
En dérivant, on trouve :
Après quelques manipulations sur les coefficients binomiaux, tous les termes de cette somme se télescopent, sauf une partie du premier terme, ce qui donne :
puis
donc satisfait le critère 1. CQFD
Définition — On appelle densité de probabilité d'une variable aléatoire à valeur dans
une fonction
telle que pour toute partie borélienne
Cette définition est en particulier valable pour et est donc équivalente à la première définition, dans le cas particulier
Théorème — Soit une variable aléatoire à valeur dans
, de densité
et soit
une fonction borélienne de
dans
Alors, dès qu'un des deux termes de l'égalite suivante
a un sens, alors l'autre aussi, et l'égalité a lieu. Réciproquement, si l'égalité ci-dessus a lieu pour tout borélien borné, alors
est une densité de
Il existe des variables aléatoires, réelles ou bien à valeurs dans , qui ne possèdent pas de densité de probabilité, par exemple les variables aléatoires discrètes. Les variables aléatoires qui possèdent une densité de probabilité sont appelées parfois variables à densité, parfois variables continues.
Si une fonction est la densité de probabilité d'une variable aléatoire à valeur dans
, cette fonction vérifie les propriétés suivantes
Réciproquement, si une fonction vérifie les 3 propriétés ci-dessus, on peut construire une variable aléatoire
à valeur dans
ayant
pour densité de probabilité.
Si est une variable aléatoire réelle ayant
pour densité de probabilité, alors
possède un moment d'ordre
si et seulement si
On a alors
et en particulier
et, d'après le théorème de König-Huyghens,
En vertu du Théorème de Radon-Nikodym, le vecteur aléatoire possède une densité si et seulement si, pour chaque borélien
de
dont la mesure de Lebesgue est nulle, on a
Ce critère est rarement employé dans la pratique pour démontrer que possède une densité, mais il est en revanche utile pour démontrer que certaines probabilités sont nulles. Par exemple, si le vecteur aléatoire
possède une densité, alors
pour des fonctions et
suffisamment régulières[1], parce que la mesure de Lebesgue (i.e. la surface) de la 1ère bissectrice (resp. du cercle unité, du graphe de la fonction
ou de la courbe d'équation
) sont nulles.
Le critère de Radon-Nikodym peut aussi être utilisé pour démontrer qu'un vecteur aléatoire ne possède pas de densité : par exemple, si
où désigne une variable aléatoire à valeur dans
p.e.
suit la loi uniforme sur
alors
ne possède pas de densité car
Si et
sont deux densités de probabilités de la même variable aléatoire
alors
et
sont égales presque partout. Réciproquement, si g est presque partout égale à une densité de probabilité de
alors g est une densité de probabilité de
Ainsi une variable aléatoire à densité possède-t-elle toujours une infinité de densités de probabilité : par exemple, en perturbant l'une des densités de
de manière arbitraire en un nombre fini de points, on obtient encore une densité de
On dit que la fonction définie de
dans
est une densité jointe de la suite de variables aléatoires réelles
si
est une densité de probabilité du vecteur aléatoire
à valeurs dans
défini par
On peut alors calculer la probabilité d'événements concernant les variables aléatoires réelles de la manière suivante :
Si
s'écrit
où
désigne le demi-plan sous la première bissectrice
On a alors, par définition de la densité,
Si par exemple et
sont indépendants et ont même densité de probabilité
alors une densité de
est
, i.e. une densité de
est
défini par
. En ce cas,
Si par contre p.s., le vecteur
a les mêmes lois marginales (
et
ont
pour densité de probabilité), mais n'a pas la même loi jointe, puisqu'alors
Ainsi la donnée des densités marginales de
et
seules, ne permet pas de calculer la probabilité d'événements faisant intervenir à la fois
et
comme par exemple l'évènement
Pour effectuer le calcul, on utilise ordinairement la loi jointe de
et
définie dans le cas ci-dessus par leur densité jointe.
Soit un vecteur aléatoire à valeurs dans
de densité
et pour
soit
et
les deux coordonnées de
. On notera
Alors
Propriété — Les variables aléatoires réelles et
possèdent toutes deux des densités, notons les
et
, et ces densités sont données par
Les densités de probabilités et
sont appelées les densités marginales de
Calculons où
est une fonction borélienne bornée. Pour cela on peut voir
comme une fonction de
disons
où
et
désigne la projection sur la première coordonnée. Alors
Cela a lieu pour tout borélien borné, car
est borné donc intégrable, et
est donc bien défini. En comparant le premier et le dernier terme de la série d'égalités ci-dessus, on voit que la marginale
satisfait la condition requise pour être une densité de probabilité de
CQFD
Le cas de peut être traité de la même manière.
Plus généralement, si définie de
dans
est une densité jointe de :
on peut calculer une densité de (par exemple)
de la manière suivante (si
par exemple):
i.e. en intégrant par rapport à toutes les coordonnées qui ne figurent pas dans le triplet La fonction
est elle aussi appelée densité marginale ou marginale de
Une formulation générale serait lourde. La démonstration générale est calquée sur la démonstration de la propriété ci-dessus.
La densité jointe des 9 statistiques d'ordre, notées ici de l'échantillon
est donnée par :
Il se trouve que, par définition des statistiques d'ordre, la médiane est aussi la 5-ème statistique d'ordre,
On a donc :
Ainsi, de proche en proche,
La définition ci-dessus permet de représenter la variable associée à une distribution continue de probabilités comme un ensemble de variables discrètes binaires associées à des intervalles [a ; b][2].
Il est également possible de représenter certaines variables aléatoires discrètes à l'aide d'une densité de probabilité, par l'intermédiaire de la fonction δ de Dirac.
Par exemple, considérons la variable aléatoire binaire discrète prenant pour valeurs -1 ou 1, avec pour probabilité ½ chacune. Alors la densité de probabilité associée à cette variable est :
Plus généralement, si une variable discrète est susceptible de prendre n valeurs parmi les nombres réels, alors la densité de probabilité associée est :
où sont les valeurs discrètes accessibles à la variable et
sont les probabilités associées à ces valeurs.
Cette expression permet de déterminer les caractéristiques statistiques telles que l'espérance, la variance et la kurtosis d'une telle variable discrète à partir des formules prévues pour une distribution continue.
En physique, cette description est également utile pour caractériser l'instant initial d'un mouvement brownien.
La densité de probabilité de la somme de deux variables aléatoires indépendantes U et V, chacune ayant une densité fU et fV, est donnée par une convolution de ces densités:
Pour déterminer la densité de la somme de variables indépendantes, on peut aussi passer[3] par la Fonction génératrice des moments ou la Fonction caractéristique d'une variable aléatoire. C'est ainsi qu'est démontré le Théorème de la limite centrale.
Notons la densité de la variable aléatoire réelle
Il est possible de considérer un changement de variable, dépendant de x. La transformation est la suivante: y = g(x) où la fonction g est monotone. La densité de la transformée fY(y) est
Théorème —
où g−1 représente la fonction réciproque de g et g' la dérivée de g.
Ce résultat découle du fait que les probabilités sont invariantes par changement de variable:
En différenciant, on obtient
qui s'écrit encore
Pour une transformation g non monotone, la densité de probabilité de y est
où n(y) est le nombre de solutions en x de l'équation g(x) = y, et sont les solutions.
Prenons l'exemple où on prend le carré d'une variable; on sait que:
et en dérivant, on trouve
ce qui est conforme à la formule.
Cet article est issu de l'encyclopédie libre Wikipedia.