Loi de probabilité : encyclopédie mathématiques
Cet article est issu de l'encyclopédie libre Wikipedia.En théorie des probabilités et en statistique, une loi de probabilité décrit soit les probabilités de chaque valeur d'une variable aléatoire (quand la variable aléatoire est discrète), soit la probabilité que la variable aléatoire appartienne à un intervalle arbitraire (quand la variable est continue)[1]. La loi de probabilité décrit l'ensemble des valeurs qu'une variable aléatoire peut atteindre et la probabilité que la valeur de la variable aléatoire soit dans n'importe quel sous ensemble (mesurable) de cet ensemble.
Quand la variable aléatoire prend ses valeurs dans la loi de probabilité est complètement déterminée par sa fonction de répartition, dont la valeur en chaque réel x est la probabilité que la variable aléatoire soit inférieure ou égale à x.
Le concept de loi de probabilité (et le concept de variable aléatoire) sont les fondements des disciplines mathématiques appelées théorie des probabilités, et statistique. Il y a de la fluctuation ou de la variabilité dans presque toute valeur qui peut être mesurée dans une population (par exemple la taille des individus, la durabilité d'une pièce de métal, etc.) ; presque toutes les mesures ont une part d'erreur intrinsèque ; en physique, de nombreux processus ont une description probabiliste, de la théorie cinétique des gaz à la description quantique des particules élémentaires. Pour ces raisons en particulier, et pour beaucoup d'autres raisons, de simples nombres sont souvent inadéquats pour décrire une quantité, alors qu'une loi de probabilité est plus appropriée.
Bien des lois de probabilités apparaissent dans les applications. Une des plus importantes est la loi normale, qui est aussi connue sous le nom de distribution gaussienne ou de courbe en cloche et qui approxime de nombreuses lois de probabilités apparaissant dans les applications. Le jet d'une pièce donne lieu à une autre loi de probabilité naturelle, dont les valeurs possibles sont pile ou face, chacune avec probabilité 1/2.
Une loi de probabilité se caractérise de différentes manières. Le plus souvent, on utilise la fonction de répartition pour caractériser une loi. Cela présente l'avantage d'être valable aussi bien pour les lois discrètes que continues. Dans le cas d'une loi continue, on utilise très souvent la densité, alors que dans le cas discret, la donnée des probabilités élémentaires suffit à caractériser la loi en question.
Une variable aléatoire X est discrète si l'ensemble de ses valeurs possibles est fini ou dénombrable. On dit alors que sa loi est discrète. Pour une définition plus formelle, voir la section "Classification des lois de probabilités sur la droite réelle". Pour la plupart des lois discrètes classiques, les valeurs possibles de X sont des entiers naturels. On définit alors la loi discrète en donnant la probabilité que X prenne chaque valeur entière possible n, soit
La loi uniforme discrète correspond à des événements équiprobables (exemple : lancer de dés, n=6 ) :
La loi de Bernoulli correspond à une expérience à deux issues (succès - échec), codées resp. par les valeurs 1, 0, et en général non équiprobables :
C'est la loi du nombre de succès obtenus à l'issue de n épreuves de Bernoulli indépendantes de paramètre p.
On tire simultanément n boules dans une urne contenant pA boules gagnantes et qA boules perdantes (avec q = 1 - p, soit un nombre total de boules valant pA + qA = A). On compte alors le nombre de boules gagnantes extraites et on appelle X la variable aléatoire donnant le nombre de boules gagnantes.
On considère une épreuve de Bernoulli dont la probabilité de succès est p et celle d'échec q = 1 - p.
On renouvelle cette épreuve de manière indépendante jusqu'au premier succès. On appelle X la variable aléatoire donnant le rang du premier succès.
Une variable aléatoire réelle possède une densité de probabilité
, si pour tous nombres réels
on a
On dit aussi alors que la loi de
possède une densité, ou bien est à densité. D'une manière équivalente, on dit que
est absolument continue par rapport à la mesure de Lebesgue.
En conséquence, pour tout nombre réel
et la fonction de répartition
de
est continue. On a plus précisément
Les variables aléatoires à densité sont parfois appelées variables continues.
Loi uniforme continue sur un intervalle borné [a; b] :
La loi de Cauchy n'admet aucun moment (donc ni moyenne ni variance, entre autres).
La Loi de Tukey-Lambda est connue de façon implicite par la distribution de ses quantiles :
elle a par la suite été généralisée.
En théorie des probabilités, une loi (ou mesure) de probabilité est une mesure positive sur un espace mesurable
, telle que
. Le triplet
est appelé espace probabilisé.
Définition — Soit une variable aléatoire réelle sur l'espace probabilisé , c'est-à -dire une fonction mesurable
(l'ensemble
étant muni de sa tribu borélienne
). On appelle loi (de probabilité) de la variable aléatoire
la mesure de probabilité
définie sur l'espace mesurable
par :
pour tout borélien de
Autrement dit,
est la mesure image (en) de
par
.
Deux variables aléatoires réelles et
ont même loi si
(égalité de fonctions). Cela se réécrit
ou bien encore
Plus généralement, deux variables aléatoires réelles et
ont même loi si
pour toute fonction de
dans
telle qu'au moins un des deux termes de l'égalité ait un sens. Cela est dû au théorème de transfert, d'après lequel
Théorème de transfert — Soit une variable aléatoire réelle Alors,
pour toute fonction de
dans
telle qu'au moins un des deux termes de l'égalité ait un sens.
L'intégrale apparaissant dans le deuxième terme est l'intégrale, au sens de la théorie de la mesure, de la fonction φ par rapport à la mesure Cette intégrale prend la forme d'une somme ou d'une intégrale dans les deux cas classiques où X est discrète et où X est à densité, voir ci-dessous.
En probabilité, il est crucial de pouvoir vérifier que deux variables aléatoires (réelles ou pas) ont la même loi de manière la plus économique possible, or les caractérisations ci-dessus exigent de vérifier des familles d'identités beaucoup trop riches (pour tout borélien B, pour toute fonction borélienne φ ...). Une solution plus ergonomique est fournie par les notions de fonction de répartition, ou de fonction caractéristique.
La loi d'une variable aléatoire réelle est caractérisée par sa fonction de répartition : deux variables aléatoires réelles et
ont même loi si elles ont même fonctions de répartition, i.e. si
Ainsi il suffit de vérifier l'égalité caractéristique pour une famille réduite de boréliens très particuliers, les boréliens de la forme
pour démontrer les égalités
et
en toute généralité. Ce résultat crucial est une conséquence du Lemme de classe monotone dû à Wacław Sierpiński.
La loi d'une variable aléatoire réelle est caractérisée par sa fonction caractéristique : deux variables aléatoires réelles et
ont même loi si elles ont même fonction caractéristique, i.e. si
Ainsi il suffit de vérifier l'égalité caractéristique pour une famille réduite de fonctions très particulières, les fonctions de la forme
et
pour démontrer que
et
ont même loi.
La loi d'une variable aléatoire réelle positive ou nulle est caractérisée par sa transformée de Laplace : deux variables aléatoires réelles positives ou nulles et
ont même loi si elles ont même transformée de Laplace, i.e. si
La loi d'une variable aléatoire à valeurs entières positives ou nulles est caractérisée par sa fonction génératrice : deux variables aléatoires à valeurs entières positives ou nulles et
ont même loi si elles ont même fonction génératrice, i.e. si
Les lois énumérées dans cet article sont des mesures de probabilités sur . Ces lois apparaissent en général dans les applications comme les lois de probabilité de certaines variables aléatoires réelles. Les lois énumérées dans cet article sont de deux types :
Il existe d'autres types de variables aléatoires réelles :
L'allure générale des lois de probabilité usuelles fut au début observée empiriquement, puis on en formalisa la définition dans le cadre de la théorie des probabilités en mathématiques.
Les lois de probabilité usuelles sont souvent classées par familles dépendant d'un paramètre. La loi normale par exemple est paramétrée par sa moyenne et son écart type. La plupart des familles usuelles de lois de probabilités sont celles offrant le maximum d'entropie (l'entropie est une mesure de l'information moyenne d'une source, au sens de Claude Shannon, donc le plus d'information) sous contraintes, par exemple :
En quelque sorte, ces lois ne contiennent pas plus d'information que ce qui est obligatoire. Ce sont les moins prévenues de toutes les lois compatibles avec les observations ou les contraintes, et donc les seules admissibles objectivement comme distributions de probabilités a priori lorsque ces valeurs sont imposées et seules connues. Cette propriété joue un grand rôle dans les méthodes bayésiennes.
Cet article est issu de l'encyclopédie libre Wikipedia.