logo

Probabilités


Probabilités : encyclopédie mathématiques

wikipediaCet article est issu de l'encyclopédie libre Wikipedia.
Vous pouvez consulter l'article ici ainsi que son historique.
Les textes et les images sont disponibles sous les termes de la Licence de documentation libre GNU.
Page d'aide sur l'homonymie Pour les articles homonymes, voir Interconnexions entre la théorie des probabilités et la statistique.

La probabilité (du latin probabilitas) est une évaluation du caractère probable d'un évènement. En mathématiques, l'étude des probabilités est un sujet de grande importance donnant lieu à de nombreuses applications.

La probabilité d'un événement est un nombre réel compris entre 0 et 1. Plus ce nombre est grand, plus le risque (ou la chance, selon le point de vue) que l'événement se produise est grand. Si on considère que la probabilité qu'un lancer de pièce donne pile est égale à 1/2, cela signifie que, si on lance un très grand nombre de fois cette pièce, la fréquence des piles va très probablement tendre vers 1/2, sans préjuger de la régularité de leur répartition. Cette notion empirique sera définie plus rigoureusement dans le corps de cet article.

Contrairement à ce que l'on pourrait penser de prime abord l'étude scientifique des probabilités est relativement récente dans l'histoire des mathématiques. D'autres domaines tels que la géométrie, l'arithmétique, l'algèbre ou l'astronomie faisaient l'objet d'étude mathématique durant l'Antiquité mais on ne trouve pas de trace de textes mathématiques sur les probabilités. L'étude des probabilités a connu de nombreux développements au cours des trois derniers siècles en partie grâce à l'étude de l'aspect aléatoire et en partie imprévisible de certains phénomènes, en particulier les jeux de hasard. Ceux-ci ont conduit les mathématiciens à développer une théorie qui a ensuite eu des implications dans des domaines aussi variés que la météorologie, la finance ou la chimie. Cet article est une approche simplifiée des concepts et résultats d'importance en probabilité ainsi qu'un historique de l'usage du terme "probabilité" qui a eu plusieurs autres sens avant celui qu'on lui connaît aujourd'hui en mathématiques.

Sommaire

[modifier] Histoire

Ă€ l'origine, dans les traductions d'Aristote, le mot « probabilitĂ© Â» ne dĂ©signe pas une quantification du caractère alĂ©atoire d'un fait mais l'idĂ©e qu'une idĂ©e est communĂ©ment admise par tous. Ce n'est qu'au cours du Moyen Ă‚ge puis de la Renaissance autour des commentaires successifs et des imprĂ©cisions de traduction de l'Ĺ“uvre d'Aristote que ce terme connaĂ®tra un glissement sĂ©mantique pour finir par dĂ©signer la vraisemblance d'une idĂ©e. Au XVIe siècle puis au XVIIe siècle c'est ce sens qui prĂ©vaut en particulier dans le probabilisme en thĂ©ologie morale. C'est dans la deuxième moitiĂ© du XVIIe siècle, Ă  la suite des travaux de Blaise Pascal, Pierre de Fermat et Christian Huygens[1] sur le problème des partis que ce mot prend peu Ă  peu son sens actuel avec les dĂ©veloppements du traitement mathĂ©matique du sujet par Jakob Bernoulli. Ce n'est alors qu'au XIXe siècle qu'apparaĂ®t ce qui peut ĂŞtre considĂ©rĂ© comme la thĂ©orie moderne des probabilitĂ©s en mathĂ©matiques.

[modifier] La notion de probabilité chez Aristote

Le premier usage du mot probabilitĂ© apparait en 1370 avec la traduction de l'Ă©thique Ă  Nicomaque d'Aristote par Oresme et dĂ©signe alors « le caractère de ce qui est probable Â»[2]. Le concept de probable chez Aristote (ενδοξον, en grec) est ainsi dĂ©fini dans les Topiques[3] :

« Sont probables les opinions qui sont reçues par tous les hommes, ou par la plupart d’entre eux, ou par les sages, et parmi ces derniers, soit par tous, soit par la plupart, soit enfin par les plus notables et les plus illustres Â»

Ce qui rend une opinion probable chez Aristote est son caractère gĂ©nĂ©ralement admis [4]; ce n'est qu'avec la traduction de CicĂ©ron des Topiques d'Aristote, qui traduit par probabilis ou par verisimilis, que la notion de vraisemblance est associĂ©e Ă  celle de « probabilitĂ© Â» ce qui aura un impact au cours du Moyen Ă‚ge puis de la Renaissance avec les commentaires successifs de l'Ĺ“uvre d'Aristote[5].

[modifier] La doctrine de la probabilitĂ© au XVIe siècle et XVIIe siècle

La doctrine de la probabilitĂ©, autrement appelĂ©e probabilisme, est une thĂ©ologie morale catholique qui s'est dĂ©veloppĂ©e au cours du XVIe siècle sous l'influence entre autres de BartolomĂ© de Medina et des jĂ©suites. Avec l'apparition de la doctrine de la probabilitĂ©, ce terme connaĂ®tra un glissement sĂ©mantique pour finir par dĂ©signer au milieu du XVIIe siècle le caractère vraisemblable d'une idĂ©e.

Cette thĂ©ologie morale considère que « si une opinion est probable, il est permis de la suivre, quand bien mĂŞme est plus probable l’opinion opposĂ©e Â» selon la formulation de BartolomĂ© de Medina en 1527. Cette thĂ©ologie morale cherche alors Ă  dĂ©finir quelle action entreprendre quand il existe un doute sur la meilleure action Ă  entreprendre. Cette thĂ©ologie morale a Ă©tĂ© très critiquĂ©e Ă  partir du milieu du XVIIe siècle[6] comme introduisant le relativisme moral, en particulier par les jansĂ©nistes et par Blaise Pascal, qui sera, par ailleurs, l'un des fondateurs du traitement mathĂ©matique du probable[7].

La probabilitĂ© d'une opinion dĂ©signe alors au milieu du XVIIe siècle la probabilitĂ© qu'une opinion soit vraie. Ce n'est qu'Ă  partir de la fin du XVIIe siècle avec l'Ă©mergence de la probabilitĂ© mathĂ©matique que la notion de probabilitĂ© ne concernera plus seulement les opinions et les idĂ©es mais aussi les faits et se rapprochera de la notion de hasard[8] que l'on connaĂ®t aujourd'hui [3].

[modifier] La notion moderne de probabilité

L'apparition de la notion de « risque Â», prĂ©alable Ă  l'Ă©tude des probabilitĂ©s, n'est apparue qu'au XIIe siècle pour l'Ă©valuation de contrats commerciaux avec le TraitĂ© des contrats de Pierre de Jean Olivi[9], et s'est dĂ©veloppĂ©e au XVIe siècle avec la gĂ©nĂ©ralisation des contrats d'assurance maritime[10]. Ă€ part quelques considĂ©rations Ă©lĂ©mentaires par Girolamo Cardano [11] au dĂ©but du XVIe siècle et par GalilĂ©e au dĂ©but du XVIIe siècle, le vĂ©ritable dĂ©but de la thĂ©orie des probabilitĂ©s date de la correspondance entre Pierre de Fermat et Blaise Pascal en 1654.

Ce n'est qu'Ă  partir du milieu du XVIIe siècle avec l'Ă©mergence du traitement mathĂ©matique du sujet qu'est apparu l'usage moderne du terme probabilitĂ©[3].

[modifier] Les probabilitĂ©s du XVIIe au XIXe siècle

Page d'une « copie de la première lettre de Pascal Ă  Fermat Â»[12]

Le véritable début de la théorie des probabilités date de la correspondance entre Pierre de Fermat et Blaise Pascal en 1654. Ceux-ci commencent à élaborer les bases du traitement mathématique des probabilités autour de l'étude de jeux de hasard proposés, entre autres, par le chevalier de Méré. (voir ci-contre une page de la correspondance entre Pascal et Fermat au sujet du problème des partis). Même s'ils sont considérés comme les fondateurs du traitement des probabilités, ils n'ont rien publié de leurs travaux, et il faudra attendre Huygens pour avoir un premier ouvrage sur le sujet.

EncouragĂ© par Pascal, Christian Huygens publie De ratiociniis in ludo aleae (raisonnements sur les jeux de dĂ©s) en 1657. Ce livre est le premier ouvrage important sur les probabilitĂ©s. Il y dĂ©finit la notion d'espĂ©rance et y dĂ©veloppe plusieurs problèmes de partages de gains lors de jeux ou de tirages dans des urnes[13]. Deux ouvrages fondateurs sont Ă©galement Ă  noter : Ars Conjectandi de Jacques Bernoulli (posthume, 1713) qui dĂ©finit la notion de variable alĂ©atoire et donne la première version de la loi des grands nombres[14], et ThĂ©orie de la probabilitĂ© d' Abraham de Moivre (1718) qui gĂ©nĂ©ralise l'usage de la combinatoire[15].

La Théorie des erreurs, qui cherche à quantifier l'écart entre la mesure que l'on fait d'une variable et sa vraie valeur et qui est une préfiguration des théorèmes central limite, voit le jour avec Opera Miscellanea de Roger Cotes (posthume, 1722). Le premier à l'appliquer aux erreurs sur les observations est Thomas Simpson en 1755.

Pierre-Simon de Laplace donne une première version du théorème central limite en 1812 qui ne s'applique alors que pour une variable à deux états, par exemple pile ou face mais pas un dé à 6 faces.

Sous l'impulsion de Quetelet, qui ouvre en 1841 le premier bureau statistique le Conseil Supérieur de Statistique [16], les statistiques se développent et deviennent un domaine à part entière des mathématiques qui s'appuie sur les probabilités mais n'en font plus partie.

[modifier] Naissance de la théorie classique des probabilités

La théorie de la probabilité classique ne prend réellement son essor qu'avec les notions de mesure et d'ensembles mesurables qu'Émile Borel introduit en 1897. Cette notion de mesure est complétée par Henri Léon Lebesgue et sa théorie de l'intégration[17]. La première version moderne du théorème de la limite centrale est donné par Alexandre Liapounov en 1901[18] et la première preuve du théorème moderne est donnée par Paul Lévy en 1910. En 1902, Andrei Markov introduit les chaînes de Markov[19] pour entreprendre une généralisation de la loi des grands nombres pour une suite d'expériences dépendant les unes des autres. Ces chaînes de Markov connaîtront de nombreuses applications entre autres pour modéliser la diffusion ou pour l'indexation de sites internet sur Google.

Il faudra attendre 1933 pour que la théorie des probabilités sorte d'un ensemble de méthodes et d'exemples divers et devienne une véritable théorie, axiomatisée par Kolmogorov[20].

Kiyoshi Itô met en place une théorie et un lemme qui porte son nom dans les années 1940[21]. Ceux-ci permettent de relier le calcul stochastique et les équations aux dérivées partielles faisant ainsi le lien entre analyse et probabilités. Le mathématicien Wolfgang Doeblin avait de son côté ébauché une théorie similaire avant de se suicider à la défaite de son bataillon en juin 1940. Ses travaux furent envoyés à l'Académie des sciences dans un pli cacheté qui ne fut ouvert qu'en 2000[22].

[modifier] Applications

Les jeux de hasard sont l'application la plus naturelle des probabilitĂ©s mais de nombreux autres domaines s'appuient ou se servent des probabilitĂ©s. Citons entre autres :

  • les statistiques, sont un vaste domaine qui s'appuie sur les probabilitĂ©s pour le traitement et l'interprĂ©tation des donnĂ©es.
  • La thĂ©orie des jeux s'appuie fortement sur la probabilitĂ© et est utile en Ă©conomie et plus prĂ©cisĂ©ment en micro-Ă©conomie.
  • l'estimation optimale par usage de la loi de Bayes, qui sert de fondement Ă  une grande partie des applications de dĂ©cision automatique (imagerie mĂ©dicale, astronomie, reconnaissance de caractères, filtres anti-pourriel).
  • En physique ainsi qu'en biologie molĂ©culaire l'Ă©tude du mouvement brownien pour de petites particules ainsi que les Équation de Fokker-Planck font intervenir des concepts s'appuyant sur le calcul stochastique et la marche alĂ©atoire
  • les mathĂ©matiques financières font un large usage de la thĂ©orie des probabilitĂ©s pour l'Ă©tude des cours de la bourse et des produits dĂ©rivĂ©s. Citons par exemple le Modèle de Black-Scholes pour dĂ©terminer le prix de certains actifs financiers (notamment les options).
  • les Etudes Probabilistes de SĂ»retĂ© oĂą l'on Ă©value la probabilitĂ© d'occurrence d'un Ă©vĂ©nement indĂ©sirable. C'est devenu un outil d'Ă©valuation des risques dans bon nombre d'installations industrielles.

[modifier] Principes fondamentaux

La probabilité d'un certain évènement A, \textstyle\mathbb{P}(A), est représenté par un nombre compris entre 0 et 1. Un évènement en probabilité peut être à peu près n'importe quoi pouvant se produire ou non. L'évènement A peut par exemple être le fait qu'il fasse beau demain, le fait d'obtenir un 6 avec un dé, voire le fait que le théorème de Pythagore soit vrai. Le seul impératif que l'on se fixe c'est de pouvoir vérifier si cet évènement se vérifie ou pas. On peut par exemple vérifier s'il fera beau demain, si on obtient un 6 ou si le théorème de Pythagore est vrai.

Un Ă©vènement impossible a une probabilitĂ© de 0 et un Ă©vènement certain a une probabilitĂ© de 1. Il faut savoir que le contraire n'est pas forcĂ©ment vrai. Un Ă©vènement qui a une probabilitĂ© 0 peut très bien se produire dans le cas oĂą un nombre infini d'Ă©vènements diffĂ©rents peut se produire. Ceci est dĂ©taillĂ© dans l'article Ensemble nĂ©gligeable et un exemple d'Ă©vènement de probabilitĂ© 0 et pouvant se produire est (rapidement) esquissĂ© dans la partie loi des grands nombres. De mĂŞme un Ă©vènement de probabilitĂ© 1 peut « exceptionnellement Â» ne pas se produire.

[modifier] La notion d'indépendance

Article dĂ©taillĂ© : IndĂ©pendance (probabilitĂ©s).

On dit que deux évènements sont indépendants lorsque le fait de connaître le résultat du premier évènement ne nous aide pas pour prévoir le second et inversement. C'est le cas lorsque la réalisation d'un évènement n'influence pas la probabilité que l'autre se réalise.

Par exemple lorsque l'on lance deux dés à la suite le résultat obtenu au premier dé ne va pas influencer le deuxième dé. Le fait de connaître le résultat du premier dé ne nous aide en rien pour prévoir le résultat du deuxième. On a toujours une chance sur 6 d'obtenir un 6 au deuxième jet de dé quel que soit le résultat du premier dé. Ce n'est pas parce que l'on a obtenu un 6 au premier jet de dé que cela change la probabilité d'obtenir un 6 au deuxième. Souvent si on mène deux expériences séparément (par exemple lancer un dé) le résultat de la première expérience n'influe pas sur la deuxième et on a alors une indépendance des résultats de la première expérience par rapport à la deuxième.

Cette notion d'indĂ©pendance intervient dans de nombreux thĂ©orèmes par exemple dans la loi des grands nombres et le thĂ©orème central limite exposĂ©s plus bas. En terme mathĂ©matique, deux Ă©vènements A et B sont indĂ©pendants si et seulement s'ils vĂ©rifient : \mathbb{P}(A \cap B) = \mathbb{P}(A) \cdot \mathbb{P}(B) oĂą \mathbb{P}(A\cap B) est la probabilitĂ© d'avoir Ă  la fois A et B. On pourrait montrer grâce aux probabilitĂ©s conditionnelles que cette dĂ©finition recoupe bien l'idĂ©e que l'on se fait de l'indĂ©pendance.

On peut par exemple vĂ©rifier que la probabilitĂ© d'obtenir un 6 Ă  un premier jet de dĂ© est indĂ©pendante de celle d'obtenir un 6 Ă  un deuxième lancer avec cette dĂ©finition. La probabilitĂ© d'obtenir un 6 au premier dĂ© vaut 1/6 (A), celle d'obtenir un 6 au deuxième dĂ© vaut 1/6 (B). On peut grâce aux combinatoires montrer que la probabilitĂ© d'obtenir un double 6 vaut 1/36. On a alors :

\mathbb{P}(A \cap B) =\frac{1}{36}= \mathbb{P}(A) \cdot \mathbb{P}(B)

Le fait d'obtenir un 6 au premier dé est donc bien indépendant du fait d'obtenir un 6 au deuxième dé.

[modifier] Variable aléatoire

Article dĂ©taillĂ© : Variable alĂ©atoire.

Une notion importante en probabilité est celle de variable aléatoire.

Les variables aléatoires furent introduites à l'origine pour représenter un gain. Par exemple effectuons l'expérience suivante, lançons une pièce de monnaie et suivant que le résultat est pile nous gagnons dix euros, ou face nous perdons un euro. On considère alors X, la variable aléatoire qui prend la valeur 10 lorsque nous obtenons pile et la valeur -1 lorsque nous obtenons face. X représente le gain à l'issue d'un lancer de la pièce.

De façon plus gĂ©nĂ©rale une variable alĂ©atoire est une certaine fonction, qui dĂ©pend du rĂ©sultat d'une expĂ©rience alĂ©atoire par exemple dans ce cas le rĂ©sultat du pile ou face. Cette fonction associe une certaine valeur au rĂ©sultat d'une expĂ©rience. Dans notre exemple plus haut la variable alĂ©atoire associe 10 Ă  « pile Â» et -1 Ă  « face Â». Cela permet d'associer des nombres Ă  des rĂ©sultats d'expĂ©riences qui ne sont pas numĂ©riques.

Le terme de variable aléatoire peut parfois être trompeur, en effet, ce n'est pas la valeur qu'elle prend une fois que l'on connaît le résultat de l'expérience qui est aléatoire, mais la valeur qu'elle va prendre avant d'avoir effectué l'expérience. Une fois que l'on connaît le résultat du pile ou face on connaît la valeur de X, notre gain, avec certitude et celle-ci ne dépend pas du hasard. Par contre, avant de jeter la pièce on ne sait pas quelle valeur va prendre X car on ne sait pas encore si l'on va obtenir pile ou face.

On ne considèrera ici que des variables aléatoires qui sont des nombres réels. De façon encore plus générale une variable aléatoire peut soit être un vecteur avec des coordonnées réelles soit un nombre réel. Il faut alors définir la loi jointe ainsi qu'une mesure sur un espace à plusieurs dimensions ce qui entraine des complications supplémentaires. Néanmoins pour des cas concrets on peut souvent se contenter de considérer plusieurs variables aléatoires qui dépendent de la même expérience. La restriction au cas de variables réelles n'est donc pas forcément aussi réducteur que l'on pourrait le penser.

[modifier] Fonction de répartition et densité

Article dĂ©taillĂ© : Fonction de rĂ©partition.
Article dĂ©taillĂ© : DensitĂ© de probabilitĂ©.
Fonction de répartition de la loi normale centrée réduite

En probabilitĂ©, la fonction de rĂ©partition d'une variable alĂ©atoire X est la fonction \ F_X qui Ă  tout rĂ©el x associe la probabilitĂ© que la variable X soit plus petite que x :


 F_X(x) = \mathbb{P}(X\leq x).

C'est une fonction croissante, allant de 0 Ă  1.

Pour les variables dont la fonction de rĂ©partition est absolument continue, on dĂ©finit alors la densitĂ© de probabilitĂ©, qui est la dĂ©rivĂ©e de F par rapport Ă  x :

f_X(x) = \frac{\textrm{d} \mathbb{P}(X\leq x)}{\textrm{d} x}.

La connaissance de la densité de probabilité permet notamment, en intégrant, de calculer la probabilité que X soit, par exemple, compris entre a et b.

[modifier] L'espérance

Article dĂ©taillĂ© : EspĂ©rance mathĂ©matique.

L'espĂ©rance est un nombre qui se confond souvent avec la moyenne d'une variable, voir Ă  ce sujet la loi des grands nombres ou le prochain paragraphe. C'est une valeur numĂ©rique permettant d'Ă©valuer le rĂ©sultat moyen d'une expĂ©rience alĂ©atoire. On la dĂ©finit par :

\mathbb{E}(X) = \sum_{i=1}^{k}p_i\, x_i pour une variable discrète (avec un nombre fini de réalisations possibles).
Par exemple, pour un dé à 6 faces, chaque face a une probabilité 1/6 d'apparaître et l'espérance vaut alors \textstyle\frac{1+2+3+4+5+6}{6}=3,5.
\mathbb{E}(X) = \int_{\mathbb{R}} x\, f(x)\, \textrm{d}x pour une variable continue de densité f.

[modifier] Deux théorèmes de base des probabilités

Deux théorèmes mathématiques ont une place particulière en probabilité. Ces deux théorèmes sont la loi des grands nombres et le théorème central limite et sont présentés ici succinctement pour en faire comprendre l'intérêt et l'usage.

[modifier] Loi des grands nombres

Article dĂ©taillĂ© : Loi des grands nombres.

On ne présente ici que la loi forte des grands nombres mais il faut savoir que d'autre versions de lois des grands nombres existent.

Pour des variables alĂ©atoires indĂ©pendantes, de mĂŞme loi X_i et dont l'espĂ©rance existe :

\frac{X_1+X_2+...+X_n}{n} \underset{n\rightarrow\infty}{\longrightarrow} \mathbb{E}(X)

Concrètement cette loi nous dit que la moyenne empirique d'une variable tend vers son espérance. Par exemple, pour un dé à 6 faces que l'on jetterait plusieurs fois de suite, la moyenne des lancers tend vers l'espérance 3,5.

Tendre vers est pris au sens presque sĂ»rement, comme bien souvent en probabilitĂ©, c'est-Ă -dire que la probabilitĂ© que cela arrive est Ă©gale Ă  1. Comme esquissĂ© dans les principes fondamentaux il peut très bien se faire qu'« exceptionnellement Â» cette moyenne ne tende pas vers l'espĂ©rance. On pourrait très bien, par exemple, ne tirer que des 1 lors des lancers de dĂ©s et que la moyenne soit alors 1 mais cela n'arrive « jamais Â». En gĂ©nĂ©ral, si on lance des dĂ©s suffisamment de fois on tombera autant de fois sur chacune des 6 faces. Ce thĂ©orème formalise cette remarque de bon sens.

[modifier] Théorème central limite

Article dĂ©taillĂ© : thĂ©orème de la limite centrale.
loi normale

Ce thĂ©orème central limite est utile pour savoir comment une somme entre une rĂ©alisation d'une variable et la valeur moyenne se comporte. La loi des grands nombres montre que la moyenne des rĂ©alisations tend vers l'espĂ©rance. Quant au thĂ©orème central limite, il montre de quelle façon cette moyenne tend vers l'espĂ©rance. Une façon simple, mais pas très rigoureuse, d'Ă©crire ce thĂ©orème permet de mieux comprendre son utilitĂ© :

\frac{\displaystyle \sum_{k=0}^{n}(X_k-\mathbb{E}(X))}{n} \underset{n\rightarrow\infty}{\simeq} \mathcal N\left(0,\frac{\sigma}{\sqrt{n}}\right)

\mathcal N \left(0,\frac{\sigma}{\sqrt{n}}\right) est la loi normale de variance \textstyle\frac{\sigma^{2}}{n}, autrement appelĂ©e gaussienne et reprĂ©sentĂ©e ci-contre. Ce thĂ©orème a une très grande utilitĂ© en physique par exemple. Il peut se comprendre par « La moyenne des erreurs observĂ©es tend vers une loi normale. Â» La somme d'un grand nombre d'erreurs sur des observations par exemple est presque gaussienne. Elle serait gaussienne si on sommait une infinitĂ© d'erreurs mais en pratique cela n'est pas souvent le cas. La loi gaussienne fournit alors une approximation pour la loi de l'erreur souvent plus facilement utilisable que la loi exacte qui n'est pas tout le temps connue. De plus bon nombre de phĂ©nomènes naturels sont dus Ă  la superposition de causes nombreuses, plus ou moins indĂ©pendantes qui se somment entre elles. Il en rĂ©sulte que la loi normale les reprĂ©sente de manière raisonnablement efficace.

Pour ĂŞtre plus correct, il faudrait Ă©crire le thĂ©orème central limite de la façon suivante :

\frac{1}{\sigma\sqrt{n}}\sum_{k=0}^{n}(X_k-\mathbb{E}(X)) \underset{n\rightarrow\infty}{\longrightarrow} \mathcal N(0,1)

oĂą la limite est prise au sens de tendre en loi, c'est-Ă -dire que la distribution de terme de gauche tend vers la distribution d'une gaussienne.

Il faut également savoir qu'il existe de nombreuses généralisations de ce théorème, entre autres pour des variables qui ne seraient pas identiquement distribuées (conditions de Liapounov ou conditions de Lindeberg [23]) ou pour des variables de variance infinie (due à Gnedenko et Kolmogorov[24])

[modifier] Le calcul des probabilités

Il existe deux façons de calculer les probabilitĂ©s en mathĂ©matiques : le calcul a priori et le calcul a posteriori.

La première méthode, aussi appelée probabilité mathématique, part d'un calcul mathématique pour obtenir les probabilités. C'est le cas en particulier de la combinatoire, mais également des caractérisations de la loi exponentielle ou de la modélisation par une loi normale grâce à l'usage du théorème central limite. Ces méthodes ont en commun le fait qu'aucune expérience ne soit nécessaire pour déterminer les probabilités qui sont déterminées a priori.

La deuxième méthode est le calcul a posteriori, autrement appelé probabilité statistique, ces méthodes partent des résultats d'expériences pour déduire les probabilités. C'est le cas par exemple pour l'utilisation de la fréquence comme estimateur de la probabilité, du maximum de vraisemblance ou de l'Inférence bayésienne. Ces méthodes ont en commun le fait qu'une expérience soit nécessaire pour déterminer les probabilités qui sont déterminées a posteriori.

Nous présentons ici les principales méthodes permettant le calcul des probabilités.

[modifier] L'usage de la combinatoire en probabilité

Article dĂ©taillĂ© : Combinatoire.

Certains problèmes de calcul de probabilité peuvent se ramener à un calcul de dénombrement, en particulier ceux pour lesquels il y a un nombre fini d'issues possibles à l'expérience et où la probabilité de chaque issue est la même. Cette méthode consiste à compter (dénombrer) le nombre total de cas possibles et le nombre de cas favorables à la réalisation d'un évènement.

Cette méthode permet par exemple de calculer la probabilité d'obtenir un 6 avec un dé équitable ou la probabilité d'obtenir un nombre pair, elle ne permet pas de calculer les probabilités avec un dé biaisé par exemple car alors la probabilité d'obtenir chaque face n'est plus la même. Cette méthode ne permet pas non plus de calculer la probabilité lorsqu'il y a un nombre infini de résultats possibles à l'expérience.

[modifier] Estimateurs statistiques

Article dĂ©taillĂ© : Estimateur (statistique).

Les estimateurs statistiques sont des valeurs calculées à partir d'un échantillon de la population totale ou d'un certain nombre de résultats de l'expérience aléatoires. Ces estimateurs sont souvent construits sur le principe du maximum de vraisemblance qui permet de construire tout une série d'estimateurs.

Parmi ceux-ci l'estimation par la frĂ©quence d'apparition permet de dĂ©terminer la probabilitĂ© d'un Ă©vènement lorsqu'il y a un nombre fini d'Ă©vènements possibles et que l'on peut reproduire un grand nombre de fois et de façon indĂ©pendante l'expĂ©rience. Cet estimation peut, par exemple, servir pour obtenir la probabilitĂ© d'obtenir pile lors d'un lancer de pièce ou un 6 avec un jet de dĂ©, qu'il soit biaisĂ© ou non. Il consiste Ă  estimer la probabilitĂ© d'un Ă©vènement par sa frĂ©quence d'apparition quand on rĂ©pète un très grand nombre de fois l'expĂ©rience :

Par exemple si nous effectuons N lancers d'une pièce et que NF reprĂ©sente le nombre de fois oĂą la pièce tombe sur face, Ă  mesure que N devient de plus en plus grand, nous nous attendons Ă  ce que le rapport NF/N devienne de plus en plus proche de 1/2. Cela nous suggère de dĂ©finir la probabilitĂ© P(F) d'obtenir face comme Ă©tant la limite, quand N tend vers l'infini, de la suite des proportions :

\lim_{N \to \infty}\frac{N_F}{N}=\mathbb{P}(F)

Cet estimateur pour la probabilité d'un évènement est, entre autres, un cas particulier de la loi des grands nombres en prenant par exemple la variable aléatoire X qui vaut 1 quand on obtient face et 0 sinon. Cette variable s'appelle la fonction caractéristique de F.

Des généralisations pour des variables continues existent par exemple la distribution empirique ou les estimateurs à noyaux. Ces estimateurs statistiques ont tous pour principal défaut le fait qu'il faut pouvoir répéter un grand nombre de fois l'expérience aléatoire ce qu'il n'est pas toujours possible de faire. Par exemple dans la pratique, nous ne pouvons pas lancer une pièce une infinité de fois.

[modifier] Révision bayésienne

Article dĂ©taillĂ© : infĂ©rence bayĂ©sienne.

La rĂ©vision bayĂ©sienne est une autre mĂ©thode pour le calcul des probabilitĂ©s. Elle est utilisĂ©e entre autres en thĂ©orie des jeux ou en intelligence artificielle pour crĂ©er des processus d'apprentissage. Elle se base sur la rĂ©vision au fur et Ă  mesure des expĂ©riences d'une croyance initiale (autrement appelĂ©e « probabilitĂ© a priori Â» quand cela n'entraine pas de confusion avec les probabilitĂ©s a priori dĂ©crites dans l'introduction de cette section). Le choix de cette croyance initiale dĂ©pend des contraintes imposĂ©es Ă  la distribution de probabilitĂ©. On choisit de toutes les distributions compatibles avec les contraintes celle d'entropie maximale, car c'est celle qui contient le moins d'information ajoutĂ©e[25] Nous prĂ©sentons seulement ici le mĂ©canisme qui permet de rĂ©viser cette croyance initiale. Celle-ci se fait grâce au thĂ©orème de Bayes :

\mathbb{P}(\mathrm{Hypothese|Preuve}) = \frac{\mathbb{P}(\mathrm{Preuve|Hypothese})\mathbb{P}(\mathrm{Hypothese})}{\mathbb{P}(\mathrm{Preuve})}.

Dans cette version la croyance initiale est P(hypothèse). C'est la probabilitĂ© qu'une certaine hypothèse se vĂ©rifie. Cette croyance initiale est alors rĂ©visĂ©e grâce Ă  une preuve que l'on peut observer. On en dĂ©duit une nouvelle probabilitĂ© que l'hypothèse initiale soit vĂ©rifiĂ©e en tenant compte de la preuve que l'on a observĂ©e. Ce processus s'appelle la « rĂ©vision des croyances Â».

Notons ici que les termes Preuve et Hypothèse ont Ă©tĂ© choisis pour exprimer le lien qui devrait exister entre les deux Ă©vĂ©nements et ainsi que le caractère asymĂ©trique de ces deux Ă©vĂ©nements. On aurait très bien pu prendre deux Ă©vĂ©nements A et B par exemple. Dans la pratique il faut que l'Ă©vĂ©nement « preuve Â» s'il se rĂ©alise rende plus probable (ou moins probable) la rĂ©alisation de l'Ă©vĂ©nement « hypothèse Â» pour que cette mĂ©thode aboutisse. Ces deux Ă©vĂ©nements ne doivent pas par exemple ĂŞtre indĂ©pendants.

Par exemple :

  1. On se demande quel temps il fera demain. On regarde pour cela la mĂ©tĂ©o. On connaĂ®t la probabilitĂ© que la mĂ©tĂ©o a d'annoncer qu'il fera beau sachant qu'il fera effectivement beau : p(M|Beau)=0.9 et la probabilitĂ© que la mĂ©tĂ©o annonce qu'il fait beau sachant qu'il pleuvra : P(M|Pleut)=0.2. Ces probabilitĂ©s ont par exemple Ă©tĂ© estimĂ©es par d'autres mĂ©thodes sur l'annĂ©e Ă©coulĂ©e. L'Ă©vĂ©nement M dĂ©note ici le fait que la mĂ©tĂ©o annonce du beau temps.
  2. On part d'une croyance a priori sur le fait qu'il fera beau ou pas demain. Par exemple : P(Beau)=1/2 on croit a priori qu'il y a une chance sur deux qu'il fera beau demain. Ici notre hypothèse est le fait qu'il fera beau demain.
  3. On estime P(M) la probabilitĂ© que la mĂ©tĂ©o annonce qu'il fasse beau grâce Ă  notre croyance initiale : P(M)=p(M|Beau)P(Beau)+p(M|pleut)P(pleut)=0.9 \times 1/2+0.2\times1/2=0.55 la mĂ©tĂ©o annonce qu'il fait beau dans 55 % des cas. La probabilitĂ© qu'il fera beau demain sachant que la mĂ©tĂ©o a annoncĂ© beau temps est alors donnĂ©e par :

p(\mathrm{Beau|M})=\frac{p(\mathrm{M|Beau})p(\mathrm{Beau})}{P(\mathrm{M})}=0.9\times0.5/0.55.\approx 82%

On pourrait alors, par exemple, réviser une deuxième fois l'hypothèse qu'il fera beau en regardant un deuxième bulletin météo d'une source différente. On prendrait alors comme croyance initiale la probabilité qu'il fasse beau que l'on vient de calculer.

Cette méthode permet de réviser la croyance que l'on a dans le fait qu'un événement futur va se passer. Cette méthode n'est employable que lorsque l'on a la possibilité d'estimer les probabilités conditionnelles p(M|Beau) p(M|pleut)

\mathbb{P}(\mathrm{Preuve|Hypothese}) dans la formule donnée plus haut ainsi que \mathbb{P}(\mathrm{Preuve|non Hypothese}) pour calculer \mathbb{P}(\mathrm{Preuve}) Cette méthode peut être utile car il est souvent plus simple de calculer les probabilités des observables conditionnées aux paramètres que de faire le contraire.

[modifier] Interprétation des probabilités

Il existe deux façons de considérer les probabilités. La première historiquement a consisté à effectuer des calculs combinatoires dans le cas de jeux de hasard (Pascal, Bernoulli, Pólya…) cette approche peut se qualifier d'objective. La seconde, qui a commencé à se répandre vers 1974, est fondée sur le Théorème de Cox-Jaynes, qui démontre sous des hypothèses raisonnables que tout mécanisme d'apprentissage est soit isomorphe à la théorie des probabilités, soit incohérent. Dans cette seconde approche, la probabilité est considérée comme la traduction numérique d'un état de connaissance et donc une valeur subjective (mais néanmoins obtenue par un processus rationnel); la subjectivité s'explique par le fait que le contexte d'interprétation d'un événement diffère chez chacun. C'est l'école bayésienne[26].

L'idĂ©e de probabilitĂ© est le plus souvent sĂ©parĂ©e en deux concepts :

  1. la probabilitĂ© de l'alĂ©atoire, qui reprĂ©sente la probabilitĂ© d'Ă©vĂ©nements futurs dont la rĂ©alisation dĂ©pend de quelques phĂ©nomènes physiques alĂ©atoires, comme obtenir un as en lançant un dĂ© ou obtenir un certain nombre en tournant une roue ;
  2. la probabilitĂ© de l'Ă©pistĂ©mĂ©, qui reprĂ©sente l'incertitude que nous avons devant des affirmations, lorsque nous ne disposons pas de la connaissance complète des circonstances et des causalitĂ©s. De telles propositions peuvent avoir Ă©tĂ© vĂ©rifiĂ©es sur des Ă©vĂ©nements passĂ©s ou seront peut-ĂŞtre vraies dans le futur. Quelques exemples de probabilitĂ©s de l'Ă©pistĂ©mĂ© sont, par exemple, assigner une probabilitĂ© Ă  l'affirmation qu'une loi proposĂ©e de la physique est vraie, ou dĂ©terminer comment il est « probable Â» qu'un suspect ait commis un crime, en se basant sur les preuves prĂ©sentĂ©es.

Une probabilitĂ© est-elle rĂ©ductible Ă  notre incapacitĂ© Ă  prĂ©dire prĂ©cisĂ©ment quelles sont les forces qui pourraient affecter un phĂ©nomène, ou fait-elle partie de la nature de la rĂ©alitĂ© elle-mĂŞme ainsi que le suggère la mĂ©canique quantique ou la thĂ©orie du chaos ? La question reste Ă  ce jour ouverte (voir aussi Principe d'incertitude).

Bien que les mĂŞmes règles mathĂ©matiques s'appliquent indĂ©pendamment de l'interprĂ©tation choisie, le choix a des implications philosophiques importantes : parlons-nous jamais du monde rĂ©el (et a-t-on le droit d'en parler ?) ou bien simplement des reprĂ©sentations que nous en avons ? Ne pouvant par dĂ©finition diffĂ©rencier le monde rĂ©el de ce que nous connaissons, il est bien entendu impossible de trancher de notre point de vue : la question est pour nous, par nature, subjective (voir aussi libre arbitre).

Des descriptions mathématiques rigoureuses de ce type de problèmes ne virent le jour que récemment, en particulier depuis

  • Blaise Pascal au XVIIe siècle pour le dĂ©ductif,
  • Thomas Bayes et Pierre-Simon de Laplace au XVIIIe siècle pour l'inductif.

Pour donner un sens mathĂ©matique possible, et par ailleurs rĂ©ducteur, Ă  une probabilitĂ©, considĂ©rez une pièce de monnaie que vous lancez. Intuitivement, nous considĂ©rons la probabilitĂ© d'obtenir face Ă  n'importe quel lancer de la pièce Ă©gale Ă  1/2 ; mais que signifie opĂ©rationnellement cette phrase ? Si nous lançons la pièce 9 fois de suite, la pièce ne pourra Ă©videmment pas tomber « quatre fois et demie Â» de chaque cĂ´tĂ©; il est mĂŞme possible d'obtenir 6 face et 3 pile, voire 9 face de suite. Que signifie dans ce cas le rapport 1/2 dans ce contexte et que pouvons-nous exactement en faire ?

[modifier] Le calcul stochastique

Article dĂ©taillĂ© : calcul stochastique.

Un processus stochastique est un processus alĂ©atoire qui dĂ©pend du temps. Un processus stochastique est donc une fonction de deux variables : le temps et la rĂ©alisation ω d'une certaine expĂ©rience alĂ©atoire.

Un exemple de processus stochastique: la marche aléatoire. Ici on a représenté trois marches aléatoires indépendantes

Parmi les processus stochastiques, les chaînes de Markov constituent sans doute celui avec le plus d'applications pratiques. Ce sont des processus pour lesquels la prédiction du futur à partir du présent ne nécessite pas la connaissance du passé. Ces chaînes de Markov permettent de modéliser des phénomènes pour lesquels il suffit de connaître l'état présent pour pouvoir prévoir ce qui va se passer.

Ceci s'oppose, par exemple, Ă  la notion d'hystĂ©rĂ©sis en physique oĂą l'Ă©tat actuel dĂ©pend de l'histoire et non seulement de l'Ă©tat actuel. Les chaĂ®nes de Markov sont, entre autres, liĂ©es au mouvement brownien et Ă  l'hypothèse ergodique, deux sujets de physique statistique qui ont Ă©tĂ© très importants au dĂ©but du XXe siècle. Ils ont depuis connu d'autres utilisations pour Ă©tudier, par exemple, les fluctuations du marchĂ© boursier ou la reconnaissance vocale. En temps discret, les processus stochastiques sont aussi connus sous le nom de sĂ©ries temporelles et servent entre autres en Ă©conomĂ©trie oĂą ils ont une importance particulière.

[modifier] Références

  1. ↑ Ces trois auteurs n'ont jamais utilisĂ© le terme « probabilitĂ© Â» dans le sens qu'il prend par la suite avec le « calcul des probabilitĂ©s Â». Voir Norbert Meusnier : La passe de l'espĂ©rance. Sur l'Ă©mergence d'une mathĂ©matique du probable au 17ème siècle (1996).
  2. ↑ voir l'entrée probabilité du dictionnaire TLFI
  3. ↑ a, b et c 'De la doctrine de la probabilité à la théorie des probabilités' thèse de philosophie de Anne-Sophie Godfroy-Genin
  4. ↑ étude philosophique sur Aristote
  5. ↑ analyse du sens de "probabilitĂ©" au XVIe siècle dans les commentaires des Topiques
  6. ↑ Catholic encyclopeida, 1911, article sur le probabilisme.
  7. ↑ un site sur la pensée de Pascal.
  8. ↑ Pour dĂ©signer cette mathĂ©matique du probable, Pascal, en 1654, parle de « GĂ©omĂ©trie du hasard Â».
  9. ↑ http://www.jehps.net/Juin2007/Piron_incertitude.pdf, Journ@l Électronique d’Histoire des Probabilités et de la Statistique
  10. ↑ http://www.jehps.net/Juin2007/Ceccarelli_Risk.pdf, Journ@l Électronique d’Histoire des Probabilités et de la Statistique
  11. ↑ http://www.cict.fr/~stpierre/histoire/node1.html site sur l'histoire des probabilités
  12. ↑ Œuvres de Blaise Pascal, Volume 2, Lefèvre, 1819, lettre du 29 juillet 1654, p. 371
  13. ↑ Les probabilitĂ©s : Approche historique et dĂ©finition.
  14. ↑ http://www.cict.fr/~stpierre/histoire/node3.html, une histoire de la probabilité jusqu'à Laplace
  15. ↑ Ian Hacking L'emergence des probabilitées
  16. ↑ http://statbel.fgov.be/info/quetelet_fr.asp, une biographie de Quetelet
  17. ↑ http://www.cict.fr/~stpierre/histoire/node4.html histoire des probabilités de Borel à la seconde guerre mondiale
  18. ↑ Entre De Moivre et Laplace
  19. ↑ DicoMaths : Chaine de Markov
  20. ↑ un article sur la mise en place de l'axiomatisation des probabilités.
  21. ↑ Biographie d'Itô sur le site de Mac Tutor
  22. ↑ Bernard Bru et Marc Yor (Ă©d.), « Sur l'Ă©quation de Kolmogoroff, par W Doeblin Â», C. R. Acad. Sci. Paris, SĂ©rie I 331 (2000). Sur la vie de Doeblin, voir Bernard Bru, « La vie et l'Ĺ“uvre de W. Doeblin (1915-1940) d'après les archives parisiennes Â», Math. Inform. Sci. Humaines 119 (1992), 5-51 et, en anglais, Biographie de Doeblin sur le site de Mac Tutor
  23. ↑ (en):différentes versions du théorème central limite
  24. ↑ Gnedenko-Kolmogorov, Limit distributions for sums of independant random variables. Nouvelle édition. Addison Wesley, 1968
  25. ↑ publication de l'Insee sur l'analyse statistique bayésienne, mais les méthodes bayésiennes ne concernent pas que les statistiques
  26. ↑ pour plus de détails sur l'objectivité et la subjectivité en probabilité

[modifier] Bibliographie

  • Bernard Courtebras, MathĂ©matiser le hasard, Ă©ditions Vuibert, 2008
  • Ian Hacking, L'Émergence de la ProbabilitĂ©, Seuil, 2002 ISBN 978-2-02-043859-9
  • Olav Kallenberg, Probabilistic Symmetries and Invariance Principles. Springer -Verlag, New York, 2005 ISBN 0-387-25115-4
  • Olav Kallenberg, Foundations of Modern Probability, 2nd ed. Springer Series in Statistics, 2002 ISBN 0-387-95313-2
  • Peter Olofsson, Probability, Statistics, and Stochastic Processes, Wiley-Interscience, 2005 ISBN 0-471-67969-0.
  • Jacob Rosenthal, Wahrscheinlichkeiten als Tendenzen. Eine Untersuchung objektiver Wahrscheinlichkeitsbegriffe. Mentis, Paderborn 2004. ISBN 3-89785-373-6

[modifier] Voir aussi

Sur les autres projets Wikimedia :

[modifier] Articles connexes

  • ThĂ©orie des probabilitĂ©s
  • Calcul stochastique
  • Variable alĂ©atoire
  • Loi de probabilitĂ©
  • Cindynique
  • Loi des grands nombres
  • ThĂ©orème de la limite centrale
  • ProbabilitĂ© (mathĂ©matiques Ă©lĂ©mentaires) pour une première approche de la notion
  • Chance
  • PlausibilitĂ©

[modifier] Liens externes

wikipediaCet article est issu de l'encyclopédie libre Wikipedia.
Vous pouvez consulter l'article ici ainsi que son historique.
Les textes et les images sont disponibles sous les termes de la Licence de documentation libre GNU.


maths - prof de maths haut de pagehaut Retrouvez cette page sur ilemaths l'île des mathématiques
© Tom_Pascal & Océane 2012