Inscription / Connexion Nouveau Sujet
Niveau Maths sup
Partager :

Estimation

Posté par Profil Marxforito 16-05-20 à 16:00

Bonjour,

J'ai lu pas mal de cours, mais je n'arrive toujours pas à faire la différence entre l'estimation paramétrique et l'estimation non paramétrique.

Merci de vos retour

Posté par
WilliamM007
re : Estimation 16-05-20 à 16:43

Bonjour.

La définition n'est pas forcément la même pour tout le monde.

Dans tous les cas, il est question d'un paramètre, que l'on cherche à estimer, et qui est à l'origine de l'observation.  On pourra dire que l'on fait des statistiques paramétriques lorsque l'estimation de ce paramètre revient à l'estimation d'un vecteur dont le nombre de coordonnées est fixe et ne dépend pas de la taille de l'échantillon. On dira que l'on fait des statistiques non paramétriques dans les autres cas.

Par exemple si tu observes des températures T_1,\cdots,T_n, qui sont des réalisations d'une variable aléatoire suivant une loi gaussienne, tu cherches à estimer une espérance et une variance, donc un vecteur à deux coordonnées. C'est une estimation paramétrique.

En revanche si tu t'intéresses à savoir si les variables T_1,\cdots,T_n sont bien la réalisation d'une variable aléatoire gaussienne, c'est du non paramétrique, puisque tu considères l'éventualité d'être dans l'ensemble de toutes les autres lois de probabilité.

Si tu veux une définition un peu plus formelle. On appelle modèle statistique tout couple (\mathcal X^n,(P_\theta)_{\theta\in\Theta}), où \mathcal X\subset\R^n, \mathcal X est l'espace des observations (tu observes n fois un élément de \mathcal X), et (P_\theta)_{\theta\in\Theta} est une famille de lois de probabilité sur (\mathcal X^n,\mathcal B(\mathcal X^n)). S'il existe p\in\N^* tel que \Theta\subset\R^p, on dit que le modèle est paramétrique. Sinon, il est dit non paramétrique.

Posté par
lionel52
re : Estimation 16-05-20 à 18:09

L'estimation paramétrique et non paramétrique a un peu le même objectif principal. Je vais prendre le cas standard, y a plein d'autres utilisations mais prenons le cas le plus fréquent.

J'ai en ma possession la réalisation de n variables iid qui suivent la même loi L que je note X_1, ...X_n L'objectif est d'obtenir la loi de L.
Quel est l'intérêt en pratique? Ca me permet de calculer des espérances, des quantiles etc, bref tout ce qu'on peut calculer en connaissant une loi donnée.

La principale différence entre le modèle paramétrique et le modèle non paramétrique est que dans le modèle paramétrique, on fait une très grosse hypothèse sur la loi de L. La loi de L est une fonction du paramètre \theta (qui peut être unidimensionnel ou multidimensionnel).
Par exemple dans le modèle gaussien on peut supposer que L = L(\theta) avec \theta = (\mu, \sigma^2)
Dans le modèle de Bernoulli, L = L(p) avec p \in [0,1]

L'intérêt de cette méthode est que le modèle étant fixé, on a des techniques de calcul (typiquement maximum de vraisemblance) qui nous permettent de trouver le paramètre \theta qui "colle" le mieux aux observations X_1, ... X_n.
De plus, une fois le paramètre déterminé on connait parfaitement la loi de X et il est très facile de simuler de nouvelles réalisations de X. De plus, la distribution étant parfaitement connu, on peut, sans simulation calculer des quantiles. Bien entendu, plus le nombre n de réalisations est grand, plus tu approches bien ton paramètre. De plus dans ce type de modèle tu peux en général calculer des intervalles de confiance et faire pas mal de tests statistiques. Enfin les modèles paramétriques sont en général "robustes" dans le sens où rajouter quelques réalisations ne change pas du tout au tout le paramètre estimé.
L'inconvénient principal bien entendu (sinon ça serait trop facile et on ferait toujours ça) est que tu dois définir à priori un modèle. Il n'y a aucune raison que ta loi se ballade dans un L(\theta)
Pour des cas simples (lancer d'une pièce) la famille L(\theta) est forcée (forcément une Bernoulli de paramètre p) donc c'est facile. Pour d'autres cas plus complexes il n'y a pas toujours de solution paramétrique.
Malgré tout en pratique, caler une loi L(\theta) fonctionne souvent est donne de bonnes approximations de la loi, une fois que tu as déterminé un modèle pas trop bête. (Quand tu travailles avec le métier, des gens sur le terrain en général c'est à eux que tu demandes si le modèle est pas trop débile)
Souvent cette méthode est appliquée n'importe comment, on considère que tout est gaussien et ça peut parfois provoquer des "cataclysmes", vraiment! Par exemple en finance autrefois on utilisait beaucoup trop le modèle gaussien, les mouvements browniens etc sauf que les gaussiennes ont le problème de tomber trop vite à 0 une fois qu'on s'éloigne de la moyenne alors que les chocs dans l'économie sont beaucoup moins rares que ça (on dit qu'on a plutot des distributions à queue épaisse, les événéments extremes sont probables)

Le modèle non paramétrique consiste aussi à déterminer la loi L, mais là tu ne fais plus aucune hypothèse sur L. La méthode principale c'est un peu l'utilisation d'histogrammes. J'approxime F(x) (où F est la fonction de répartition associée à L) par \frac{1}{n}\sum 1_{X_i \leq x}, bref c'est la fréquence empirique de réalisations X qui sont inférieures à x.
Tu peux faire ça pour n'importe quelles variables iid X, ça te donne déjà un aperçu de la loi. Le gros problème c'est que les tests statistiques sont monstrueux et pas utilisables en pratique. Tu ne peux pas non plus calculer des quantiles extrêmes si tu n'as pas assez de réalisations (si t'as 100 réalisations et que tu veux calculer le quantile à 0.1%, bah ça sera toujours la plus petite valeur obtenue...)
Il n'empêche qu'une fois ta distribution F (tu peux vérifier qu'elle est en escalier, comme les histogrammes) obtenue, tu peux tenter de lisser F avec des méthodes à noyau ou type spline pour avoir quelque chose de moins dégueulasse.

Posté par
WilliamM007
re : Estimation 17-05-20 à 00:31

Citation :
Souvent cette méthode est appliquée n'importe comment, on considère que tout est gaussien et ça peut parfois provoquer des "cataclysmes", vraiment! Par exemple en finance autrefois on utilisait beaucoup trop le modèle gaussien, les mouvements browniens etc sauf que les gaussiennes ont le problème de tomber trop vite à 0 une fois qu'on s'éloigne de la moyenne alors que les chocs dans l'économie sont beaucoup moins rares que ça (on dit qu'on a plutot des distributions à queue épaisse, les événéments extremes sont probables)

Je rajouterais que la grosse lacune commune aux modèles pré-2008 était l'insuffisance de la prise en compte dans les modèles des corrélations. On avait des risques de défaut, mais ils étaient la plupart du temps considérés indépendants les uns des autres, si bien que l'on considérait que la probabilité qu'un grand nombre de grosses entreprises fassent défaut en même temps était comme la probabilité de faire pile 40 fois de suite, autant dire jamais. Aujourd'hui, les mouvements browniens sont toujours aussi présents, mais fortement corrélés au lieu d'être pris indépendants.

Posté par Profil Marxforitore : Estimation 29-05-20 à 14:34

Merci infiniment



Vous devez être membre accéder à ce service...

Pas encore inscrit ?

1 compte par personne, multi-compte interdit !

Ou identifiez-vous :


Rester sur la page

Inscription gratuite

Fiches en rapport

parmi 1675 fiches de maths

Désolé, votre version d'Internet Explorer est plus que périmée ! Merci de le mettre à jour ou de télécharger Firefox ou Google Chrome pour utiliser le site. Votre ordinateur vous remerciera !