Inscription / Connexion Nouveau Sujet
Niveau école ingénieur
Partager :

Intervalle de confiance, prédiction

Posté par
loic74
06-07-14 à 13:23

Bonjour,

Je vous solicite car je suis amené à utiliser des outils de prévision sur une grandeur et j'aimerais qualifier ces résultats avec un intervalle de confiance.
Pour effectuer ma prévision, j'effectue une régression linéaire de la forme

y=x\beta où y est la variable à expliquer (grandeur à t+h) et x le vecteur des variables explicatives (valeur endogène à t, t-1,... et d'autres grandeurs).  \beta est mon vecteur de paramètres.

Pour cela, j'ai d'abord évaluer mon vecteur \beta sur n échantillons à l'aide des moindres carrés :
X matrice n \times nombre de paramètres \beta
\beta=(X^TX)^{-1}X^TY.

Ensuite, j'ai pris un échantillon de test et j'applique ces paramètres \beta sur mon nouveau vecteur x_0.

J'obtiens une valeur cohérente (malgré un mauvais conditionnement de matrice) que j'aimerais encadrer dans un intervalle de confiance.

Mes cours de statistiques sont un peu loin et je voudrais pas me tromper. Voilà ce que j'ai trouvé comme formule.

\sigma_{y0}^2=x_0^T(X^TX)^{-1}x_0S^2+S^2
avec S^2=E[||y-X\beta||^2]

et l'intervale se déduit y=\pm \sigma_{y0}t(1-\frac{\alpha}{2}) avec t le test de Student qui va bien en fonction du nombre de paramètres et de mon niveau de confiance.

Ma question est de savoir si tout cela a bien un sens (par exemple, je ne vois pas trop d'où sort la formule du \sigma^2 mais je pourrai la calculer). En revanche la formule du S^2, signifie-t-elle que je dois prendre la moyenne des carrés de mes erreurs sur mes échantillons d'apprentissage ?

Merci beaucoup !

Loïc

Posté par
loic74
re : Intervalle de confiance, prédiction 07-07-14 à 11:02

Personne pour confirmer ? :'(

Posté par
Razes
re : Intervalle de confiance, prédiction 07-07-14 à 11:37


Normalement nous avons y=x\beta +\epsilon\epsilon a disparu.?

D'où provient le \alpha dans le test de Student?

Posté par
loic74
re : Intervalle de confiance, prédiction 07-07-14 à 15:01

Bonjour et merci pour ta réponse.

Effectivement, j'aurais du mettre un \epsilon. Cet epsilon est un bruit blanc de variance S^2 , c'est ça ? (avec le S^2 qui me ressert ensuite)

Pour le calculer, j'ai essayé de prendre mes échantillons d'apprentissage et de faire la différence Y-X\beta puis de prendre la norme 2 de ce vecteur, divisé par la taille de ce vecteur (pour avoir l'espérance)

Le soucis, c'est que si, par exemple, j'ai plus de paramètre que d'échantillons (plus de colonne que de ligne dans X) alors j'aurais forcément une erreur nulle non ?

Enfin, j'ai l'impression de me perdre un peu... Si je vous perds aussi, je voudrais juste savoir comment vous feriez pour définir un intervalle de confiance dans ce cas (C'est ce que représente dans mon cas).

Merci beaucoup !



Vous devez être membre accéder à ce service...

Pas encore inscrit ?

1 compte par personne, multi-compte interdit !

Ou identifiez-vous :


Rester sur la page

Inscription gratuite

Fiches en rapport

parmi 1768 fiches de maths

Désolé, votre version d'Internet Explorer est plus que périmée ! Merci de le mettre à jour ou de télécharger Firefox ou Google Chrome pour utiliser le site. Votre ordinateur vous remerciera !