Inscription / Connexion Nouveau Sujet
Niveau LicenceMaths 2e/3e a
Partager :

Exercice traitant de MCO

Posté par
ZiYun
06-01-20 à 01:14

Bonjour !

J'essaye de travailler un exercice de MCO, mais je bloque sur certaines questions. J'espère que vous pourrez m'indiquer le chemin à suivre afin de les résoudre.
L'exercice porte sur la consommation de cigarettes en France et les différents facteurs explicatifs de ce phénomène du coup. La variable à expliquer est le nombre de cigarettes vendues par mois en France, et les variables explicatives sont le Prix (le prix moyen d'une cigarette pendant le mois considéré), Saisie (le nombre de saisies de paquets de contrebande effectuées par les douanes), quantitesaisie (la quantité de cigarettes saisie en kg par les services des douanes),medicament (les ventes de médicaments d'aide à l'arrêt de fumer), TIS (le nombre d'appels
traités par la ligne téléphonique Tabac Info Service), campagne (le nombre
de jours de campagnes de prévention mis en place par l'Etat), et budget (le budget alloué à l'ensemble de ces campagnes).
Les résultats de l'estimation par moindres carrés ordinaires sont donnés dans un tableau en pièce jointe.
Je donnerais toutes les questions et les réponses auxquelles je suis parvenues et qu'est-ce que j'ai tenté pour les questions que je n'ai pas résolu.
Notons pour des raisons de commodité, Y les observations de la variable à expliquer sous forme d'un vecteur (un vecteur colonne de taille 9*12=108), X
la matrice qui contient les observations des variables explicatives (matrice de taille (108,8) du coup), B le vecteur colonne des coefficients des variables explicatives, et u le vecteur colonne des erreurs théoriques, e le vecteur colonne des erreurs empiriques. On notera aussi t_{\alpha },F_{\alpha }... des quantiles pour la loi de Student, loi de Fischer... mais dans d'autres contextes où t,F appraissent sans indice, ce seraient des variables aléatoires dont l'expression est précisée.

1)Tester si le modèle est globalement significatif.

--->Je sais qu'un modèle est globalement significatif si on peut rejetter l'hypothèse que tous les coefficients (sauf la constante) sont nuls. Pour cela on doit montrer que F=\frac{R^{2}}{1-R^{2}}\frac{T-k}{k-1}>F_{\alpha }R^{2} est le coefficient d'autocorrélation/de détermination. T
est le nombre d'observations (ici T=9*12=108), et k est le nombre de variables explicatives (ici k=8), et généralement on prend  \alpha =0.05.
Pour calculer le coefficient d'autocorrélation : R^{2}=\frac{Var(\hat{Y})}{Var(Y)}=\frac{\sum_{i=1}^{108}{(\hat{Y_{i}}-\bar{Y})^{2}}}{\sum_{i=1}^{108}{(Y_{i}-\bar{Y})^{2}}}=1-\frac{SCR}{\sum_{i=1}^{108}{(Y_{i}-\bar{Y})^{2}}}
Sauf qu'on pas Y pour en déduire ce coefficient. Ni X pour en déduire \hat{Y}.


2)Calculer le coefficient de détermination du modèle. Quelle conclusion peut-on en tirer ?

--->C'est le même problème qu'à la question d'avant. Et en ce qui concerne les conclusions, je sais qu'on dit que plus ce coefficient est proche de 1 plus le modèle est mieux, mais en fait, il ne mesure que la corrélation, ce qui ne refléte pas forcément l'existence d'une "vraie" relation.


3)Déterminer l'intervalle de confiance (à 95%) pour le coefficient associé à la variable medicament et donner en une interprétation.

--->Notons le coefficient de cette variable \beta _{5}, on cherche donc un intervalle I tel que P(\hat{\beta _{5}}\in I)=0.95. L'intervalle est donné par la formule suivante : I=[\hat{\beta _{5}}-\hat{\sigma _{5}}.t_{\alpha /2,T-k},\hat{\beta _{5}}+\hat{\sigma _{5}}.t_{\alpha /2,T-k}].
Selon le tableau: \hat{\beta _{5}}=-0.0038, \hat{\sigma_{5}}=0.0006 et t_{\alpha /2,T-k}=t_{0.025,100}=1.960
L'intervalle est donc : [-0.004976,-0.002624]


4)Quelles sont les variables significatives dans ce modèle ? Commenter littérairement les résultats. En particulier, quelles sont vos préconisations pour lutter contre le tabagisme ?

--->Pour savoir si une variable est significative ou non, il faut calculer la statistique de test : t=\frac{\hat{\beta _{j}}}{\hat{\sigma_{j}} } et comparer \left| t\right| à t_{\alpha /2}. Donc déjà t_{\alpha /2}=1.960.
Pour la constante: t=\frac{10346.35}{467.115}=22.14. La variable est donc significative.
Pour le prix: \left| t\right|=\frac{1263.521}{131.207}=9.62. La variable est donc significative.
Pour la saisie: \left| t\right|=\frac{0.330}{0.310}=1.06. La variable n'est donc pas significative.
Pour la quantitesaisie: \left| t\right|=\frac{0.046}{0.006}=7.66. La variable est donc significative.
Pour les medicament: \left| t\right|=\frac{0.0038}{0.0006}=6.33. La variable est donc significative.
Pour le TIS: \left| t\right|=\frac{0.022}{0.029}=0.75. La variable n'est donc pas significative.
Pour les campagnes: \left| t\right|=\frac{4.187}{4.943}=0.84. La variable n'est donc pas significative.
Pour le budget: \left| t\right|=\frac{0.00005}{0.00005}=1. La variable n'est donc pas significative (bien sûr vu que les campagnes ne servent pas à grand chose...).
On ne peut pas dire que les campagnes ne servent à rien, mais peut être réduire le budget. Et se focaliser sur les quantités saisies que sur le nombre de saisies bien sûr. Et augmenter le prix du tabac. (Serait-ce la même chose pour le réchauffement climatique ? Diminuer les campagnes de sensibilisation et augmenter la taxe de carbone ? Des propos qui en feront rager des milliers je plaisantais bien sûr).


5)Calculer l'élasticité-prix des ventes de cigarettes en mars 2010 sachant que le nombre de cigarettes vendues était de 5000 et le prix moyen de 5.15 euros.

--->Là je ne sais vraiment pas de quoi ca parle. Je n'ai pas vu dans le cours ce qu'est "l'élasticité".


6)De manière générale, qu'est-ce qui pourrait remettre en cause la robustesse des résultats de la régression obtenus ? Quelle(s) solution(s) préconiseriez-vous ?

--->Je sais que pour déterminer la significativité des coefficients on se repose sur 10 hypothèses : 1)Le modèle est linéaire.On peut dire pour n'importe quelle problématique que le modèle n'est pas linéaire donc ca ne nous avance pas. 2) Les variables explicatives ne sont pas stochastiques. C'est peut être pas le cas ici. 3)La valeur moyenne du terme d'erreur est nulle. Difficile de proposer une solution si on suppose l'inverse. 4)La variance des erreurs est constante. Difficile de proposer une solution aussi. 5) Absence d'autocorrélation entre les erreurs. Difficile aussi... 6)Covariance nulle entre u et X... 7) Le nombre d'observations est supérieur au nombre de paramètres estimés. C'est le cas. 8)Les X sont bornés dans leur ensemble. Je n'ai pas les données mais sinon on n'aurait pas obtenu les coefficients. 9) Il n'existe pas de colinéarité parfaite. Je pense c'est vérifié sinon on n'aurait pas les coefficients. 10) Le modèle de régression est correctement spécifié. Je pense oui.
Je ne vois donc pas ce qui pourrait clocher...


7)Ce modèle aurait-il pu être estimé par maximum de vraisemblance ? Si
oui, est-ce que l'on aurait obtenu un estimateur efficace ?


--->Difficile de dire si le modèle aurait pu être estimé par maximum de vraisemblance car cela nécessite une hypothèse de plus, les résidus suivent une loi normale.  Mais en tout cas, l'estimateur par MV est le même que celui par MCO, et déjà l'estimateur par MCO est efficace car sans biais et à variance minimale.

J'espère que vous pourrez m'aider afin de répondre aux questions que j'ai laissé sans réponse. Surtout la première et la deuxième car elles sont "mathématiques", la 6 et la 7 m'ont l'air pas trop mathématiques mais peut être que je me trompe. De même pour celle de l'élasticité. Peut être que l'exercice est tiré d'un livre sur les prix et c'est un concept qui leur est relatif.

Merci par avance pour toute aide j'en aurais vraiment besoin.

Posté par
ZiYun
re : Exercice traitant de MCO 06-01-20 à 03:16

J'ai oublié le tableau... Je remarque par la même occasion que T=102 (je me demande pourquoi mais bon) mais ca ne fausse pas les calculs car d'après les tables qu'ils ont fournit, dès que ca dépasse 30 degrés de libertés c'est les mêmes valeurs de quantiles.

Posté par
ZiYun
re : Exercice traitant de MCO 06-01-20 à 03:17

Je m'excuse encore une fois. J'ai téléchargé le fichier et j'ai oublié de l'attacher.

Exercice traitant de MCO



Vous devez être membre accéder à ce service...

Pas encore inscrit ?

1 compte par personne, multi-compte interdit !

Ou identifiez-vous :


Rester sur la page

Inscription gratuite

Fiches en rapport

parmi 1675 fiches de maths

Désolé, votre version d'Internet Explorer est plus que périmée ! Merci de le mettre à jour ou de télécharger Firefox ou Google Chrome pour utiliser le site. Votre ordinateur vous remerciera !