droite de regression : exercice de mathématiques de autre

 Niveau autrePartager :
			        
droite de regression
Posté par chlomolamb (invité)  22-06-06 à 23:30
bonjour tout le monde

connaissez vous une démonstration pas trop difficile ni trop longue pour déterminer la droite de régression avec la méthode des moindres carrés.toutes les démo que j'ai trouvée sont longue et demandent de se rappeler de beaucoup d'astuces ou bien utilisent des outils compliqués.si je tombe dessus au capes c'est mort!!
 Posté par 
Roulianere : droite de regression  23-06-06 à 00:00
Je crois que la démo est de toute façon pas facile.

Tu peux voir une démo sur le site de megamaths ( dans la leçon sur ce thème) 
 Posté par 
Nicolas_75 re : droite de regression  23-06-06 à 04:14
Bonjour,

Je crois avoir trouvé une démonstration facile, niveau Terminale.

(1) Rappel du théorème

Du moins formulé à ma sauce. 

Définition et théorème. Soit  un caractère statistique double,  et  ses caractères marginaux, et  la série statistique double discrète associée au caractère . On note  les points de coordonnées . On les renumérote en les points , respectivement associés à l'effectif . Ils forment un nuage de points.

On suppose que  n'est pas un caractère constant, donc que .

Soit une droite  quelconque, mais non verticale. On définit la distance verticale entre le nuage et  par  où  est le point de  ayant même abscisse que .

(1) Il existe une unique droite  minimisant cette distance verticale. Elle s'appelle la droite d'ajustement de  en  par la méthode des moindres carrés ou méthode de Gauss. Elle a pour équation :

ou encore :

(2) Elle passe par le point moyen du nuage, de coordonnées .

(3)La distance verticale des points à la droite des moindres carrés s'exprime alors par :

où , appelé coefficient de corrélation, est le réel défini par :

(4) Le coefficient de corrélation est donc une bonne mesure de la qualité de l'ajustement affine :

(i) 

(ii) on a :  où  est défini ci-dessus et  est la pente de la droite d'ajustement de  en  (on suppose ) ;

(iii) on a :   est une fonction affine de , c'est-à-dire que tous les points du nuage sont sur la droite d'ajustement ;

(iv) l'ajustement est d'autant meilleur que  ;

(v) l'ajustement est d'autant plus mauvais que .

(5)La distance verticale entre une droite  quelconque d'équation  et le nuage de points s'écrit :

avec  et 

(2) La démonstration simple

Il existe une démonstration "classique" minimisant la distance d'une droite quelconque  avec le nuage de points. Cette distance est une fonction de 2 variables, donc la démonstration fait intervenir du calcul différentiel.

Je pense avoir trouvé beaucoup plus simple, accessible en Terminale (corsé). C'est en fait le point (5) du théorème ci-dessus. Cette démonstration ne fait intervenir que des expressions du second degré, sans dérivation. Revers de la médaille : les calculs sont un peu lourds, et nécessitent de bien maîtriser les notions statistiques définies en cours.

Soit  une droite quelconque d'équation . La distance verticale entre le nuage et la droite s'écrit :

On définit ,  et  de la façon suivante :

Il vient :

où  désigne tout ce qui suit le "2" jusqu'au bout de la ligne.

En développant :

Donc :

On a ainsi trouvé l'expression générale de la distance verticale entre une droite et le nuage :  est la somme d'une constante () et d'une grandeur variable  (en fonction de  et ) mais toujours positive. 

(1) On en conclut l'existence de la droite des moindres carrés, correspondant à , c'est-à-dire à :

La distance entre la droite des moindres carrés et le nuage vaut alors :  

(2) Quant à l'unicité...

Une droite  minimise la distance au nuage si et seulement si elle permet également d'atteindre  donc si 

Une somme de carrés est nulle si et seulement si tous les carrés sont nuls :

Soit un  quelconque dans  :

Alors :

Or, puisque  n'est pas constant, il existe un  différent de  tel que . On en déduit , puis .

Fin de la démonstration.

Sauf erreur !

Nicolas 
 Posté par 
JJare : droite de regression  23-06-06 à 07:41
Il me semble que la démonstration classique donnée dans :

http://fr.wikipedia.org/wiki/Régression_linéaire

au paragraphe: "Démonstration des formules par étude d'un minimum" est des plus simples (quelques lignes seulement)
 Posté par chlomolamb (invité)re : droite de regression  23-06-06 à 09:53
bonjour et merci a tous et particulièrement à nicolas quel courage d'avoir tapé tout ça.mais avouez quand même que ce n'est pas si facile à retrouver tout seul sans documents...

encore merci a tous
 Posté par 
Nicolas_75 re : droite de regression  23-06-06 à 10:08

chlomolamb, je t'en prie. 

Regarde bien le lien donné par JJa : je pense que c'est la démonstration attendue.

Bonjour JJa.  Je ne prétends évidemment pas dire quelle démonstration est la "meilleure" ou non, mais voici mon sentiment...

a) La démonstration que tu signales sur wikipedia est la plus "classique". Mais, en Terminale, elle ne me semble pas très rigoureuse. En effet, on est face à une fonction de 2 variables :

- on minimise par rapport à b en gardant a constant,

- puis on remplace b par sa valeur minimale, et on minimise par rapport à a.

Je ne vois pas bien quel théorème de Terminale justifie ce raisonnement.

b) En revanche, la démonstration ci-dessus me semble complètement explicable en Terminale, et donne en même temps deux "bonus" :

- l'expression de la distance minimale, faisant intervenir le coefficient de corrélation, avec un facteur en (1-r²) permettant de justifier pourquoi on dit que l'approximation est d'autant meilleure que le coefficient est proche de +-1 

- l'expression de l'écart entre la distance d'une droite quelconque et la distance minimale

Ce n'est que mon avis. Mais chacun est libre de choisir l'approche qui lui convient le mieux, bien sûr. 

Nicolas
 Posté par 
Nicolas_75 re : droite de regression  23-06-06 à 10:09
(chlomolamb, la démonstration que je propose ci-dessus ne me semble pas adaptée au CAPES : trop longue, trop de "chances" de faire des erreurs de calcul)
 Posté par chlomolamb (invité)re : droite de regression  23-06-06 à 10:13
nicolas merci mais laquelle me conseillez vous alors
 Posté par chlomolamb (invité)re : droite de regression  23-06-06 à 10:15
pour la démo de wikipédia quel théorème (deug) justifie cette démarche
 Posté par 
Nicolas_75 re : droite de regression  23-06-06 à 10:25
Citation :
mais laquelle me conseillez vous alors

Je ne peux pas répondre précisément à ta question. Je n'ai jamais passé le Capes, et ne sais pas ce que l'on attend des candidats. 

Il me semble que cette démonstration fait partie des "zones grises" du programme de Terminale, où tout n'est pas justifiable. Je préfère me taire et laisser d'autres Mathîliens ayant l'expérience du Capes te suggérer la stratégie la plus optimale.

Nicolas
  Posté par Laety (invité)re : droite de regression  23-06-06 à 17:54
Bonjour, 

j'ai les cours du CNED du capes externe, la démonstration utilisée dans ces cours est celle de Wikipedia...