Bonjour,
Je crois avoir trouvé une démonstration facile, niveau Terminale.
(1) Rappel du théorème
Du moins formulé à ma sauce.
Définition et théorème. Soit un caractère statistique double, et ses caractères marginaux, et la série statistique double discrète associée au caractère . On note les points de coordonnées . On les renumérote en les points , respectivement associés à l'effectif . Ils forment un nuage de points.
On suppose que n'est pas un caractère constant, donc que .
Soit une droite quelconque, mais non verticale. On définit la distance verticale entre le nuage et par où est le point de ayant même abscisse que .
(1) Il existe une unique droite minimisant cette distance verticale. Elle s'appelle la droite d'ajustement de en par la méthode des moindres carrés ou méthode de Gauss. Elle a pour équation :
ou encore :
(2) Elle passe par le point moyen du nuage, de coordonnées .
(3)La distance verticale des points à la droite des moindres carrés s'exprime alors par :
où , appelé coefficient de corrélation, est le réel défini par :
(4) Le coefficient de corrélation est donc une bonne mesure de la qualité de l'ajustement affine :
(i)
(ii) on a : où est défini ci-dessus et est la pente de la droite d'ajustement de en (on suppose ) ;
(iii) on a : est une fonction affine de , c'est-à-dire que tous les points du nuage sont sur la droite d'ajustement ;
(iv) l'ajustement est d'autant meilleur que ;
(v) l'ajustement est d'autant plus mauvais que .
(5)La distance verticale entre une droite quelconque d'équation et le nuage de points s'écrit :
avec et
(2) La démonstration simple
Il existe une démonstration "classique" minimisant la distance d'une droite quelconque avec le nuage de points. Cette distance est une fonction de 2 variables, donc la démonstration fait intervenir du calcul différentiel.
Je pense avoir trouvé beaucoup plus simple, accessible en Terminale (corsé). C'est en fait le point (5) du théorème ci-dessus. Cette démonstration ne fait intervenir que des expressions du second degré, sans dérivation. Revers de la médaille : les calculs sont un peu lourds, et nécessitent de bien maîtriser les notions statistiques définies en cours.
Soit une droite quelconque d'équation . La distance verticale entre le nuage et la droite s'écrit :
On définit , et de la façon suivante :
Il vient :
où désigne tout ce qui suit le "2" jusqu'au bout de la ligne.
En développant :
Donc :
On a ainsi trouvé l'expression générale de la distance verticale entre une droite et le nuage : est la somme d'une constante () et d'une grandeur variable (en fonction de et ) mais toujours positive.
(1) On en conclut l'existence de la droite des moindres carrés, correspondant à , c'est-à-dire à :
La distance entre la droite des moindres carrés et le nuage vaut alors :
(2) Quant à l'unicité...
Une droite minimise la distance au nuage si et seulement si elle permet également d'atteindre donc si
Une somme de carrés est nulle si et seulement si tous les carrés sont nuls :
Soit un quelconque dans :
Alors :
Or, puisque n'est pas constant, il existe un différent de tel que . On en déduit , puis .
Fin de la démonstration.
Sauf erreur !
Nicolas