logo

Test d'hypothèse


Test d'hypothèse : encyclopédie mathématiques

wikipediaCet article est issu de l'encyclopédie libre Wikipedia.
Vous pouvez consulter l'article ici ainsi que son historique.
Les textes et les images sont disponibles sous les termes de la Licence de documentation libre GNU.

En statistiques, un test d'hypothèse est une démarche consistant à évaluer une hypothèse statistique en fonction d'un jeu de données (échantillon).

Par exemple, ayant observĂ© un certain nombre de tirages « pile ou face Â» produit par un pièce, on peut se demander si celle-ci est biaisĂ©e (c'est-Ă -dire possède une probabilitĂ© diffĂ©rente de 1/2 de tomber sur une face donnĂ©e). Dans cette situation, l'approche par test d'hypothèse consiste Ă  supposer que la pièce est non biaisĂ©e (hypothèse nulle), et Ă  calculer la probabilitĂ© d'observer des tirages au moins aussi extrĂŞmes que celui effectivement observĂ© (grâce Ă  une loi binomiale). Si cette probabilitĂ© est faible (en pratique, infĂ©rieure Ă  un seuil fixĂ©, par exemple, 5%), on rejette l'hypothèse nulle de l'Ă©quiprobabilitĂ© des faces de la pièce, et on dĂ©cide qu'elle est biaisĂ©e.

Sommaire

[modifier] Risque de première espèce et de deuxième espèce

Une notion fondamentale concernant les tests est la probabilité que l'on a de se tromper.

Il y a deux façons de se tromper lors d'un test statistique :

  • rejeter Ă  tort l'hypothèse nulle lorsqu'elle est vraie. On appelle ce risque le risque de première espèce et en gĂ©nĂ©ral on note α la probabilitĂ© de se tromper dans ce sens. α est alors la probabilitĂ© d'avoir un faux positif : de rejeter une hypothèse alors qu'en fait elle est vraie ;
  • accepter l'hypothèse nulle alors qu'elle est fausse. On appelle ce risque le risque de deuxième espèce et en gĂ©nĂ©ral on note β la probabilitĂ© de se tromper dans ce sens. β est alors la probabilitĂ© d'avoir un faux nĂ©gatif : accepter une hypothèse alors qu'en fait elle est fausse ;

Dans l'idéal on aimerait bien que ces deux erreurs soient nulles, mais c'est impossible lorsque l'on ne dispose que d'un nombre fini d'observations, et il faut alors faire un choix.

[modifier] Tests classiques et tests bayésiens

Pour les tests classiques qui constituent l'essentiel des tests statistiques, ces deux erreurs jouent un rĂ´le asymĂ©trique. On contrĂ´le uniquement le risque de première espèce Ă  un niveau α (principe de Neyman) ; cela revient Ă  considĂ©rer que le risque de rejeter l'hypothèse nulle alors que cette hypothèse est vraie est beaucoup plus coĂ»teux que celui de la conserver Ă  tort (ce dernier risque n'Ă©tant pas maĂ®trisĂ©).

Pour les tests bayésiens on peut parfois pondérer ces deux risques grâce à la connaissance d'une probabilité a priori. La connaissance de cette probabilité a priori est l'un des fondements de la statistique bayésienne et constitue l'une de ses difficultés majeures. Si on cherche par exemple à tester le fait qu'un certain paramètre θ vaut une certaine valeur θ0 cette probabilité a priori sera une loi de probabilité sur θ qui donne la probabilité que l'on a d'observer θ. Cette loi a priori est également appelée croyance a priori ou croyance bayésienne. Ces tests sont souvent d'une mise en œuvre plus complexe que les tests statistiques: la raison principale est qu'ils nécessitent de "trouver" une bonne loi a priori puis de la réviser grâce à la révision des croyances.

[modifier] Classification

D'ordinaire on range les tests dans deux catégories les tests paramétriques et les tests non paramétriques. Les premiers testent la valeur d'un certain paramètre. Ces tests sont généralement les tests les plus simples. Les tests non paramétriques quant à eux ne font pas intervenir de paramètre. C'est par exemple le cas des tests d'adéquation à une loi ou des Test du χ².

On peut Ă©galement distinguer les tests d'homogĂ©nĂ©itĂ© et les tests d'adĂ©quations :

  • dans le cas d'un test d'homogĂ©nĂ©itĂ©, on veut comparer deux Ă©chantillons entre eux. L'hypothèse nulle H0 supposera l'homogĂ©nĂ©itĂ© des deux Ă©chantillons. Par exemple on comparera deux moyennes ;
  • dans le cas d'un test d'adĂ©quation (ou conformitĂ©), on veut dĂ©terminer si un Ă©chantillon suit une loi statistique connue. L'hypothèse nulle H0 supposera l'adĂ©quation de l'Ă©chantillon Ă  cette loi.

[modifier] Déroulement d'un test

Pour le cas spĂ©cifique d'un test unilatĂ©ral, le test suit une succession d'Ă©tapes dĂ©finies :

  1. Ă©noncĂ© de l'hypothèse nulle H0 et de l'hypothèse alternative H1 ;
  2. calcul d'une variable de dĂ©cision correspondant Ă  une mesure de la distance entre les deux Ă©chantillons dans le cas de l'homogĂ©nĂ©itĂ©, ou entre l'Ă©chantillon et la loi statistique dans le cas de l'adĂ©quation (ou conformitĂ©). Plus cette distance sera grande et moins l'hypothèse nulle H0 sera probable. En règle gĂ©nĂ©rale, cette variable de dĂ©cision se base sur une statistique qui se calcule Ă  partir des observations. Par exemple, la variable de dĂ©cision pour un test unilatĂ©ral correspond Ă  rejeter l'hypothèse nulle si la statistique dĂ©passe une certaine valeur fixĂ©e en fonction du risque de première espèce ;
  3. calcul de la probabilitĂ©, en supposant que H0 est vraie, d'obtenir une valeur de la variable de dĂ©cision au moins aussi grande que la valeur de la statistique que l'on a obtenue avec notre Ă©chantillon. Cette probabilitĂ© est appelĂ©e la valeur p (p-value) ;
  4. conclusion du test, en fonction d'un risque seuil αseuil, en dessous duquel on est prĂŞt Ă  rejeter H0. Souvent, un risque de 5 % est considĂ©rĂ© comme acceptable (c'est-Ă -dire que dans 5 % des cas quand H0 est vraie, l'expĂ©rimentateur se trompera et la rejettera). Mais le choix du seuil Ă  employer dĂ©pendra de la certitude dĂ©sirĂ©e et de la vraisemblance des alternatives ;
  5. si la valeur p est plus grande que α, le test est non concluant, ce qui revient à dire que l'on ne peut rien affirmer. Si la valeur p est plus petite que α on rejette l'hypothèse nulle.

La probabilité pour que H0 soit acceptée alors qu'elle est fausse est β, le risque de deuxième espèce. C'est le risque de ne pas rejeter H0 quand on devrait la rejeter. Sa valeur dépend du contexte, et est très difficilement évaluable (voire impossible à évaluer), c'est pourquoi seul le risque α est utilisé comme critère de décision.

[modifier] Tests classiques

Article dĂ©taillĂ© : Test (statistique).

Il existe de nombreux tests statistiques classiques parmi lesquels on peut citer :

  • le test de Student, qui sert Ă  la comparaison d'une moyenne observĂ©e avec une valeur « attendue Â» pour un Ă©chantillon distribuĂ© selon une loi normale  ;
  • le test de Fisher, aussi appelĂ© test de Fisher-SnĂ©dĂ©cor, qui sert Ă  la comparaison de deux variances observĂ©es.
  • l'Analyse de la variance ou Anova, permet de comparer entre elles plusieurs moyennes observĂ©es (pour les groupes Ă©tudiĂ©s), selon un plan expĂ©rimental prĂ©dĂ©terminĂ©. Elle se base sur une dĂ©composition de la variance en une partie « explicable Â» (variance inter-groupes) et une partie « erreur Â» (variance globale intragroupe - ou variance rĂ©siduelle), supposĂ©e distribuĂ©e selon une loi normale. Ce test est particulièrement utilisĂ© en sciences humaines, sciences sociales, sciences cognitives, en mĂ©decine et en biologie ;
  • le test du χ², Ă©galement appelĂ© test du χ2 de Pearson, qui sert notamment Ă  la comparaison d'un couple d'effectifs observĂ©s, ou Ă  la comparaison globale de plusieurs couples d'effectifs observĂ©s, et plus gĂ©nĂ©ralement Ă  la comparaison de deux distributions observĂ©es ;
  • le test de Kolmogorov-Smirnov, qui comme le test du χ2 constitue un test d'adĂ©quation entre des Ă©chantillons observĂ©s et une distribution de probabilitĂ©. Il compare la fonction de rĂ©partition observĂ©e et la fonction de rĂ©partition attendue. Il est particulièrement utilisĂ© pour les variables alĂ©atoires continues.

En méthodes bayésiennes, on utilise le psi-test (mesure de distance dans l'espace des possibles) dont on démontre que le test du χ2 représente une excellente approximation asymptotique lorsqu'il existe un grand nombre d'observations.

[modifier] Voir aussi

[modifier] Articles connexes

  • Plan d'expĂ©rience
  • Test (statistique)
  • Test de Jarque Bera
  • Statistique mathĂ©matique

[modifier] Liens externes

wikipediaCet article est issu de l'encyclopédie libre Wikipedia.
Vous pouvez consulter l'article ici ainsi que son historique.
Les textes et les images sont disponibles sous les termes de la Licence de documentation libre GNU.


maths haut de pagehaut Retrouvez cette page sur ilemaths l'île des mathématiques
© Tom_Pascal & Océane 2012