Bonjour,
J'ai un petit problème théorique qui semble simple de représentation d'un histogramme de valeurs entachées d'incertitude (incertitude calculée à 95% de confiance).
Voici un exemple minimal simple :
Je possède les valeurs suivantes :
T1 = 3,1°C ± 0.1°C
T2 = 4,4°C ± 0.1°C
...
Tn = -1.2°C ± 0.1°C
Toutes ces valeurs représentent des évènements différents mais je souhaite créer un histogramme pour voir si une tendance globale de répartition en ressort. Ce sont des valeurs de température lors de la fracture d'une structure. Chaque valeur correspond à un lieu différent et à une structure différente.
Comment calculer les intervalles de confiance des barres de l'histogramme ? En effet, pour la box [-0.5°C : 0.5°C] par exemple, on pourrait considérer qu'au plus elle possède toutes les valeurs entre -0.6°C et 0.6°C et au minimum toutes celles entre -0.4°C et 0.4°C... mais cela compte 2 fois l'incertitude et ça me semble pas bien mathématique. On pourrait aussi construire un histogramme avec toutes les valeurs à +0.1°C et un autre avec toutes les valeurs à -0.1°C et construire les intervalles de confiance à partir de cela...
Enfin bon voilà je suis perdu, comment construire les intervalles de confiance des barres de l'histogramme de façon propre mathématiquement ?
En vous remerciant par avance,
Alexandre
salut
puisque tu as des valeurs discrètes on ne parle pas d'un histogramme mais d'un diagramme à bâton ... et tu prends tes n températures .... épictou ...
ou alors tu considères les n intervalles [t_i - 0,1, t_i + 0,1] ... en espérant qu'il n'y a pas d'intersection de ces intervalles ...
Hum, je pense que je me suis mal exprimé.
Les températures T1...Tn ne représentent pas des classes de température avec chacune un certain nombre de valeurs tombant dedans.
Chaque température est le résultat d'une expérience et c'est avec toutes ces températures (des milliers) que je souhaite réaliser un histogramme selon la variable continue "Température".
c'est bien ce que je disais !!!
ou alors tu considères que chaque température t n'est pas donnée à + ou - 0,1 mais correspond à [t, t + 0,1[
ainsi pour ton intervalle [-0,5, +0, 5[ tu y mets toutes les températures t telles que l'intervalle [t, t + 0,1[ y soit inclus
et tu peux le faire aussi dans l'autre sens ...
mais à un moment il faut faire un choix ... le plus pertinent possible pour effectivement ne pas compter deux fois une même température dans deux intervalles distincts ...
Oui mais si je fais ça, je cache un peu les incertitudes en les rentrant dans une boîte ou une autre. J'ai peur de ne pas super bien te comprendre. Voici plus concrètement.
Ce qui m'intéresse c'est vraiment les plages de valeurs de la figure suivante. Par exemple, c'est intéressant de savoir que 40% des fractures se passent entre -0.5°C et 0.5°C. Cet histogramme est construit avec les valeurs centrales mais j'aimerai maintenant y signifier les incertitudes dessus... Comment le ferais-tu mathématiquement ? (en conservant cette découpe tous les 1°C par exemple).
Merci d'avance.
je le ferai comme je l'ai dit : soit en considérant les "incertitudes supérieures" soit en considérant les "incertitudes inférieures" ....
comme veux-tu faire si tu as les valeurs 1
0,1, 0,9
0,1 et 1,1
0,1
et si tu fais les deux histogrammes comme je le propose je ne pense pas qu'il y ait une grande différence ... si tu as des milliers de valeurs ...
Merci pour ton aide. Cependant, ça me dérange réellement que ta méthode cache les incertitudes et ça ne me convient pas trop (surtout que mes incertitudes sont en fait plus grandes que 0.1°C et ça obligerait à faire des box bien trop grandes). Je pense que je vais donc représenter cela par CDF tant pis. Merci de ton aide quand même et désolé de mon entêtement. Bonne soirée,
Alexandre
tu n'as pas à t'excuser pour ton entêtement !!!
tu veux quelque chose ... et je ne vois pas comment faire ... (ni toi) et je te propose un pis-aller ...
qu'est-ce qu'un CDF ?
Tu as beaucoup de données, tu peux donc faire intervenir du Bernouilli.
Mais tu dois d'abord faire une hypothèse.
Quand tu dis : telle mesure m'a donné 3.1° +- 0.1°, il faut plus d'informations. Les 3 valeurs possibles sont 3.0°, 3.1° ou 3.2°, mais connaît-on les probabilités pour ces 3 valeurs. Il faut faire une hypothèse, par exemple ces 3 valeurs ont chacune une probabilité de 33%.
Du coup, si tu as par exemple 100 mesures qui donnent 3.1°, en moyenne, il y aura 33 mesures qui sont effectivement 3.1°, mais avec Bernouilli, on sait dire que dans 95% des cas, le nombre de 3.1° est entre ... et ...
Ce qui donne un intervalle de confiance.
Après, il va falloir ajouter les cas qui ont été mesurés 3.2°, et qui sont en fait 3.1° , et ceux qui ont été mesurés 3.0°, et qui sont en fait 3.1°.
Les incertitudes ne s'additionnent pas réellement. Mais ça reste une bonne approche.
Pardon, CDF pour Cumulative Distribution Function. C'est moins impactant qu'un histogramme en terme graphique mais ça permet de représenter facilement les incertitudes (en mode transparent comme sur les scénarios du GIEC par exemple).
ty59847 MERCI BEAUCOUP, j'adore ton idée, c'est très élégant. J'ai des incertitudes à 95% sous hypothèse Gaussienne. Je vais donc discrétiser une loi normale sur une dizaine de points pour chaque valeur et je pourrai donc avoir un second histogramme prenant en compte les incertitudes à présenter à côté du premier (ou en superposition transparente). Ou je peux même directement additionner toutes ces Gaussiennes pour obtenir ma distribution finale, sans même les discrétiser sur un histogramme. Je n'y avais même pas pensé... Enfin bref je vais re-réfléchir à cela. Franchement merci, je m'y hâte.
Merci à vous deux en tout cas,
Bonne soirée,
Alexandre
Vous devez être membre accéder à ce service...
Pas encore inscrit ?
1 compte par personne, multi-compte interdit !
Ou identifiez-vous :