Inscription / Connexion Nouveau Sujet
Niveau algorithmique
Partager :

article scientifique statistique

Posté par
Syb59
22-03-23 à 17:14

Bonjour tous le monde,
Je vous sollicite car j'ai besoin de comprendre un article scientifique qui me permettra de construire un calculateur.
Ce calculateur existe déja en ligne mais j'ai besoin de l'utiliser hors ligne d'où la nécessité pour moi d'en construire un nouveau.
[https://fetalmedicine.org/research/assess/nt]
Ce calculateur me permettra de calculer pour une longueur cranio caudale (LCC ou CRL) donnée et une mesure de clarté nucale (CN ou NT) quel est le risque qu'un foetus soit porteur d'une anomalie de type trisomie 21. J'ai globalement compris l'article mais je bute sur la partie distribution gaussienne ajustée. Il me manque les notions de statistique pour comprendre comment obtenir cette fameuse densité de probabilité. J'ai mis en pièce jointe une partie de l'article. Je joins le lien pour avoir l'article au complet qui est open source :
https://obgyn.onlinelibrary.wiley.com/doi/10.1002/uog.5299

En espérant que vous pourrez m'éclairer ... Merci par avance !




pdf
PDF - 39 Ko

Posté par
Ulmiere
re : article scientifique statistique 24-03-23 à 13:18

C'est des mathématiques de médecin, donc vraiment pas très sérieux

Par exemple, dès le début, ça annonce tranquillement

Citation :
The delta NT approach does not assume a Gaussian distribution, but it is implicit in this approach that the CRL-specific centile curves in the trisomy 21 and unaffected pregnancies should be parallel


En général, quand on te dit "c'est implicite" ça veut soit dire "j'ai la flemme d'expliquer", soit "je sais pas pourquoi, mais j'ai envie de supposer ça"
C'est d'autant pire que l'hypothèse faite sur log(MoM) se révèle fausse puisqu'on observe deux clusters distincts à 11, 12, et 13 semaines de gestation.

Plus bas, ils en rajoutent une couche
Citation :
This means that the distribution of delta NT is changing with gestation in a way that cannot be captured by a common non-parametric density estimate fitted to the data combined across all gestations


Ils expliquent que sous l'hypothèse faire sur MoM, on devrait avoir des lignes parallèles ; ce qui est le cas quand CRL > 60 mm (correspond à 4 mois), mais pas pour les faibles CRL. Certes, mais où est la conclusion ? C'est l'hypothèse sur delta NT qui est fausse, ou bien celle sur le MoM par l'absurde ?

Ensuite, on fait une régression quadratique donc c'est normal que la variance diminue.
Ensuite on regarde comment le modèle se comporte quand on introduit des faux positifs. Autrement dit, si on est en overfitting. A nouveau, où est la conclusion ?

A ce stade, on ne sait toujours pas ce qu'ils appellent "unaffected pregnancies". Parfois ça veut dire "tout sauf trisomie 21" et parfois, ça veut dire "tout sauf trisomie"


Ensuite on nous envoie cette petite phrase fort cocasse
Citation :
The findings of this study demonstrate that fetal NT follows two distributions, one of which is dependent on CRL while the other is independent of CRL

Ce qui est impossible, il manque les mots les plus importants dans cette phrase

--------------

Voici un résumé avec des mots simples de l'article, ou en tout cas de ce qu'ils essaient de nous dire dans cette étude

1) notre ensemble de grossesses est partitionné en deux clusters nets trisomiques vs non trisiomiques. Dans celui des grossesses saines, il semble que dans 95% des cas, le NT soit une fonction croissante et linéaire du CRL. Ce n'est pas le cas dans l'autre cluster, où un tel comportement est observé dans seulement 5 à 30% des cas, en fonction du type de trisomie. On observe cependant que quand on a effectivement croissance linéaire, c'est toujours avec la même pente quel que soit l'état de santé de l'enfant.

2) par ailleurs, parmi les 5% qui ne suivent pas la croissance linéaire ches les sujets sains, une très faible part montre un NT quasi-constant lorsque le CRL varie (fonction affine avec pente proche de zéro). L'inverse se produit chez les trisomiques, où une grande part des 70 à 95% de grossesses à NT non linéaire sont des grossesses à NT constant

3) dans nos deux clusters, on a aussi des médianes totalement différentes. Chez les trisomiques, la médiane des NT est 1.5 à 4 fois supérieure à celle observée chez les sujets sains, en fonction de la trisomie qu'on considère (21,15,18,ou XY)

4) notre étude montre que les hypothèses habituellement faites sur le MoM et le delta NT racontent des conneries
Non seulement on trouve que delta NT change quand CRL change, mais aussi que MoM ne suit pas une loi gaussienne.
A la place on propose un modèle quadratique et on montre qu'il fonctionne à peu près quand le taux de faux positifs est inférieur à 10%


-------------


Pour en venir à la question sur la densité de probabilité
Citation :
The likelihood ratio of trisomy 21 to normal pregnancies is given by the probability density of trisomy 21 pregnancies divided by the probability density for normal pregnancies = 1.4754/0.5561 = 2.653


me semble très fumeux. Parce que 1.4754 > 1 et parce que 2.653 > 1.
Si on est en train d'essayer de nous parler du test statistique du rapport de vraisemblance, il n'a aucune valeur si on ne se fixe pas un niveau α pour savoir si on rejette l'hypothèse ou pas


Enfin, si je comprends bien, voici comment faire ton calculateur
1) les pourcentiles sont des sortes d'inverse à gauche de la fonction de répartition pour chaque CRL. Les lignes rouge (p=99%), bleue (médiane, p=50%) et grises (p=5% et p=95%) de ton graphe sont les évaluations d'une fonction Q(CRL, .) au point p à déterminer. Q(CRL,p) est un nombre tel qu'une proportion p de tes données aient à NT(CRL) inférieur à Q(CRL,p). C'est  une sorte d'inverse à gauche de la fonction de répartition. C'est à dire que pour le pourcentile p, tu dois avoir (à peu près) Q(CRL, .)(F(p)) = p. En gros, tu cherches l'abscisse de l'intersection du graphe de F et de la droite horizontale y = p

2) la médiane est par défintion m = Q(CRL, 0.5).
(delta NT)(CRL) = NT(CRL)-m et MoM(CRL) = NT(CRL)/m
Je rappelle que le NT(CRL) est donné par l'utilisateur

3) Il s'agit ensuite de trouver le pourcentile correspondant à cela. C'est à dire le plus petit p tel que Q(CRL,p) > NT(CRL). C'est-à-dire encore le p correspondant à la courbe de couleur sur laquelle se trouve NT(CRL) si on les traçait toutes.

4) Il y a un bug dans le calculateur que tu as donné, si tu mets CRL = 55mm et NT(CRL) = 1.49, le delta NT n'est pas mis à 0 et le pourcentile reste à 47

Posté par
Syb59
re : article scientifique statistique 24-03-23 à 16:31

Merci pour le retour !
C'est quand même stupéfiant, je n'aurais pas imaginé que la FMF (fondation de médecine foetale) soit aussi light et peu rigoureuse sur une thématique aussi sensible ... et compte tenu de l'obligation de rigueur scientifique que l'on doit à nos patients ...
Du coup je me tâte à me lancer dans cette idée de calculateur sachant que je me baserai sur des infos erronées ... et ce qui me frappe c'est que par chez moi tous mes collègues utilisent des calculateurs basés sur cette étude .. ??
Je suis perdue ... C'est possible quand même que l'approximation de cette méthode ne soit pas si "loin" ou c'est vraiment fumeux et pas rigoureux ?

Posté par
Ulmiere
re : article scientifique statistique 25-03-23 à 00:07

Si tu commences à chercher la rigueur mathématique dans des papiers écrits par des médecins, t'as pas fini de courir

Le resultat n'est pas délirant et malgré les imprécisions on comprend quand même ce qu'ils essaient de montrer, mais c'est effectivement maladroit et très mal présenté. L'essentiel, je suppose, c'est que les médecins se comprennent entre eux. Ils arrivent bien à dechiffrer leurs écritures après tout

Fais comme les autres font dans ton milieu mais pose toi quand même toujours des questions sur ce que tu fabriques !

Dans ce papier je vois de nombreux biais. Par exemple l'écrasante majorité de sujets sains par rapport aux sujets trisomiques. Mes moyennes faites sur le cluster sain de plus de 30000 patientes sont évidemment bien meilleures que celles qui concernent les 5% parmi 240 grossesses, mais ça ce n'est signalé nul part. Quand tu donnes une moyenne, regzrde toujours la variance, sinon elle ne vaut rien.

Un autre possible biais que je vois : 95% de blancs dans l'échantillon. On suppose sans le dire nul part que la race n'a aucune influence sur l'apparition de la trisomie. C'est sans doute raisonnable, mais alors si c'est si évident, pourquoi y consacrer un tableau en premier lieu ?

Posté par
Syb59
re : article scientifique statistique 26-03-23 à 13:52

Merci Ulmière pour le retour. Je vais faire comme les autres en attendant et construire mon calculateur mais j'essayerai à l'occasion quand même d'attirer l'attention de nos instances. Il y a peut-être moyen d'améliorer ou de réactualiser cette étude de 2008. En tout cas merci encore pour l'expertise 😊

Posté par
Ulmiere
re : article scientifique statistique 27-03-23 à 00:17

Posté par
Syb59
re : article scientifique statistique 30-03-23 à 17:05

Bonjour,
Je reviens solliciter la lumière svp ...
J'ai essayé de construire mon calculateur mais je bloque toujours sur la densité de probabilité pour la distribution gaussienne ajustée.
Je pensais sans avoir compris quelque chose mais finalement non !
J'ai essayé d'obtenir cette densité en faisant :     = (log(valeur mesure NT ou CN) - médiane)/déviation standard ajustée.
Mais avec l'exemple NT = 2,5 je n'obtiens pas la même densité. Donc ma formule n'est pas la bonne ...
Par ailleurs, j'ai essayé de trouver la fonction Q(CRL,p) qui me ramène à quelle que chose d'assez monstrueux :
= (p * densité de proba)+ ((1-p) * densité de proba)
Où p = 1/(1+exp(ao - a1*CRL)
Et ça que pour les grossesses non affectées et du coup peut être somme avec grossesses affectées par T21, 18, 13 et Turner ?
Vous l'avez compris je patauge dans quelque chose d'assez obscur ... Svp pouvez vous m'éclairer ?

Posté par
Syb59
re : article scientifique statistique 30-03-23 à 17:35

J'ai poursuivi mes recherches pour voir s'il n'y avait pas eu du nouveau depuis l'étude de la FMF et je suis tombée sur cet article qui est beaucoup plus clair selon moi. Malheureusement il préconise de conserver les résultats de la recherche de la FMF ..  
Je n'arrive pas a joindre le fichier en pdf (trop lourd) mais je joins le lien (libre accès)

Posté par
Syb59
re : article scientifique statistique 05-04-23 à 14:24

Bonjour,
SVP .. personne pour m'éclairer ?



Vous devez être membre accéder à ce service...

Pas encore inscrit ?

1 compte par personne, multi-compte interdit !

Ou identifiez-vous :


Rester sur la page

Désolé, votre version d'Internet Explorer est plus que périmée ! Merci de le mettre à jour ou de télécharger Firefox ou Google Chrome pour utiliser le site. Votre ordinateur vous remerciera !