Inscription / Connexion Nouveau Sujet
Niveau Master Maths
Partager :

Coefficient de Corrélation Intraclasse

Posté par
arthurarthur3
22-07-21 à 16:44

Bonjour,
Je suis actuellement en stage de Biostatistiques et je travaille sur le coefficient de corrélation intraclasse (CCI).
Cependant je n'arrive pas à obtenir de définition claire de cette quantité...

Le CCI mesure la corrélation entre deux individus d'un cluster (dans mon cadre). Or on ne dit corrélation que pour une paire de VA ayant des observations associées normalement ?

Je ne vois pas comment le définir en sachant qu'en fait, on cherche la corrélation entre Y_ij et Y_ik où i est le cluster et j/k deux individus de ce cluster ...

Merci pour votre aide

Posté par
verdurin
re : Coefficient de Corrélation Intraclasse 22-07-21 à 20:19

Bonsoir,
je viens de lire une définition ici .

Il semble que ce « coefficient de corrélation intra-classe » est juste une mesure de la variance expliquée par la classe.
Et pas du tout un coefficient de corrélation au sens courant du terme.

Posté par
arthurarthur3
re : Coefficient de Corrélation Intraclasse 22-07-21 à 21:03

Oui c'est possible.

Mais je sais qu'il est définissable à partir de la définition de base de la corrélation (cov(X,Y)/(VarXVarY)^1/2) puisque c'est à partir de cette définition et d'un modèle à effets mixtes qu'on trouve la définition autre du CCI (variance between cluster/variance between + variance within) mais je n'arrive pas à la définir clairement.

La corrélation intra classe mesure la corrélation de deux individus au sein d'un cluster mais la fac m'interdit de dire qu'on peut calculer une corrélation entre deux observations (il faut que ce soit entre 2 variables ayant chacune des observations)…

Merci pour ta réponse

Posté par
verdurin
re : Coefficient de Corrélation Intraclasse 22-07-21 à 22:02

Je crois que tu te trompes lourdement, mais je peux aussi me tromper.
Peux tu poster un lien ( si possible en français car je suis vieux et paresseux ) pour illustrer ta « définition ».

En tous cas

Citation :
la définition de base de la corrélation (cov(X,Y)/(VarXVarY)^1/2)
suppose bien que l'on a deux variables aléatoires quantitatives.

Je crois que tu devrais regarder du côté de l'analyse de variance ( ANOVA ).

Posté par
arthurarthur3
re : Coefficient de Corrélation Intraclasse 22-07-21 à 22:14

Bonsoir,

La définition de la corrélation que j'utilise et la preuve de la deuxième définition découlant d'un modèle mixte est ici https://fr.abcdef.wiki/wiki/Intraclass_correlation entre autre et d'un bouquin de Sandra Eldridge ainsi que sur une thèse et un mémoire déjà rédigés sur ce sujet.

Il y a aussi la preuve faisant le lien entre la définition de base (Cov(...) et la définition découlant d'un modèle mixte) mais ce qui me "chafouine" est la définition de base avec la covariance car on écrit la covariance entre 2 individus d'un cluster ? ça n'a pas de sens car ce ne sont pas des variables à proprement parlé ?

La définition générale de la corrélation est celle ci https://fr.wikipedia.org/wiki/Corrélation_(statistiques) mais je n'arrive pas à la transposer dans le cadre de la corrélation intraclasse.

Oui pour l'ANOVA j'ai déjà regardé. Je sais qu'elle permet l'estimation du CCI dans un cadre binaire/continu à partir de la définition découlant du modèle mixte.

Bonne soirée

Posté par
verdurin
re : Coefficient de Corrélation Intraclasse 22-07-21 à 23:13

Bonsoir,
Dans la définition que tu donnes en lien il n'est jamais question de corrélation ou de covariance entre individus.

Une remarque :
une définition n'a pas besoin de preuve : c'est une définition.

Posté par
arthurarthur3
re : Coefficient de Corrélation Intraclasse 23-07-21 à 10:56

Moi j'en vois une si….

Quand le lien est fait entre la définition de base cor(Xij,Xik) et celle obtenue à partir du modèle mixte.

Est calculé la covariance entre Xij et Xik où i cluster et j,k individu donc covariance entre deux individus ?!

Posté par
Vassillia
re : Coefficient de Corrélation Intraclasse 23-07-21 à 13:44

Bonjour,
Rappelons d'abord ce qu'est le modèle linéaire simple
Y_j=\alpha X_j + \beta + \epsilon_j
avec \epsilon_j le résidu impossible à modéliser

Le modèle linéaire mixte introduit l'appartenance à une classe i (aussi appelé cluster)
Y_{ij}=\alpha X_j + \beta + u_i + \epsilon_{ij}
avec u_i l'effet lié à la classe i
u_i suit une loi d'esperance 0 et de variance \sigma^2_u
\epsilon_{ij} suit une loi d'esperance 0 et de variance \sigma^2_{\epsilon}

Le coefficient de corrélation intra classe est la
corrélation entre u_i + \epsilon_{ij} et u_i + \epsilon_{ik}= \dfrac{cov(u_i + \epsilon_{ij};u_i + \epsilon_{ik})}{\sqrt{Var(u_i + \epsilon_{ij})} \sqrt{Var(u_i + \epsilon_{ik})}}
=\dfrac{1/2(Var(u_i + \epsilon_{ij})+Var(u_i + \epsilon_{ik})-Var(u_i + \epsilon_{ij} -u_i - \epsilon_{ik}))}{\sigma^2_u+\sigma^2_{\epsilon}}
=\dfrac{1/2(Var(u_i) + Var(\epsilon_{ij})+Var(u_i) + Var(\epsilon_{ij})-Var(\epsilon_{ij})-Var(\epsilon_{ik}))}{\sigma^2_u+\sigma^2_{\epsilon}}
=\dfrac{\sigma^2_u}{\sigma^2_u+\sigma^2_{\epsilon}}

Posté par
arthurarthur3
re : Coefficient de Corrélation Intraclasse 25-07-21 à 18:25

ça je suis tout à fait d'accord avec vous ! j'ai bien compris ce lien.

Ce que je ne comprends pas c'est comment définir le Coefficient de corrélation intraclasse à partir d'une définition "basique" de la corrélation.

Dans de nombreux documents, le CCI est défini comme la covariance entre Yij et Yik divisée par le produit des racines carrées des variances de Yij et Yik où i est le cluster/j,k les individus. Or Yij représente la réponse du i ème cluster et du j-ème individu (autrement dit une seule valeur, une observation) et la covariance n'est pas définie entre deux observations mais entre deux variables... Comment définir deux variables dans le cadre du CCI ?

Est-il possible de discuter avec vous en privé et que je vous envoie mon mémoire ?

Merci par Avance pour votre aide...

Posté par
Vassillia
re : Coefficient de Corrélation Intraclasse 25-07-21 à 21:18

C'est le cas plus simple où on ne s'intéresse qu'à la moyenne dans le cluster i
Y_{ij}=\mu + u_i + \epsilon_{ij}
La corrélation entre Y_{ij} et Y_{ik} est égale à la corrélation entre u_i + \epsilon_{ij} et u_i + \epsilon_{ik} et si tu as vraiment compris mon post précédent, tu devrai pouvoir conclure.

Mais je crois que ton problème est ailleurs, tu mélanges observations et variables, il me semble.
Tu es habitué j'imagine à avoir une seule unité, par exemple un individu et on mesure 2 variables sur lui, par exemple le poids et la taille.
Mais on peut très bien prendre une seule unité, par exemple un cluster et on mesure 2 variables sur lui, le poids de l'individu j et le poids de l'individu k.
Il s'agit bien de 2 variables sur la même unité (cluster).

Pour ton mémoire, je ne veux pas me substituer à tes encadrants donc je pense que tu devrais plutôt voir avec eux.

Posté par
arthurarthur3
re : Coefficient de Corrélation Intraclasse 25-07-21 à 23:29

Bonsoir,

Effectivement, mon problème est la distinction Variables/Observations. Je reprends les notations de mon mémoire.

Je dis que le CCI est égal à Cov(Xij,Xik)/(Var(Xij)Var(Xik))^1/2 (qui nous donne après la formule avec les deux variances dans le cadre du modèle mixte) où i cluster, j/k individus.

Mais, suite à cette définition, mon enseignant m'a indiqué plusieurs choses.

J'ai parlé de corrélation au sein des clusters et il m'a répondu "corrélation, c'est un terme pour une paire de variables aléatoires, pas pour des individus, encore moins pour un ensemble d'individus sur lesquels on observe une valeur de survie."
et
"une corrélation, c'est habituellement sur un
échantillon d'individus, pour lesquels on observe un couple de variable
(X,Y). Donc l'aspect espérance a un sens, la corrélation aussi
(E(XY)-E(X)E(Y))"

En effet, pour mon enseignant et moi, nous sommes sur la définition classique. Une corrélation (ou covariance) c'est entre deux variables aléatoires (X,Y) qui chacune est composée d'observations... Dans le cadre du CCI, le Xij et Xik n'est pourtant pas une variable ? Ce n'est qu'une observation unique ? On calcule donc la corrélation entre 2 observations, ça n'a pas de sens ?

Pour le mémoire, mes encadrantes le regarde également actuellement mais j'aimerais vraiment avoir un avis externe car je suis dans un master de Maths Maths et j'ai envie que la partie maths soit la plus claire possible (mes encadrantes sont plutôt biostats)... J'aimerais avoir un avis extérieur svp.

Merci pour votre aide

Posté par
Vassillia
re : Coefficient de Corrélation Intraclasse 26-07-21 à 00:38

Et pourtant si ce sont des variables.
Dans mon exemple, j'ai pris 2 individus différents j et k que j'ai apparié dans le cluster i mais cela ne correspond peut-être pas à ce que tu fais.
Je peux prendre un autre exemple, mon cluster est un individu i et je fais une mesure du poids avec la balance j et une autre mesure du poids avec la balance k.
J'ai donc bien une paire de variables exactement comme lorsque je mesurais la taille et le poids sur le même individu donc pourquoi je ne pourrai pas parler de corrélation ?

Le fait d'avoir besoin de plusieurs individus (ou clusters), c'est une répétition de l'expérience pour avoir plusieurs valeurs numériques. Grâce à cela, on peut faire une estimation du CCI. Désolée de me répéter mais je ne compte pas relire ton mémoire, c'est le rôle des personnes qui t'encadrent mais cette réponse n'engage que moi.

Posté par
arthurarthur3
re : Coefficient de Corrélation Intraclasse 27-07-21 à 10:33

Bonjour,

Merci pour votre réponse et pas de souci pour le mémoire.

Si je comprends bien, dans un cas habituel, nous avons un échantillon d'individus (n par exemple) sur lesquels sont mesurées deux variables X et Y (poids et taille par exemple). Ainsi, nous avons n x 2 observations nous permettant de calculer un coefficient de corrélation.

Dans le cadre d'un CCI, nous avons un "échantillon de clusters" (k par exemple) sur lesquels sont mesurées deux variables X et Y (poids de l'individu j, poids de l'individu j'). Ainsi, nous avons k x 2 observations au total (dû au nombre de répétitions de l'expérience = nombre de clusters). Il serait donc possible de calculer un CCI.

Si ce que j'indique plus haut est juste, il demeure quelques interrogations pour moi.

1) Comment définir de manière non-mathématique (en français) la VARIABLE Yij énoncée dans les messages précédents ?

2) Que signifie ainsi la variance de Yij ? (puisque dans ma tête de matheux en difficulté, je ne vois ce Yij encore seulement comme une valeur)

3) Avec mes tutrices de stage, nous avons supposé que le CCI est le même quelque soit les sujets considérés et quelque soit les clusters considérés par facilité (même si on sait que ce n'est pas très réaliste). Comment alors obtenir ces k mesures sur 2 variables ?

Merci par avance pour votre aide. Très belle journée.
Arthur

Posté par
arthurarthur3
re : Coefficient de Corrélation Intraclasse 27-07-21 à 10:35

Quelles sont ainsi les observations de la variable Yij ?

Posté par
Vassillia
re : Coefficient de Corrélation Intraclasse 27-07-21 à 11:28

Dans le cas où Y_{ij} = \mu + u_i + \epsilon_{ij} qui est le tien, on va prolonger l'exemple pour essayer de s'y retrouver.
\mu est le poids moyen dans la population
u_i est la modification pour avoir le poids moyen dans le cluster i, par exemple on peut faire des clusters par catégorie socioprofessionnelle ou n'importe quelle autre variable qualitative qui aura un impact selon nous.
\epsilon_{ij} est la modification pour avoir le poids de l'individu j.
Bilan \mu est une valeur fixe, u_i varie d'un cluster à l'autre mais ne varie pas à l'intérieur d'un cluster, \epsilon_{ij} varie d'un individu à l'autre.
C'est peut-être pas une bonne idée d'utiliser des minuscules au lieu de majuscules mais c'est l'usage pour réserver les majuscules au fait qu'on a généralement des modèles pour prédire Y en fonction de X.
Y_{ij} est juste le poids d'un individu au hasard appartenant à un cluster au hasard donc c'est comme d'habitude le poids d'un individu au hasard dans la population.
Var(Y_{ij})=Var(u_i) + Var(\epsilon_{ij}) donc on décompose la variabilité entre celle qui vient du cluster à qui il appartient et celle qui vient de lui.
Je ne sais pas si je suis claire mais j'aurai du mal à faire mieux.

Posté par
arthurarthur3
re : Coefficient de Corrélation Intraclasse 29-07-21 à 14:10

Merci pour cette réponse.

Qu'appelles-tu "la modification pour avoir ..." ?

Donc si je te lis bien Yij n'est qu'une seule valeur, une observation et non une variable...

Désolé si je ne comprends pas...



Vous devez être membre accéder à ce service...

Pas encore inscrit ?

1 compte par personne, multi-compte interdit !

Ou identifiez-vous :


Rester sur la page

Désolé, votre version d'Internet Explorer est plus que périmée ! Merci de le mettre à jour ou de télécharger Firefox ou Google Chrome pour utiliser le site. Votre ordinateur vous remerciera !