Inscription / Connexion Nouveau Sujet
Niveau Licence Maths 1e ann
Partager :

Dérivée d'un matrice par rapport à une matrice ?

Posté par
AlexisFezensa
13-10-22 à 15:30

Salut !

J'ai une question de math toute bête mais dont je n'arrive pas à m'en sortir.

Imaginons une simple régressions linéaire, on a q exemples de dimensions n, ce qui nous fait une matrice X (q lignes, n colonnes)

Imaginons alors que chaque exemple à un label de dimensions p. On a la régression basique f(X) = XW + b = Y (avec W une matrice des poids et b le biais) Y est donc une matrice de dimension q lignes, p colonnes.

Quel est le gradient de f par rapport à X ?

Grossièrement, on dérive une matrice par rapport à une matrice. Dans mon esprit le gradient devrait être une matrice de matrices (la dérivée d'une matrice par rapport à un scalaire étant déjà une matrice) Est-ce correcte ?

Merci d'avance !

Posté par
lionel52
re : Dérivée d'un matrice par rapport à une matrice ? 13-10-22 à 17:10

De ce que je vois, il n'y a pas de manière conventionnelle de représenter ce gradient.

On sait facilement que la différentielle est l'application H -> HW.


Ptet qu'une représentation du gradient utilise des produits tensoriels...

Posté par
lionel52
re : Dérivée d'un matrice par rapport à une matrice ? 13-10-22 à 17:21

Vu sur stack : Les conventions généralement utilisées sont les suivantes :



(Magnus-Neudecker)



Vous devez être membre accéder à ce service...

Pas encore inscrit ?

1 compte par personne, multi-compte interdit !

Ou identifiez-vous :


Rester sur la page

Inscription gratuite

Fiches en rapport

parmi 1724 fiches de maths

Désolé, votre version d'Internet Explorer est plus que périmée ! Merci de le mettre à jour ou de télécharger Firefox ou Google Chrome pour utiliser le site. Votre ordinateur vous remerciera !