Bonjour !
Je vous explique mon blocage : je dois faire le même exercice que klm67 dans ce topic : http://www.les-mathematiques.net/phorum/read.php?13,1187425, seulement lui devait le faire à la main et non sur Python.
J'ai une grande base de données, voici les consignes :
"Importer la base de données disponibles http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv.
Créer une matrice Z qui contient les 11 premières colonnes et toutes les lignes du tableau. On prendra pour y le vecteur qui contient la dernière colonne de ce tableau. On aura donc une matrice Z de taille 4898×11.
On reprend l'estimateur des moindres carrés proposé ci-dessus:
β^Z=((ZT * Z)-1) * Z⊤ * y
Donner la valeur des résidus obtenus: ∥Zβ^Z−y∥22 ?"
Sur Python, j'ai commencé par calculer β^Z. Je me disais qu'en suivant scrupuleusement chacune des opérations, c'est à dire patiemment multiplier chacune des matrices, il ne devrait pas être trop dur d'arriver à calculer ∥Zβ^Z−y∥22 (la norme euclidienne au carré). Patatras, j'obtiens un ordre de grandeur de 10-11, quand la solution doit être une partie entière.
J'ai ensuite essayé np.linalg.lnsqs, np.linalg.norm ... toutes ces fonctions NumPy me préviennent que mes matrices n'ont pas la bonne dimension...
Auriez vous eu affaire au même type d'exercice ? Auriez vous une piste ? Merci d'avance !!