0 votes
par dans 01 - Bases, concepts et histoire
Pourquoi utilisez vous la moyenne et la std calculée sur le jeu de données d'entrainement pour centrer réduire le jeu de données test ? ne faudrait il pas centrer réduire ce jeu de données test en recalculant la mean et std ?

1 Réponse

0 votes
par Vétéran du GPU 🐋 (68.8k points)
 
Meilleure réponse
On réutilise la même normalisation car on doit se remettre dans les même condition que l'apprentissage durant l'inférence.

Normalement, cela ne change rien si on a bien sample nos données et/ou que celles-ci soient en très grand nombre.

Un exemple avec des images : si on apprend à classer uniquement avec des image de couleur rouge puis que l'on essaye avec des images de couleurs vertes on risque de ne pas avoir de très bons résultats car il y a trop d'écart entre les 2 distributions. En même temps il serait une drôle d'idée de vouloir faire ça ...
...