+1 vote
par dans Séquence 3 : TP
Bonjour,

J'ai bien compris ce qu'étaient les données d'entrainement, mais pouvez-vous m'expliquer quelles sont les différences entre les données de test et de validation svp ?

merci

2 Réponses

+1 vote
par
sélectionné par
 
Meilleure réponse

Les données de validation sont utilisées pour optimiser les paramètres du model et les données de test sont utilisées pour fournir une estimation non biaisée du model final. 

reférence: https://www.statology.org

par
D'accord, donc si j'ai bien compris les données de test permettent de savoir à quel point le modèle prédit correctement et les données de validation sont utilisées pour pouvoir faire d'autres essais dans le but d'améliorer notre modèle sans qu'il n'y ait aucun impact sur nos données d'entrainement ?
0 votes
par Vétéran du GPU 🐋 (68.8k points)
Il n'y a pas de différence. Train, test et validation sont des éléments tirés aléatoirement du dataset complet. Chaque paquet contient des images qui ne doivent pas être présente dans les autres.

Remarque: dans certains contextes, il peut être intéressant d'avoir un test et validation contenant des éléments plus difficiles/réels pour projeter l'utilisation du modèle dans la réalité tout en simplifiant l'apprentissage
par
Merci !
...