0 votes
par dans Séquence 1
edité par
Comment choisi t'on le nombre de neurones dans les couches denses ? (ici les 64) Et comment choisi t on le nombre de couches totales?

1 Réponse

0 votes
par Vétéran du GPU 🐋 (48.7k points)
 
Meilleure réponse
En faisant différentes expériences d'apprentissage. C'est un hyperparamètre difficile à appréhender. Avec le temps, on développe une intuition. Il ne faut pas que le modèle soit trop profond sinon il est trop "intelligent" par rapport à la tâche à résoudre ce qui est mauvais pour l'apprentissage. Globalement il faut avoir une idée de la difficulté de la tâche à résoudre. Mais on finit toujours par faire des essais pour affiner cet hyperparamètre.
par Vétéran du GPU 🐋 (68.8k points)
un modèle trop profond a tendance à apprendre moins vite et peut même être incapable d'apprendre à cause d'une descente de gradient trop lente et imprécise. (voir les fonctions d'activations pour approfondir)
par
Merci
...