0 votes
par (160 points) dans Séquence 4
Comment fait-on pour éviter les minimums locaux lors de l'optimisations des poids avec la descente de gradient ?

1 Réponse

0 votes
par Vétéran du GPU 🐋 (11.2k points)
sélectionné par
 
Meilleure réponse
Avec les optimiseurs de descente de gradient qui traite partiellement le problème (meilleur minimum local) : SGD Momentum, Adagrad, Adam, etc... On voit ça ensuite.
...