0 votes
par dans Séquence 3
Bonjour,

J'avais plusieurs questions concernant l'optimisation des CNN.

Concernant les CNN, comment pouvons-nous choisir l'architecture de notre modèle ? Comment savoir si nous devons mettre une, deux, trois (ou plus) couches de convolution et de pooling ?

Comment pouvons-nous faire afin d'améliorer notre modèle ? Quels sont les différents outils utilisés afin d'améliorer la performance de notre modèle ?

Merci beaucoup pour votre aide !

1 Réponse

0 votes
par Vétéran du GPU 🐋 (68.8k points)
 
Meilleure réponse
L'architecture d'un modèle se construit avec les connaissances existantes et les expériences que l'on réalise. Généralement, on se base sur un modèle existant et performant puis on le modifie par petit ajout/modification/suppression.

L'architecture est alors un hyperparametre que l'on va faire varier en observant l'évolution de nos résultats.

Des outils de recherche d'hyperparametre comme hydra existent pour automatiser la recherche.

Cela s'accompagne d'un bon monitoring d'expériences
par
Merci pour votre réponse
...