Architecture et optimisation d'un modèle

Question 1

Bonjour,

J'avais plusieurs questions concernant l'optimisation des CNN.

Concernant les CNN, comment pouvons-nous choisir l'architecture de notre modèle ? Comment savoir si nous devons mettre une, deux, trois (ou plus) couches de convolution et de pooling ?

Comment pouvons-nous faire afin d'améliorer notre modèle ? Quels sont les différents outils utilisés afin d'améliorer la performance de notre modèle ?

Merci beaucoup pour votre aide !

Question 2

L'architecture d'un modèle se construit avec les connaissances existantes et les expériences que l'on réalise. Généralement, on se base sur un modèle existant et performant puis on le modifie par petit ajout/modification/suppression.

L'architecture est alors un hyperparametre que l'on va faire varier en observant l'évolution de nos résultats.

Des outils de recherche d'hyperparametre comme hydra existent pour automatiser la recherche.

Cela s'accompagne d'un bon monitoring d'expériences

Question 3

Merci pour votre réponse

hunoutl[IDRIS] · Answer 1 · 2022-12-01T14:23:39+0000

L'architecture d'un modèle se construit avec les connaissances existantes et les expériences que l'on réalise. Généralement, on se base sur un modèle existant et performant puis on le modifie par petit ajout/modification/suppression.

L'architecture est alors un hyperparametre que l'on va faire varier en observant l'évolution de nos résultats.

Des outils de recherche d'hyperparametre comme hydra existent pour automatiser la recherche.

Cela s'accompagne d'un bon monitoring d'expériences

Architecture et optimisation d'un modèle

Votre réponse

1 Réponse

Votre commentaire sur cette réponse

Catégories