0 votes
par (150 points) dans Séquence 1
edité par

Bonjour,

Dans la séquence 1, on a surtout vu l'exemple de données purement numériques (continues) en entrée, afin de prédire une variable numérique ou catégorielle en sortie. Toutefois :

  • Quelles sont les bonnes stratégies pour construire des réseaux de neurones n'ayant que des variables catégorielles en entrée ? Par exemple : quel recodage/encodage des variables pour les rendre numériques ? quelles conséquences sur le choix de la fonction d'activation, ou la structure globale du réseau ?
  • Même question avec des variables ordinales en entrée du réseau.
  • Comment gérer le cas de données mixtes en entrée ? ça appelle visiblement des stratégies un peu complexes et assez différentes, mais y a-t-il une stratégie plus "standard" ?

Merci !

1 Réponse

0 votes
par Vétéran du GPU 🐋 (68.8k points)
sélectionné par
 
Meilleure réponse
La bonne stratégie est celle qui se prête bien suivant les données d'entrée. Généralement, on normalise/standardise un maximum pour faciliter l'usage du réseau. Concernant l'encodage que de ce type de variable, le plus simple est d'attribuer un nombre à une catégorie mais on peut imaginer des méthodes beaucoup plus complexe et efficace.

En cas de données mixtes, on va vouloir uniformiser un maximum nos différents types. Pour cela, on applique les méthodes évoquées plus haut et on va essayer à nouveau de normaliser.

Il existe plein de stratégie et méthode, certaines que l'on verra durant les prochaines séances
...