0 votes
par dans Séquence 18
J'essaie de rapporter la séance du  jour à ce que nous avons pu voir lors des précédentes.

De quels modèles se rapprochent le plus les modèles de Reinofrcement Learning ?

Des GAN ?

J'ai l'impression que les modèles RL s'implémentent complètement différemment des autres, même au niveau des lignes de codes de Tensorflow, Pytorch ou autres.

Mais peut-être que je me trompe.

1 Réponse

0 votes
par Vétéran du GPU 🐋 (68.8k points)
sélectionné par
 
Meilleure réponse
Le DRL est surtout la manière de réaliser l'entrainement. Les réseaux peuvent avoir des architectures identiques à ce que l'on a déjà vu
par
D'accord. En parlant de façon de faire, comment cela se passe en robotique ?
Je me disais que peut-être les neurones de robots étaient entraînés avec du supervised learning à partir des données déjà disponibles, puis on passe le robot en reinforcement learning pour s'adapter aux nouvelles situations à plus long terme ?
par Vétéran du GPU 🐋 (68.8k points)
En robotique, on fait de la simulation en premier lieu. (On peut commencer avec un système en supervised mais ce n'est pas obligatoire).
Ensuite on passe sur le robot dans le vrai monde.
Sur toute la durée de vie du robot, on ne fait pas un apprentissage continue (trop coûteux).
On privilégie une adaptation avec des cycles (exploitation/apprentissage)
par
Bien reçu. Merci.
...