J'essaie de rapporter la séance du jour à ce que nous avons pu voir lors des précédentes.
De quels modèles se rapprochent le plus les modèles de Reinofrcement Learning ?
Des GAN ?
J'ai l'impression que les modèles RL s'implémentent complètement différemment des autres, même au niveau des lignes de codes de Tensorflow, Pytorch ou autres.
Mais peut-être que je me trompe.