0 votes
par dans Séquence 18
Le rainbow DQN semble beaucoup plus performant que les autres types de DQN pris individuellement mais à quel point le coût d'apprentissage (ressources, durée) est-il augmenté avec cette méthode ?

1 Réponse

0 votes
par Vétéran du GPU 🐋 (68.8k points)
 
Meilleure réponse
Répondu en Live mais pour une trace sur le forum :

Effectivement avec tous ses rajouts le rainbow DQN nécessite plus de puissance de calcul pour chaque step. Cependant, comme on a pu le voir durant la séquence avec les optimisations "softwares", on peut avoir un trade-off si on arrive à atteindre une même métrique avec des étapes plus longues mais un nombre d'étape moins élevé.

Dans l'exemple donné dans le cours (le graphique comparatif), on peut constater que le rainbow DQN est beaucoup plus fort que les autres versions (suffisamment pour que même avec un coût à la step plus élevé il reste plus efficace au final).
...