Répondu en Live mais pour une trace sur le forum :
Effectivement avec tous ses rajouts le rainbow DQN nécessite plus de puissance de calcul pour chaque step. Cependant, comme on a pu le voir durant la séquence avec les optimisations "softwares", on peut avoir un trade-off si on arrive à atteindre une même métrique avec des étapes plus longues mais un nombre d'étape moins élevé.
Dans l'exemple donné dans le cours (le graphique comparatif), on peut constater que le rainbow DQN est beaucoup plus fort que les autres versions (suffisamment pour que même avec un coût à la step plus élevé il reste plus efficace au final).