Bonjour,
Pour minimisez la quantité de paramètres à sauvegarder, il y a un tirage au hasard d'un petit nombre de données sur lesquelles seront fait les calculs. Le tirage se fait sans remise et le prochain tirage sera fait sur le jeu de données corrigées (données totales - celles déjà tirées). Ma question est pourquoi faire un tirage sans remise ? Comme il y a énormément de données, un tirage avec remise devrait avoir la même efficacité et est plus simple à gérer. La notion d'epoch n'aurait pas fondamentalement disparu avec la notion d'epoch moyen.