J'ai peut-être oublié ce qui a été dis, mais je ne ois pas à quoi ce theta correspond. C'est par rapport à ce terme que l'on semble dériver dans la suite du processus, j'imagine qu'il s'agit donc d'un paramètre important. J'ai pensé aux différents poids des différents neurones, mais comment calcule-t-on la dérivée dans ce cas ? si le réseau est grand, le calcul de cette dérivée risque de prendre un temps monstrueux non ? n_neurones*n_paramaètres*n_iterations