Si la sortie du 1er neurone d'un réseau récurrent est mauvaise/biaisée, cette erreur, si elle n'est pas détectée, risque de polluer tout le reste du réseau.
Du coup, l'utilisation d'un RNN exige-t-elle d'avoir des fonctions d'activations et pondérations déjà bien définies dès le départ, et plus importantes que pour un CNN ?
Et en ce cas, comment ça se passe pour bien les définir ?