Bonjour,
Y a-t-il des différences de performances selon les langues utilisées pour les modèles unidirectionnels ? Certaines langues positionnent les mots "les plus importants" d'une phrase plutôt à la fin, certaines langues ont un ordre arbitraire des mots... Comment ces différences sont gérées au sein des modèles ?