0 votes
par dans 08 - RNN et Embedding
https://lfaidata.foundation/blog/2023/09/21/lf-ai-data-launches-generative-ai-commons/

https://blog.rwkv.com/p/eagle-7b-soaring-past-transformers

Un avis sur RWKV ? Une architecture récente qui a de bonnes performances comparables aux Transformers.

1 Réponse

0 votes
par Vétéran du GPU 🐋 (68.8k points)
 
Meilleure réponse
Le papier sur le modèle RWKV est intéressant. Cela relance les RNN dans la course aux LLM.

Cependant, les comparatifs ne sont pas idéaux dans le papier. De plus, il y a quelques problèmes d'inefficacités qui sont pour l'instant cachés par des kernels customs.

On va voir ce que cela donne dans les prochains mois.

On parlera peut être de ces nouvelles architectures très récentes en fin de saison fidle ou durant un épisode de Panoram'IA
...