+1 vote
par dans Séquence 8
En voyant tous les produits matriciels qui sont faits dans les transformers, je me dis que l'algorithme amélioré de multiplication de matrices trouvé par AlphaTensor doit avoir permis d'accélérer les calculs en transformers ?

1 Réponse

0 votes
par Vétéran du GPU 🐋 (11.2k points)
sélectionné par
 
Meilleure réponse
je dirais pas encore c'est tout récent mais à terme oui très certainement.
par Vétéran du GPU 🐋 (68.8k points)
L'amélioration de la multiplication de matrice va s'intégrer dans les librairies bas niveaux. Le gain que l'on va obtenir s'appliquera à la plupart des modèles de deep learning (pas que les transformers)
...