Séquence : 20
Ingénierie de l'Inférence et mise en production : Quand le rêve devient réalité !
Jeudi 6 Juin 2024, à 14h00
Au sommaire :
  • Optimisation de l’inférence : Architectures, Compression de Modèle, Frameworks d’inférence

  • Deploiement : Terminaux, serveurs, gestion des dépendances, Orchestrateurs

  • Gradio : une interface complète pour des démos stylisées

Durée: 2.5h
Regarder sur YouTube