Séquence : 20
Inférence

INFERENCE

Jeudi 6 Juin 2024, à 14h00
Au sommaire :
  • Optimisation de l’inférence : Architectures, Compression de Modèle, Frameworks d’inférence

  • Deploiement : Terminaux, serveurs, gestion des dépendances, Orchestrateurs

  • Gradio : une interface complète pour des démos stylisées

Durée: 2.5h
Regarder sur YouTube