ChatGPT, Gemini, Claude, Grock, Llama, Mistral, Qwen, Deepseek, …
Les LLMs peuvent être entraînés pour un très nombre de tâches. L’une des utilisations les plus connues est leur application en IA générative : ils sont capables de produire un texte de réponse à une invite ou une question. ChatGPT, un LLM accessible au public, peut par exemple générer des essais, des poèmes et d’autres formes de texte en réponse aux entrées de l’utilisateur.
N’importe quel ensemble de données complexes et de grande taille peut être utilisé pour entraîner des LLM, y compris les langages de programmation. Certains LLM peuvent d’ailleurs aider les programmeurs à rédiger du code. Ils peuvent ainsi écrire des fonctions à la demande ou terminer l’écriture d’un programme à partir d’un code qui leur a été donné comme point de départ.
Qu’est ce qu’un LLM ?
Brève histoire des grands modèles de langage.
Apprendre le langage à un modèle avec un pré-entraînement.
Adapter les modèles à des tâches spécifiques.
Humaniser les réponses avec l’alignement.
Comment générer le prochain mot (Greedy search, Beam search, Sampling, …) ?
Les garde-fous contre la génération de contenu délirant
Des LLM factuels avec le RAG
Les nouvelles techniques de raisonnement
Décupler les possibilités avec l’Agentic