En apprentissage non supervisé, la principale différence par rapport à l'apprentissage supervisé réside dans la fonction de perte et l'objectif d'apprentissage, et non nécessairement dans l'architecture du réseau. Ces fonctions de perte sont spécialement conçues pour traiter des données sans étiquettes, permettant au modèle d'identifier des structures ou caractéristiques intrinsèques dans les données.