compactifier l'espace latent

Question 1

Je n'ai pas bien compris la slide 21. On indique que c'est mieux de compacter, mais pour bien discerner les categories, est-ce qu'il ne vaut pas mieux justement bien séparer les groupes? On va avoir un overlap si on compresse et donc plus d'erreur dans la classification non?

Question 2

De gros vecteurs impliquent de gros réseaux difficiles à entraîner. De manière générale les réseaux de neurones s'en sortent assez mal sur les données creuses, donc on essaie de compresser (forcément avec pertes), si possible en minimisant au maximum l'overlap. C'est un compromis entre le niveau de compression et les pertes engendrées.

Question 3

Étant donné qu'on a en fait beaucoup plus de dimension que la représentation de la réalité, en quoi une distance dans ce graphe indique une proximité ou un éloignement réel pour une ou plusieurs dimensions?

Question 4

Les distances c'est un peu une propriété qu'on cherche à reproduire dans les espaces latents. c'est un peu ce qu'on fait aussi avec le traitement du langage, on peut mesurer les ressemblances entre deux mots en regardant leurs représentations latentes respectives.
On veut qu'un espace latent traduise le sens et la sémantique de la donnée

par ailleurs, j'ai pas compris ce que tu voulais dire par là "étant donné qu'on a en fait beaucoup plus de dimension que la représentation de la réalité"

Nathan[IDRIS] · Answer 1 · 2023-02-09T13:39:54+0000

commentée par Autiwa (600 points) 09 février 2023

commentée par Nathan[IDRIS] Vétéran du GPU 🐋 (48.7k points) 09 février 2023

compactifier l'espace latent

Votre réponse

1 Réponse

Votre commentaire sur cette réponse

Catégories