Connexion
Souvenir
Inscription
Questions
Sans réponse
Catégories
Utilisateurs
Poser une question
Fidle
Poser une question
Nombre max de valeurs par vecteur d'entrée ?
+2
votes
posée
par
EgonHeuson
(
1.3k
points)
17 novembre 2022
dans
Séquence 1
Pour ce type de modèles, quelle est la taille max du vecteur d'entrée, en nombre de valeurs ?
Votre réponse
Votre nom à afficher (en option)
Envoyez-moi un e-mail à cette adresse si ma réponse est sélectionnée ou commentée
Envoyez-moi un e-mail si ma réponse est sélectionnée ou commentée
Vie privée : votre adresse de messagerie ne sera utilisée que pour l'envoi de ces notifications .
Vérification anti-spam
Pour éviter cette vérification à l'avenir,
Connectez vous
ou
inscrivez vous
.
2
Réponses
+2
votes
répondu
par
Camille [IDRIS]
(
3.1k
points)
17 novembre 2022
sélectionné
par
EgonHeuson
17 novembre 2022
Meilleure réponse
Pour réduire la taille du vecteur d'entrée (un échantillon), il est utile de faire du *feature engineering* c'est à dire de sélectionner les éléments les plus pertinents ou de combiner des éléments entre eux. Cela peut être fait manuellement ou semi automatiquement (voir l'analyse en composantes principales).
commentée
par
EgonHeuson
(
1.3k
points)
17 novembre 2022
Hmmm très intéressant. Dans mon cas ce sont les aminoacides d'une protéine. Du coup l'idée serait de faire des groupes d'aminoacides plutot que de les rentrer 1 par 1 si je comprends bien ?
commentée
par
Camille [IDRIS]
(
3.1k
points)
17 novembre 2022
Je ne connais pas le domaine, donc je ne sais pas si le regroupement à du sens. Il y a peut-être des notations plus condensée que d'autres ?
Je pense à SMILES (
https://en.wikipedia.org/wiki/Simplified_molecular-input_line-entry_system
) - mais il faudra probablement attendre la session sur les *transformer* pour en profiter - ce sont des modèles très adéquats pour de longues séquences.
commentée
par
EgonHeuson
(
1.3k
points)
17 novembre 2022
Eheh, SMILES je m'en sers pour l'autre côté, sur les molécules chimiques qui sont transformées. Pour les protéines, pour l'instant je fais plutôt de l'alignement (type mmseq) mais ça a tendance à complexifier parfois.
En fait SMILES sur les protéines ça serait énorme ^^
Votre commentaire sur cette réponse
Votre nom à afficher (en option)
Envoyez-moi un e-mail à cette adresse si un commentaire est ajouté après le mien
Envoyez-moi un e-mail si un commentaire est ajouté après le mien
Vie privée : votre adresse de messagerie ne sera utilisée que pour l'envoi de ces notifications .
Vérification anti-spam
Pour éviter cette vérification à l'avenir,
Connectez vous
ou
inscrivez vous
.
0
votes
répondu
par
Nathan[IDRIS]
Vétéran du GPU 🐋
(
48.7k
points)
17 novembre 2022
En soit y a pas de limite, si ce n'est la taille de la mémoire. Mais par contre si le vecteur est trop grand, le réseau va devoir apprendre à reconnaître les redondances et va devoir se dépatouiller parmi un ensemble de patterns qui est exponentiellement plus grand. Donc en pratique il faut faire attention à ne pas avoir des dimensions trop grandes.
commentée
par
EgonHeuson
(
1.3k
points)
17 novembre 2022
Ok :-) Parce que j'ai un cas d'application pratique ou on est sur plusieurs milliers de valeurs en entrée.
commentée
par
hunoutl[IDRIS]
Vétéran du GPU 🐋
(
68.8k
points)
17 novembre 2022
Généralement, pour optimiser la performance calculatoire, on essaye d'apprendre uniquement sur les features qui apporte de l'information et on enlève les redondances
commentée
par
EgonHeuson
(
1.3k
points)
17 novembre 2022
Je vois. Dans mon cas, chaque valeur sont en fait des vecteurs de binaires du type (0,1,0,0,...) ou (0,0,1,0,...).
Votre commentaire sur cette réponse
Votre nom à afficher (en option)
Envoyez-moi un e-mail à cette adresse si un commentaire est ajouté après le mien
Envoyez-moi un e-mail si un commentaire est ajouté après le mien
Vie privée : votre adresse de messagerie ne sera utilisée que pour l'envoi de ces notifications .
Vérification anti-spam
Pour éviter cette vérification à l'avenir,
Connectez vous
ou
inscrivez vous
.
Catégories
Toutes les catégories
Attestations
(14)
Installation FIDLE
(19)
01 - Bases, concepts et histoire
(57)
02 - L’enfer des données, des modèles et des représentations...
(21)
03 - Démo et Illustration
(8)
04 - AI, droit, société et éthique
(5)
05 - Mathématiques, gradients everywhere !!!
(6)
06 - Méthodologie des modèles/apprentissage + fine-tuning + TP
(10)
07 - Réseaux convolutifs CNN
(9)
08 - RNN et Embedding
(10)
09 - Transformers
(13)
10 - Graph Neural Network (GNN)
(10)
11 - Autoencodeur (AE)
(3)
12 - Variational Autoencoder (VAE)
(2)
13 - Generative Adversarial Networks (GAN)
(5)
14 - Diffusion Model (DM)
(3)
15 - Deep Reinforcement Learning (DRL)
(2)
16 - Physics Informed Neural Networks (PINNS)
(4)
17 - Optimisation de l'apprentissage
(2)
18 - Passer à la vitesse supérieure : l’accélération matérielle
(0)
19 - Multi-modalité
(1)
2nd JDLS
(0)
Archives 2022/2023
(77)
Installation Fidle
(61)
Attestation
(13)
Présentation de saison
(11)
Séquence 1
(29)
Séquence 2
(81)
Séquence 3
(52)
Séquence 4
(27)
Séquence 5
(16)
Séquence 6
(20)
Séquence 7
(19)
Séquence 8
(35)
Séquence 9
(12)
Séquence 10
(11)
Séquence 11
(19)
Séquence 13
(9)
Séquence 14
(7)
Séquence 15
(7)
Séquence 16
(11)
Séquence 17
(5)
Séquence 18
(6)
Séquence 19
(5)
JDLS 2023
(3)
Bienvenue sur Fidle Q&A, où vous pouvez poser des questions et recevoir des réponses d'autres membres de la communauté.
...