Connexion
Souvenir
Inscription
Questions
Sans réponse
Catégories
Utilisateurs
Poser une question
Fidle
Poser une question
K-fold validation
+1
vote
posée
par
AD
15 décembre 2022
dans
Séquence 5
Pourquoi cette méthode est adaptée pour les "petits" ensembles de données ?
En effet, si on divise ce set en k=3 sous-ensembles, ces sets sont encore plus petits, générant ainsi encore plus d'instabilité, non ?
Votre réponse
Votre nom à afficher (en option)
Envoyez-moi un e-mail à cette adresse si ma réponse est sélectionnée ou commentée
Envoyez-moi un e-mail si ma réponse est sélectionnée ou commentée
Vie privée : votre adresse de messagerie ne sera utilisée que pour l'envoi de ces notifications .
Vérification anti-spam
Pour éviter cette vérification à l'avenir,
Connectez vous
ou
inscrivez vous
.
2
Réponses
0
votes
répondu
par
Nathan[IDRIS]
Vétéran du GPU 🐋
(
48.7k
points)
23 janvier 2023
Meilleure réponse
On privilégie les petits datasets pour cette méthode, car elle demande énormément de calcul étant donné qu'on va faire l'apprentissage plusieurs fois (voire beaucoup selon la valeur de k). En soit on pourrait tout à fait le faire sur des datasets plus grands mais c'est pas raisonnable.
La deuxième raison c'est qu'un gros dataset est (généralement) plus diversifié et plus représentatif de la distribution latente des données donc la manière dont le dataset est découpé importe moins. Un petit dataset quand il sera découpé fera apparaître plus de biais parce qu'il est petit, donc c'est plus intéressant de faire la k-fold, pour mesurer la qualité de notre réseau indépendamment de ça.
Votre commentaire sur cette réponse
Votre nom à afficher (en option)
Envoyez-moi un e-mail à cette adresse si un commentaire est ajouté après le mien
Envoyez-moi un e-mail si un commentaire est ajouté après le mien
Vie privée : votre adresse de messagerie ne sera utilisée que pour l'envoi de ces notifications .
Vérification anti-spam
Pour éviter cette vérification à l'avenir,
Connectez vous
ou
inscrivez vous
.
0
votes
répondu
par
Félix
15 décembre 2022
Je crois que c'est parce que chaque donnée d'entrée servira forcément au moins 1 fois en test, 1 fois en validation et 1 fois en train
Contrairement à du hold-out où 1 entrée donnée servira soit de test, soit de train, soit de validation (mais jamais les 3)
Votre commentaire sur cette réponse
Votre nom à afficher (en option)
Envoyez-moi un e-mail à cette adresse si un commentaire est ajouté après le mien
Envoyez-moi un e-mail si un commentaire est ajouté après le mien
Vie privée : votre adresse de messagerie ne sera utilisée que pour l'envoi de ces notifications .
Vérification anti-spam
Pour éviter cette vérification à l'avenir,
Connectez vous
ou
inscrivez vous
.
Catégories
Toutes les catégories
Attestations
(14)
Installation FIDLE
(19)
01 - Bases, concepts et histoire
(57)
02 - L’enfer des données, des modèles et des représentations...
(21)
03 - Démo et Illustration
(8)
04 - AI, droit, société et éthique
(5)
05 - Mathématiques, gradients everywhere !!!
(6)
06 - Méthodologie des modèles/apprentissage + fine-tuning + TP
(10)
07 - Réseaux convolutifs CNN
(9)
08 - RNN et Embedding
(10)
09 - Transformers
(13)
10 - Graph Neural Network (GNN)
(10)
11 - Autoencodeur (AE)
(3)
12 - Variational Autoencoder (VAE)
(2)
13 - Generative Adversarial Networks (GAN)
(5)
14 - Diffusion Model (DM)
(3)
15 - Deep Reinforcement Learning (DRL)
(2)
16 - Physics Informed Neural Networks (PINNS)
(4)
17 - Optimisation de l'apprentissage
(2)
18 - Passer à la vitesse supérieure : l’accélération matérielle
(0)
19 - Multi-modalité
(1)
2nd JDLS
(0)
Archives 2022/2023
(77)
Installation Fidle
(61)
Attestation
(13)
Présentation de saison
(11)
Séquence 1
(29)
Séquence 2
(81)
Séquence 3
(52)
Séquence 4
(27)
Séquence 5
(16)
Séquence 5 : TP
(2)
Séquence 6
(20)
Séquence 7
(19)
Séquence 8
(35)
Séquence 9
(12)
Séquence 10
(11)
Séquence 11
(19)
Séquence 13
(9)
Séquence 14
(7)
Séquence 15
(7)
Séquence 16
(11)
Séquence 17
(5)
Séquence 18
(6)
Séquence 19
(5)
JDLS 2023
(3)
Bienvenue sur Fidle Q&A, où vous pouvez poser des questions et recevoir des réponses d'autres membres de la communauté.
...