0 votes
par dans 06 - Méthodologie des modèles/apprentissage + fine-tuning + TP
edité
Bonjour
J'ai eté jeter un coup d'oeil sur le site que vous avez mentionné : playground.tensorflow.ia
j'ai remarqué dans les données d'entrée, il propose de sélectionner
- X1,x2
- X1², X2²
- XiX2
Ma question : pourquoi propose t-il ces effets quadratiques et interactions en données d'entrée du réseau : pour sa rapidité, une meilleure convergence, ?
il introduit également sin(X1), cela signifie t-il qu'en début de réseau on peut mettre une loi physique
Cela super sympa ; il manquera plus que le te temps pour gérer la séquentialité
Fred - île de la réunion

1 Réponse

0 votes
par Vétéran du GPU 🐋 (48.7k points)
sélectionné par il y a
 
Meilleure réponse
C'est l'idée que certaines features permettent à notre réseau de neurones de s'en sortir malgré une architecture moins profonde et moins large. C'est suite à un travail sur les données qu'on peut identifier certaines grandeurs particulièrement pertinentes. C'est notamment dans ce contexte que les connaissances d'un chercheur expert du domaine est crucial. En effet, on peut avoir l'impression parfois dans certaines présentations que le deep learning pourrait se passer des connaissances d'un expert via l'apprentissage par les données. C'est en théorie vrai si on a accès à une base de données parfaite (volumineuse, diversifiée et de qualité). Savoir comment extraire les informations pertinentes d'une IRM ou d'un relevé de je ne sais quel domaine peut beaucoup aider le réseau, et c'est ce que tensorflow playground montre vaguement via ces features.
par
Merci pour votre réponse :
Lorsqu'on a un processus de fabrication (fromage) on connait certaines  lois physiques et effets donc je ne mettrai pas les facteurs mais les effets métier connus comme vous le mentionnez
La question que je me pose est sur la sequentialité ou decoupage des étapes de fabrications en 5 RNAP  ( si 5 etapes de fabrication). Je sais que l'on perd en informations mais en coût d'entrainement de modele, on divise par 5 le temps d'entrainement ou par exp(5); Y a t-il une documentation la dessus ? Merci
Objectif : entrainer des modèles de fabrication de fromage sur l'île de la Réunion pas a pas
Fred
par Vétéran du GPU 🐋 (48.7k points)
Je suis pas sûr de comprendre. Vous voulez dire que vous avez diminué la taille de votre entrée et vous vous demandez l'impact sur la durée d'entraînement ? C'est difficile à dire pour le coup et ça dépend de votre cas d'usage. Il n'y a pas vraiment de règle générale pour cela.
par
On ne peut pas utiliser une ferrari pour aller chercher une baguette.
vu l'état de la planète, il faut peut etre considérer une autre approche sur l'achitecture des reseaux de neurones, à chaque complexité de probleme sont architecture.
Je travaille sur une nouvelle archiecture entre les reseaux de neurones profond et les arbres de décisions qui permetrait d'economiser de l'énergie.
Quelques remarques :
- dans votre formation vous entrez les facteurs dans le réseau mais ce sont les effets qu'il faut rentrer
-  J'ai testé les réseaux et il me semble qu'il y ait des erreurs sur les bornes des ensemble de défintions des effets mais ils ajustent correctement 95% de la population
- pourrier vous ajouter piece a joindre pour que je puisse vous envoyer des preuves
par
Autre question :
Faites vous visiter le serveur et toute l'architecture autour a des lycéens
fred - enseignant ile de la réunion
par
Je croyais etre fou jusqu'à tomber sur les liquid neuron networks qui utilise pour iploter un drone que 20000 parametre
...