0 votes
par dans Séquence 5
Est-ce qu'il suffit de faire une analyse pour évaluer à cb d'écarts-types se situent les données aberrantes, et définir un seuil pour l'exclusion ?
Ou y a t'il des méthodes plus rigoureuses ?

1 Réponse

0 votes
par Vétéran du GPU 🐋 (20.4k points)
sélectionné par
 
Meilleure réponse
Cela dépend énormément de la tâche, des données et du modèle. La méthode que vous mentionnez est un exemple. On peut aussi utiliser des méthodes graphiques avec des boxplot par exemple. On peut même ignorer ces données aberrantes si le dataset est assez grand (vraiment grand).
par
vraiment grand ? en ordre de grandeur ça donne quoi ?
par Vétéran du GPU 🐋 (20.4k points)
Encore une fois cela dépend de la complexité de la tâche mais généralement je dirais au minimum de l’ordre de la centaines de millier voir du million.
...