Pas vraiment d'accord sur le fait que si le nombre de donnees est plus faible on passerait a 90/10 au lieu de 80/20; il est d'usage de passer a 90/10 voir 95/5 lorsqu'on a beaucoup de donnees; lorsque le nombre de donnees est reduit, il vaut mieux descendre a 70/30 car l'espace de donnees a tester gagne en importance (d'autant plus que de toute maniere la validation croisee aidera puisque toutes les donnees seront vues et entrainees). Le choix vient aussi avec l'experience et la nature des donnees, il n'y a pas de formule magique, et ce choix est presque un detail, relatif a tous les autres aspects a prendre en compte. De toute maniere, que ce soit 70/30, 80/20, ou 90/10, ce qui donnera un bon modele sera la quantite et la qualite des donnees, d'ou l'interet de choisir vraiment bien son approche et sur quelle architecture de modele se lancer.