Par expérience du domaine et des données analysées, et en faisant un peu de bibliographie, on a une idée de la complexité du pattern recherché et des réseaux à utiliser. Mais sinon par expérience. Souvent on prend des modèles qui ont déjà fait leurs preuves sur d'autres tâches (qu'on travaille avec des CNNs, des transformers, ou n'importe quoi d'autre)