Les CNN tirent leur puissance de la structure des images, càd des pixels proches forment des patterns intéressants à analyser. Ce n'est pas forcément vrai de tous les types de données, on ne retrouve pas toujours cette notion de localité. Si on la retrouve (par exemple dans l'audio qui est un signal temporel), alors les CNN sont une option, parfois très puissantes.