Oui aléatoirement distribution uniforme ou gaussienne. Les bornes de la distribution sont établis selon des algos : Xavier ou Kaming.
C'est un domaine de recherche largement documenté. Aujourd'hui pour un ingénieur Deep Learning l'initialisation est quelquechose de complètement automatique (dans TF, keras, pytorch, ...) auquel on ne pense pas