Pour la première partie il peut aussi être intéressant de regarder les coefficients de corrélation entre les variables (matrice de confusion), parfois quand deux variables indépendantes sont fortement corrélées ça peut aider le modèle d'en supprimer une. Vous pouvez aussi tenter d'utiliser PCA avant la régression linéaire.
Les variables n'ayant pas les mêmes unités et avec de grand écarts de valeur, oui il faut normaliser/standardiser.
r2_score(y_test, y_test) = 1.0 : je pense qu'il y a un problème, il faut comparer avec y_pred_test