Le processus d’identification des caractéristiques d’un ensemble de données sera le plus précieux lors de la construction d’un modèle. C’est particulièrement utile avec les grands ensembles de données, car utiliser moins de fonctionnalités réduira le temps et la complexité nécessaires à la formation et au test d’un modèle. Le processus commence par mesurer la pertinence de chaque caractéristique d’un ensemble de données pour prédire votre variable cible. Vous choisissez ensuite un sous-ensemble de fonctionnalités qui conduira à un modèle hautes performances.