Dans cet article nous vous apprenons davantage sur les différents rôles des data scientist, la gestion des données et les domaines connexes tels que l’apprentissage automatique, l’apprentissage profond, l’IA, les statistiques, l’IdO, la recherche opérationnelle et les mathématiques appliquées
D’après Ajit Jaokar il a émis qu’il y a plusieurs types de data Scientist avec différents rôles : Analytique et le constructeur
Le data scientist analytique, peut être un expert en conception expérimentale, en prévision, en modélisation, en inférence statistique ou d’autres choses généralement enseignées dans les départements de statistiques. Chez Google, les data scientists de type A sont connus sous les noms divers de statisticien, analyste quantitatif, analyste en ingénierie d’aide à la décision ou data scientist,
Data Scientist constructeur : partage certaines connaissances statistiques avec le DS analytique, mais il est aussi un très bon codeur et peut être un ingénieur logiciel de formation. Le scientifique de données de type B est principalement intéressé par l’utilisation des données “en production”
Si le rôle du data scientist est généralement dépeint comme un codeur expérimenté en R, Python, SQL, Hadoop et statistiques, ce n’est que la partie émergée de l’iceberg, rendue populaire par les camps de données axés sur l’enseignement de certains éléments de la science des données. Les domaines sont aussi variés que la bioinformatique, l’informatique, les simulations et le contrôle de qualité, la finance computationnelle, l’épidémiologie, le génie industriel et même la théorie des nombres.
Le machine learning et le deep learning
Le machine learning est est un ensemble d’algorithmes qui s’entraînent sur un ensemble de données pour faire des prédictions ou prendre des mesures afin d’optimiser certains systèmes. Par exemple, les algorithmes de classification supervisée sont utilisés pour classer les clients potentiels en bons ou mauvais prospects. Les techniques utilisées : naïveté de Bayes, SVM, réseaux neuronaux, ensembles, règles d’association, arbres de décision, régression logistique, ou une combinaison de plusieurs d’entre elles.
Le deep learning est un type de machine learning Il implique un type particulier de modèle mathématique qui peut être considéré comme une composition de blocs simples (composition de fonctions) d’un certain type, et où certains de ces blocs peuvent être ajustés pour mieux prédire le résultat final.
La data science et le machine learning
Le machine learning et les stats font partie de la data science le mot learning : signifie que les algorithmes dépendent de certaines données, utilisées comme un ensemble d’apprentissage, pour affiner certains paramètres de modèles ou d’algorithmes. Cela englobe de nombreuses techniques telles que la régression, le modèle de Bayes naïf ou le clustering supervisé. Mais toutes les techniques ne rentrent pas dans cette catégorie. La principale différence réside dans le fait que la science des données couvre tout le spectre du traitement des données, et pas seulement les aspects algorithmiques ou statistiques.
Si vous souhaitez acquérir toutes les compétences d’un data Scientist Analytique ou constructeur participez à notre Bootcamp Data Full Stack
Merci pour votre lecture ! Si vous souhaitez lire nos prochains articles autour de la Data Science
” data-gt-translate-attributes=”[{“attribute”:”data-cmtooltip”, “format”:”html”}]”>Data Science
, vous pouvez nous suivre sur Facebook, LinkedIn et Twitter pour être notifié lorsqu’un nouvel article est publié !