Description
Depuis les cinq dernières années, les projets Data Science et d'intelligence artificielle connaissent une forte croissance dans des domaines très variés, tels que l'industrie pétrolière, la téléphonie, la distribution, la banque, la finance et les services. Les récentes évolutions technologiques permettent de faire évoluer ces projets vers la mise en place de véritables solutions d'intelligence artificielle. La réalisation de ces projets nécessite de former des équipes de « Data-Engineers » et de « Data Scientists » pour lesquelles il est nécessaire de conjuguer l'acquisition des compétences techniques et méthodologiques, l'expérience des cas concrets et surtout, un parcours d'apprentissage jalonné.
Les principales compétences visées par cette certification sont celles nécessaires à la mise en oeuvre des activités suivantes :
Expliquer les bénéfices de la DataScience à un interlocuteur métier et identifier les problématiques qui peuvent ou doivent être résolues grâce à la DataScienceIdentifier, évaluer la faisabilité et la création de valeur des problématiques client en se basant sur les besoins métiers et les données disponiblesAuditer les sources de données disponibles, leur qualité et leur profondeur, leur caractère éthique ou non-éthique, leur potentiel en rapport avec le problème à résoudreIdentifier et spécifier grâce à une analyse monovariée descriptive toutes les transformations et recodages nécessaires sur les données ainsi que la création de nouveaux indicateurs nécessaires pour la réalisation du projet
Objectif
- Connaitre les bénéfices et les impacts de la DataScience
- Être capable d'identifier les sujets relavant de la DataScience
- Savoir scénariser des implémentations possibles de cas d'usage relevant de la DataScience
- Connaître les problématiques typiques en DataScience dans différents secteurs d'activité ou fonctions
- Savoir évaluer la complexité d'une problématique de DataScience
- Être capable d'évaluer la faisabilité d'un projet en fonction de sa complexité et des données disponibles
- Savoir identifier les algorithmes utilisables pour répondre aux besoins de la problématique du client
- Être capable de reconnaître le caractère éthique ou non éthique des données disponibles
- Savoir tester si un jeu de données est paramétrique ou non
- Pouvoir identifier les données atypiques et/ou aberrantes
- Être capable d'identifier et de traiter des données manquantes
- Maîtriser la Statistique descriptive monovariée
- Maîtriser le recodage des données non paramétriques
- Maîtriser les recodages non supervisés
- Maîtriser les recodages supervisés
- Savoir estimer l'impact du recodage sur la précision du modèle
- Savoir utiliser les algorithmes de deep learning et de Natural Language Processing (ou text mining) pour créer des métadonnées à partir de données structurées
Niveau
Sans équivalence de niveau
Date de validité
20/01/2026
Domains
- analyse données
- architecture système information
- Langage Python
- Data Warehouse
- algorithme
NSF
- Informatique, traitement de l'information, réseaux de transmission des données
- Programmation, mise en place de logiciels
GFE
Rome
Nom légal | Rôle |
---|