Description
Depuis les cinq dernières années, les projets Data Science et d'intelligence artificielle connaissent une forte croissance dans des domaines très variés, tels que l'industrie pétrolière, la téléphonie, la distribution, la banque, la finance et les services. Les récentes évolutions technologiques permettent de faire évoluer ces projets vers la mise en place de véritables solutions d'intelligence artificielle. La réalisation de ces projets nécessite de former des équipes de « Data-Engineers » pour lesquelles il est nécessaire de conjuguer l'acquisition des compétences techniques et méthodologiques, l'expérience des cas concrets et surtout, un parcours d'apprentissage jalonné.
Les principales compétences visées par cette certification sont celles nécessaires à la mise en oeuvre des activités suivantes :
Auditer la qualité des donnéesPréparer, nettoyer et programmer le recodage des donnéesProgrammer les indicateurs nécessaires au fonctionnement des algorithmes
Objectif
- Maîtriser la statistique descriptive monovariée
- Savoir utiliser la librairie Numpy en langage Python
- Savoir utiliser la librairie Pandas en langage Python
- Savoir réaliser un audit de qualité de données
- Connaitre les principales règles de RGPD
- Maîtriser la statistique bivariée
- Savoir tester et mesurer la paramétricité des données
- Savoir programmer en Python
- Savoir programmer le recodage des données pour les rendre paramétriques
- Savoir caractériser et traiter les valeurs manquantes
- Savoir identifier et traiter les valeurs aberrantes
- Maitriser le fonctionnement des bases de données SQL
- Pouvoir créer des jeux de données de test
- Savoir mettre en oeuvre une stratégie inférentielle
- Maîtriser les bases de la statistique multivariée
- Être capable de mettre en oeuvre du machine-learning non supervisé
- Être capable de mettre en oeuvre du machine-learning supervisé
- Savoir utiliser les algorithmes du domaine public pour créer un modèle
Niveau
Sans équivalence de niveau
Date de validité
20/01/2026
Domains
- analyse données
- architecture système information
- Langage Python
- Data Warehouse
- langage SQL
NSF
- Informatique, traitement de l'information, réseaux de transmission des données
- Programmation, mise en place de logiciels
GFE
Rome
Nom légal | Rôle |
---|