Passer au contenu principal
RNCP34262

Expert en sciences des données

Page France Compétence
Description Le métier visé est celui d'expert (Data Scientist en anglais) dans le domaine des sciences des données. Ces dernières peuvent être de toute taille, jusqu'à la qualification de « massives » (Big Data en anglais). Ces données partagent une complexité nécessitant l'utilisation de techniques mathématiques avancées avec leurs implémentations informatiques correspondantes. Ces implémentations sont localisées sur des infrastructures informatiques locales et/ou dans les nuages (cloud computing en anglais).
Objectif

Analyser, concevoir et développer des modélisations mathématiques pour enrichir les systèmes d'aide à la décision

  • Explorer, décrire et interpréter des données dans leur aspect multidimensionnel.
  • Produire des traitements de données simples en utilisant les concepts de la statistique descriptive, en vue de présenter les résultats obtenus à l'aide de tableaux, de graphiques et d'indicateurs numériques
  • Mesurer la liaison entre deux variables
  • Choisir les outils et déterminer leurs limites afin de communiquer les conclusions et leur interprétation
  • Produire des études statistiques en mettant en oeuvre les techniques d'apprentissage automatique par la machine (machine learning) pour des données avec ou sans caractères temporels

Concevoir et déployer des infrastructures informatiques distribuées pour stocker et traiter des données massives

  • Participer, avec des Data Engineers, à la rédaction d'un cahier des charges technique pour la conception et la mise en place d'une solution d'analyse des données volumineuses
  • Exploiter un système distribué d'entrepôt de données structurées et non structurées, notamment via Apache Hadoop & Apache Spark
  • Contribuer à la définition de l'architecture de stockage de données, en guidant les Data Engineers à prendre en compte les besoins de traitements algorithmiques de l'intelligence artificielle
  • Concevoir et implémenter des algorithmes pour le traitement des grands volumes de données dans le respect des bonnes pratiques de l'ingénierie logicielle (incluant les approches SQL et NoSQL)
  • Exploiter des infrastructures informatiques distribuées en mode cloud sur la plateforme Amazon AWS pour y déporter des traitements algorithmiques de l'intelligence artificielle (préparation à la certification Amazon AWS Solution Architect - Associate)


Détecter et évaluer l'état de l'art de l'intelligence artificielle pour développer des projets innovants

  • Cibler et faire ressortir des modèles linéaires, non-linéaires, généralisés ou mixtes et construire des modèles complexes ou novateurs de prévisions en utilisant les techniques de modélisation, estimations, tests et diagnostics. Identifier les variables ou composantes importantes d'un modèle afin de tester des hypothèses en utilisant les techniques de modélisation, estimations, tests et diagnostics
  • Modéliser des données observées, les interpréter pour en faire de la prédiction en utilisant des outils appropriés et en tenant compte de leur nature aléatoire
  • Déterminer et analyser des données complexes en utilisant les méthodes de fouille et de visualisation de séries temporelles et fonctionnelles, de textes (clustering, classification), de réseaux (statique ou dynamiques) ou d'images
  • Intégrer les technologies complémentaires (web sémantique, modélisation multi-agents) pour l'hybridation des approches intelligence artificielle connectivistes (réseaux de neurones) et symboliques (moteurs de raisonnement)
  • Opérationnaliser une publication scientifique en implémentation informatique pour réaliser un prototype innovant. B3C6 - Utiliser l'écosystème des solutions SAS pour la modélisation prédictive (préparation à la certification SAS® Certified Predictive Modeler Using SAS® Enterprise Miner )

 

Conduire des projets complexes en intégrant les contraintes légales et les valeurs d'éthique pour diffuser les bonnes pratiques dans les organisations

  • Intégrer les philosophies, problématiques et contraintes des réglementations françaises et européennes (CNIL, RGPD) sur la protection des données dans un projet Data Science
  • Prendre la mesure de l'environnement international sur la réglementation de la protection des données, notamment aux Etats-Unis
  • Intégrer les deux grandes familles de pratiques de gestion de projets informatiques complexes (en cascade et en agilité) ainsi que les approches du « juste-à-temps ».
Niveau 7 - Savoirs hautement spécialisés
Date de validité 10/10/2024
Domains
  • développement personnel et professionnel
  • Informatique et systèmes d'information
  • Statistique
  • Mathématiques appliquées
NSF
  • Mathématiques de l'informatique, mathématiques financières, statistique de la santé
GFE
  • Gestion et traitement de l'information
Rome
  • Études et développement informatique
  • Études et prospectives socio-économiques
  • Expertise et support technique en systèmes d'information
  • Conseil et maîtrise d'ouvrage en systèmes d'information
  • Création en arts plastiques
  • Études et prospectives socio-économiques
  • Études et développement informatique
  • Conseil et maîtrise d'ouvrage en systèmes d'information
  • Expertise et support technique en systèmes d'information
Nom légal Rôle
ECOLE NATIONALE SUPERIEURE D'ARTS ET METIERS Habilitation pour former et organiser l'évaluation
AMTALENTS Habilitation pour former