Description
Mathématiques appliquées à l'analyse de données et l'intelligence artificielle. Développement informatique pour l'apprentissage automatique par la machine (machine learning) et l'intelligence artificielle avec les langages C, C++, Python, R, SAS. Exploitation des bases de données relationnelles avec SQL. Exploitation des réservoirs de données (data lake) avec des données structurées et non structurées, notamment sur l'architecture Hadoop & Spark. Exploitation de l'informatique dans les nuages (cloud computing) pour les systèmes distribués. Contextes juridique et éthique du traitement des données en France, Europe (RGPD) et Etats-Unis. Gestion de projets informatiques complexe.
Objectifs
- Analyser, concevoir et développer des modélisations mathématiques pour enrichir les systèmes d'aide à la décision
- Concevoir et déployer des infrastructures informatiques distribuées pour stocker et traiter des données massives.
- Détecter et évaluer l'état de l'art de l'intelligence artificielle pour développer des projets innovants
- Conduire des projets complexes en intégrant les contraintes légales et les valeurs d'éthique pour diffuser les bonnes pratiques dans les organisations
Résultats
Le métier visé est celui d'expert (« Data Scientist » en Anglais) dans le domaine des Sciences des Données. Ces dernières peuvent être de toute taille, jusqu'à la qualification de « massives » (« Big Data » en Anglais). Ces données partagent une complexité nécessitant l'utilisation de techniques mathématiques avancées avec leurs implémentations informatiques correspondantes. Ces implémentations sont localisées sur des infrastructures informatiques locales et/ou dans les nuages (« cloud computing » en Anglais). Le Data Scientist conçoit des indicateurs pour l'aide à la décision à partir de sources de données multiples et dispersées, mises en place par des experts en ingénierie des données (« Data Engineers » en Anglais). Ces indicateurs sont construits à l'aide d'analyses mathématiques et de prototypes d'implémentations informatiques. Ces prototypes sont ensuite industrialisés à l'échelle de l'organisation par les Data Engineers.