Description
Data Engineer :
Programmation (Python, webScraping)
Outils avancés (Bash, Git & Github, Tests unitaires)
Big Data Variété (SQL, Mongo DB, ElasticSearch, Neo4j, Hbase)
Big Data Volume (Scala Spark, PySpark, Hadoo & Hive)
Big Data Vitesse (Architecture de streaming, Kafka, Streaming avec Spark)
Data Science (Statistiques, Machine Learning, Data Visualisation)
Déploiement (Docker, API et sécurisation, Flash)
Automatisation et orchestration (Kubernetes, Airflow)
Data Product Management :
Introduction au Data Product Managament (Comprendre le rôle et les missions d'un Data Product Manager, La Data Science en entreprise)
Data Manipulation, option 1 : Fondamentaux python, Manipulation des données avec Pandas, Introduction aux APIs, Data quality. | Option 2 : Introduction aux APIs, Data Quality, Mise en situation professionnelle de data gouvernance)
Acculturation et Data Gouvernance (Acculturation Data, Les différents types et sources de données, RGPD et Éthique)
Chefferie de projet (Gestion de projet et conduite du changement, La méthode Agile, Projet de fin de formation)
Modules optionnels (Introduction à la Business Intelligence, Power, Make, SQL)
Objectifs
Analyser les besoins en matière d'infrastructures de données adaptés au projet d'intelligence artificielle
Piloter le projet de développement de l'infrastructure de données massives
Concevoir les architectures big data valorisant les données
Piloter la maintenance de l'architecture de données massives
Résultats
La formation vise l’obtention de la certification de niveau 7 “Data Engineer” délivrée par F2I, enregistrée au RNCP en date du 27-03-2023 sous le n°RNCP37422.
Le titre RNCP est composé de 4 blocs de compétences à acquérir pour l'obtention de la certification professionnelle. Il est possible de valider un ou plusieurs de ces blocs de compétences.
Chaque bloc peut être acquis individuellement en fonction du séquençage du cursus.
Bloc 1 - Analyser les besoins en matière d'infrastructures de données adaptés au projet d'intelligence artificielle
Bloc 2 - Piloter le projet de développement de l'infrastructure de données massives
Bloc 3 - Concevoir les architectures big data valorisant les données
Bloc 4 - Piloter la maintenance de l'architecture de données massives