Description
Aperçu de l'analyse des données et du pipeline de données
- Cas d'utilisation de l'analyse de données
- Utilisation du pipeline de données pour l'analyse
Module 1 : Utilisation d'Amazon Redshift dans le pipeline d'analyse de données
- Pourquoi Amazon Redshift pour l'entreposage de données ?
- Présentation d'Amazon Redshift
Module 2 : Introduction à Amazon Redshift
- Architecture d'Amazon Redshift
- Démo interactive 1 : Visite de la console Amazon Redshift
- Caractéristiques d'Amazon Redshift
- Laboratoire pratique 1 : charger et interroger des données dans un cluster Amazon Redshift
Module 3 : Ingestion et stockage
- Ingestion
- Démo interactive 2 : connecter votre cluster Amazon Redshift à l'aide d'un carnet Jupyter avec Data API
- Distribution et stockage des données
- Démo interactive 3 : analyse de données semi-structurées à l'aide du type de données SUPER
- Interrogation de données dans Amazon Redshift
- Laboratoire pratique 2 : analyse de données à l'aide d'Amazon Redshift Spectrum
Module 4 : Traitement et optimisation des données
- Transformation des données
- Interrogation avancée
- Labo pratique 3 : Transformation et interrogation de données dans Amazon Redshift
- Gestion des ressources
- Démo interactive 4 : application de la gestion des charges de travail mixtes sur Amazon Redshift
- Automatisation et optimisation
- Démo interactive 5 : Redimensionnement du cluster Amazon Redshift du cluster dc2.large au cluster ra3.xlplus
Module 5 : Sécurité et surveillance des clusters Amazon Redshift
- Sécurisation du cluster Amazon Redshift
- Surveillance et dépannage des clusters Amazon Redshift
Module 6 : Conception de solutions analytiques d'entrepôt de données
- Examen des cas d'utilisation des entrepôts de données
- Activité : Conception d'un workflow d'analyse d'entrepôt de données
Développement d'architectures de données modernes sur AWS
Architectures de données modernes
Objectifs
Validez de nouvelles COMPETENCES
A l'issue de la formation, les participants seront capables de :
- Comparer les caractéristiques et les avantages des entrepôts de données, des lacs de données et des architectures de données modernes.
- Concevoir et mettre en ouvre une solution d'analyse d'entrepôt de données
- Identifier et appliquer les techniques appropriées, notamment la compression, pour optimiser le stockage des données
- Sélectionner et déployer les options appropriées pour ingérer, transformer et stocker les données.
- Définir les types d'instances et de nouds, les clusters, la mise à l'échelle automatique et la topologie réseau appropriés pour un cas d'utilisation particulier.
- Examiner comment le stockage et le traitement des données affectent les mécanismes d'analyse et de visualisation nécessaires pour obtenir des informations commerciales exploitables.
- Identifier comment sécuriser les données au repos et en transit
- Identifier et résoudre les problèmes en surveillant les charges de travail analytiques
- Expliquer les meilleures pratiques de gestion des coûts
Résultats
Les interactions avec notre instructeur et vos pairs en classe ainsi que la réalisation de labs pratiques constituent un atout essentiel à la progression pédagogique et l'acquisition de compétences.
Le contenu officiel de notre formation permet de préparer au passage de l'examen de certification AWS, mais il doit être complété par le suivi d'autres modules "Building Data Lakes" et "Building Batch Data Analytics Solutions" ou par une expérience équivalente.
Un certificat de réalisation est remis en fin de formation.