Description
Mise en place et installation de l'environnement ; python, Anaconda, colab
- Installation du Python sur windows
- Installation de Anaconda et inspection des outils associés
- Utilisation du Google Colab
- Manipulation des notebook jupyter
- Les environnements virtuels avec Anaconda
Module 2: le modèle CRISP-DM
- Présentation de la méthodologie
- Compréhension du métier et des données
- Préparation des données
- Création du modèle de Machine Learning
- Evaluation de la performance
Module 3: La bibliothèque Numpy
- Installation de la bibliothèque
- Création des tableaux numpy
- L¿indexation et le slicing
- Manipulation des tables multidimensionnelles
- La fonction reshape
- L¿indexation d¿un numpy array
- Les opérations mathématiques
- Les fonctions statistiques
- Le produit matricielle
- Numpy arrays vs les listes Python
Module 4: La bibliothèque Pandas
- Création d¿une dataframe et les fonctions de base
- Pandas series vs pandas dataframe
- Importation des données depuis un fichier dans une dataframe (CSV, Excel, Text, sql, JSON, etc)
- Pandas pour l¿inspection des données
- Manipulation des lignes et des colonnes
- Les opérations de filtrage
- La fonction de groupement
- Les données statistiques
- Correction du format et des données
- Les corrélations avec Pandas
Module 5: La bibliothèque Matplotlib
- Démarrer avec la bibliothèque
- Les classes figure et axe
- Création de différents types de graphiques
- Tracer des données de séries chronologiques à l'aide de Matplotlib
- Création de graphiques interactifs
- Personnalisation des visuels et des formats
- Exporter les figures vers des fichers
- Les plots à 3 dimensions
- La méthode subplot
Module 6: SQL in Python
- Les bases de données relationnelles
- Le module sqlite pour la gestion des bases de données
- Se connecter à une base de données avec Python
- Les opérations SQL sur une base de données
- Les opération CRUD sur une table
- Les opérations de jointure et de GroupBy
- Les bases de données NoSQL
- La base de données MongoDB
- Manipulation de MongoDB avec Python
Objectifs
« Python analyse de données » vous permet d¿acquérir les fondements indispensables pour bien maîtriser le langage Python dans le domaine de la Data Science ainsi qu¿une introduction aux différents outils et librairies nécessaires pour collecter, nettoyer, analyser et visualiser vos données d¿entreprise.
A travers notre formation vous allez :
- Être capable d¿installer et mettre en place un environnement de développement en Data Science et utiliser le notebook soit à travers l¿outils Anaconda ou Google Colab pour exploiter python en cloud
- Maîtriser les bibliothèques spécialisées en data science, data mining et data visualisation pour un meilleur traitement de vos données, ces librairies incluent la bibliothèque :
-
-
- Numpy pour les calculs mathématiques complexes sur des donnéesmassives et multidimensionnelles,
- Pandas pour manipuler les données à analyser sous forme de tableaux qu¿on appelle des dataframes
- Matplotlib pour la visualisation des données via la création de plots et de figures pour résumer et investiguer vos données en détails.
- Apprendre à maitriser le langage SQL avec python pour bien manipuler les bases et les tables de données et vous connecter directement à une base de données NoSQL
- Avoir la possibilité de travailler sur les techniques de scrapping pour collecter des données cibles depuis une ressource sur le web et bien préparer vos données avant de les soumettre à un modèle
D¿apprentissage automatique
- Apprendre à faire de l¿ingénierie de données, ce qu¿on appelle aussi facture engineering pour extraire des caractéristiques, des données brutes initiales et générer de nouveaux attributs à soumettre à nos modèles de Machine Learning.
Résultats
Projet réel d¿exploration et d¿analyse de données en se basant sur des cas réels des flux : Logistique, Vente, Production, Finance, RH