Description
La formation donne les bases de l'utilisation de R dans un cadre professionnel, y sont enseignées les bonnes pratiques d'usage de l'environnement de développement intégré Rstudio, l'import, la description, la manipulation et la visualisation graphique des données. Au cours de la formation les participants apprendront à : - Utiliser un environnement de développement intégré - Visualiser des données - Importer des données - Manipuler et traiter les données manquantes - Manipuler et nettoyer des données - Produire des rapports d'analyse - Décrire des données - Réaliser des jointures de données - Manipuler des dates - Manipuler des chaînes de caractères
Objectifs
Cette certification permet à tous les acteurs de l'entreprise d'acquérir les compétences permettant de comprendre et valoriser les données de son organisation ou auxquelles son organisation a accès. Dans une démarche de data science menée par son organisation, l'apprenant est à même de mettre en place un processus d'import, traitement et visualisation des données sous R qui est reproductible avec différents jeux de données. Il exploite et interprète les statistiques produites.
Résultats
Les apprenants sont autonomes sur le logiciel R, ils travaillent de manière reproductible et peuvent générer des rapports de statistiques descriptives. Ils savent L'examen est un travail en autonomie, en temps limité, sur un jeu de données fourni aux participants. L'apprenant est mobilisé sur une série de questions nécessitant d'utiliser les notions abordées pendant la formation (nettoyage de données, manipulation de données, visualisation de données, etc.). Le rendu se fait sous la forme sous la forme d' un rapport reproductible mis en forme selon des spécifications précises.