Formation transverse >

Le Big Data concrètement

Ce stage vous permettra d’avoir une overview concrète d’un système Big Data. Vous découvrirez les enjeux et les apports du Big Data ainsi que les technologies pour le mettre en œuvre. Vous apprendrez à intégrer des volumétries massives de données structurées et non structurées, puis à les analyser grâce à des modèles statistiques et des dashboards dynamiques.

Contactez-nous pour réserver
Référence DT01
Format Stage pratique en visio
Audience Chefs de projet, Ingénieurs BI, Data scientists, Architectes IT ...
Niveau Tous niveaux
Durée 5 jours (5 x 6 heures)
Prix 2200 € HT
Prochaines sessions    06-10 juillet 2020
24-28 Août 2020
21-25 septembre 2020

Objectifs pédagogiques

Comprendre le fonctionnement des architectures distribuées tel que Hadoop.
Comprendre les concepts et l'apport du Big Data par rapport aux enjeux métiers.
Comprendre l'écosystème technologique nécessaire pour réaliser un projet Big Data.
Acquérir les compétences techniques pour gérer des flux de données complexes, non structurés et massifs.
Implémenter des modèles d'analyses statistiques pour répondre aux besoins métiers.
Appréhender les outils de Data Visualisation pour restituer des analyses dynamiques.

Méthodes pédagogiques

Mise en pratique des connaissances théoriques en utilisant des jeux de données variés.

Programme de formation

Introduction

-   Origines et définition du Big Data.
-   Les chiffres clés du marché dans le monde et en France.
-   Les enjeux du Big Data : ROI, organisation, confidentialité des données.
-   Un exemple d'architecture Big Data.

Les technologies Big Data

-   Les modes de stockage (Fichiers, relationnels, NoSQL, in-memory).
-   Retour sur les bases non-distribuées relationnelles.
-   Les bases NoSQL.
-   Les bases MPP.
-   Les bases New SQL.
-   Les systèmes de stockage fichier.
-   Les architectures Hybride.
-   Focus sur Hadoop (HFS, Map Reduce, Haute disponibilité, distributions).

Administrer et interagir avec une plateforme Big Data Hadoop

-   Administrer un cluster Hadoop (Cloudera manager, AWS,Ambari)
-   Zoom sur zookeeper.
-   Interagir avec l'écosystème Hadoop via HUE, l’interface destinée aux utilisateurs.
-   Alimenter un cluster Hadoop (Sqoop, Flume,Kafka)
-   Manipuler et analyser les données sous Hadoop (Hive, Pig, Impala, Tez, HBASE)
Exercice : Manipulation de tous les modules d’Hadoop en utilisant des jeux de données variées.

Gérer des flux d'alimentation Big Data

-   Les enjeux de la data quality.
-   Les données internes.
-   Les données externes (Data sharing, open data, réseaux sociaux).
-   Les ETL, positionnements et intérêts.
-   Vue d’ensemble des technologies.
-   Découverte de talend Big Data et utilisation de cet outil avec une plateforme Hadoop.
Exercice : Alimentation d’une plateforme Hadoop grâce à l’ETL Talend (récupération de tweets).

L’analyse de données

-   Découverte de Spark (Spark ML, Spark SQL, Spark GraphX, Spark Streaming).
-   Principe des objets distribués.
-   Présentation du Machine Learning (enjeux, uses cases, méthodes).
-   Réalisation d’un scoring d’achat avec Spark.
-   L’explicabilité des IA (présentation des méthodes d’XAI).
Exercice : Réalisation d’exercices et d’un score d’achat pour une base de prospects.

La Data Viz

-   Définir le besoin de la Data Visualisation.
-   Analyse et visualisation des données.
-   Peut concerner tous les types de données dans la DataViz ?
-   Les outils DataViz du marché.
Exercice : Utilisation de Power Bi et Tableau Software pour réaliser des dashboard dynamiques.

Bilan



Contactez-nous pour réserver



Stratégie data

Enjeux politiques, organisationnels, techniques...

Voir nos formations >

Data science

Machine learning, Deep learning, Python, Spark...

Voir nos formations >

Technologies data

Hadoop, AWS, ETL, Kafka ...

Voir nos formations >

Data Vizualisation

Stratégie data viz, Dashboard, Power bi, Tableau...

Voir nos formations >

Une expertise garantie

Vous êtes formés par des experts en poste : data scientists, architecte data, chefs d'entreprises.

Des compétences valorisées

Apprenez et maitrisez des compétences recherchées, directement applicables en entreprise.

100% en direct et en ligne

Accessible partout, depuis vos locaux ou depuis chez vous, avec des horaires flexibles et adaptables.