Traitement des Big Data (Hive, Pig, Spark SQL, Oozie)


Objectif

  • Comprendre les fondamentaux du Big data
  • Identifier la plateforme technologique et les outils de l’écosystème Hadoop sur lesquels s’appuyer en fonction des cas d’usage?
  • Maîtriser l’utilisation de l’écosystème HADOOP : HDFS, Hive, Pig

Public

Chefs de projet, consultants fonctionnel, responsables marketing, développeurs Big Data, ingénieurs d’études, Consultant BI, concepteur, architecte, manager, directeur de projet.

Prérequis

Connaissances de base des SGBDR, du langage  SQL. Connaissances de base du décisionnel

Programme

  • Stockage des données dans Hive Data Warehouse
  • Nettoyage de données
  • Apache Parquet,
  • Apache Orc,
  • TEXTFILE
  • Construction de la Big table

 

 

Chapitre 1 : Stockage des données dans Hive Data Warehouse

Soyez le premier à donner votre avis.

Veuillez, vous connecter pour laisser un commentaire