Analyse avancée avec Spark (Pyspark, SparkR)


Objectif

  • Expliquer ce qu’est Machine Learning et comment les algorithmes et les langages sont utilisés
  • Maîtriser les principes de traitement de Spark et son architecture
  • Développer des traitements distribués avec Spark
  • Connaître les techniques de modélisation distribuées de Spark

Public

Chefs de projet, consultants fonctionnel, responsables marketing, développeurs Big Data, Data scientists

Prérequis

Connaître les méthodes statistiques et de machine learning. Expérience de la programmation, en Python ou en R, pratique de SQL

Programme

  • Découvrir Apache Spark et comprendre ses principes
  • Connaître et utiliser les différentes structures de données
  • Manipuler les données avec Spark SQL
  • Modéliser avec Spark MLLib
  • Présentation de l’utilisation de Spark depuis R
  • Déployer des traitements en production

 

 

Chapitre 1 : Découvrir Apache Spark et comprendre ses principes

Soyez le premier à donner votre avis.

Veuillez, vous connecter pour laisser un commentaire
Add to Wishlist
Obtenir le cours
Conférences: 0
Niveau: Advanced