Chargement...
Aucun résultat.
Partager sur votre flux LinkedIn Twitter Facebook

Mettez en pratique vos compétences dans la console Google Cloud

08

Traitement des données sans serveur avec Dataflow : développer des pipelines

08

Traitement des données sans serveur avec Dataflow : développer des pipelines

21 heures Avancé

Dans ce deuxième volet de la série de cours sur Dataflow, nous allons nous intéresser de plus près au développement de pipelines à l'aide du SDK Beam. Nous allons commencer par passer en revue les concepts d'Apache Beam. Nous allons ensuite parler du traitement des données par flux à l'aide de fenêtres, de filigranes et de déclencheurs. Nous passerons ensuite aux options de sources et de récepteurs dans vos pipelines, aux schémas pour présenter vos données structurées, et nous verrons comment effectuer des transformations avec état à l'aide des API State et Timer. Nous aborderons ensuite les bonnes pratiques qui vous aideront à maximiser les performances de vos pipelines. Vers la fin du cours, nous présentons le langage SQL et les DataFrames pour représenter votre logique métier dans Beam, et nous expliquons comment développer des pipelines de manière itérative à l'aide des notebooks Beam.

Gagnez un badge aujourd'hui !

info
Informations sur le cours
Objectifs
  • Passer en revue les principaux concepts d'Apache Beam abordés dans le cours "Data Engineering on Google Cloud"
  • Passer en revue les concepts de base du traitement par flux abordés dans le cours "Ingénierie des données" (PCollections illimitées, fenêtres, filigranes et déclencheurs)
  • Sélectionnez et ajustez les E/S de votre choix pour votre pipeline Dataflow
  • Utilisez des schémas pour simplifier votre code Beam et améliorer les performances de votre pipeline
  • Implémenter les bonnes pratiques pour les pipelines Dataflow
  • Développer un pipeline Beam à l'aide de SQL et de DataFrames
Prérequis

Traitement des données sans serveur avec Dataflow : principes de base

Cible
Ingénieurs de données, analystes de données et data scientists souhaitant développer des compétences en ingénierie des données
Langues disponibles
English, español (Latinoamérica), 日本語, português (Brasil) et français
Que faire après avoir terminé ce cours ?
Après avoir terminé ce cours, vous pouvez consulter des contenus supplémentaires de votre parcours de formation ou parcourir le catalogue de formations.
Quels badges pouvez-vous gagner ?
Lorsque vous terminez un cours, vous obtenez un badge de réussite. Vos badges s'affichent sur votre profil, et vous pouvez les partager sur les réseaux sociaux.
Vous souhaitez suivre ce cours à la demande avec l'un de nos partenaires ?
Consultez les contenus Google Cloud disponibles sur Coursera et Pluralsight.
Vous préférez suivre un cours animé par un formateur ?

La puissance des ateliers challenge

Vous pouvez désormais obtenir un badge de compétence sans avoir à suivre l'intégralité du cours. Si vous êtes sûr de vos compétences, passez directement à l'atelier challenge.

Aperçu