08 Traitement des données sans serveur avec Dataflow : développer des pipelines

08

Traitement des données sans serveur avec Dataflow : développer des pipelines

Name: Traitement des données sans serveur avec Dataflow : développer des pipelines
Rating: 3.22 (9 reviews)

21 heures Avancé

Dans ce deuxième volet de la série de cours sur Dataflow, nous allons nous intéresser de plus près au développement de pipelines à l'aide du SDK Beam. Nous allons commencer par passer en revue les concepts d'Apache Beam. Nous allons ensuite parler du traitement des données par flux à l'aide de fenêtres, de filigranes et de déclencheurs. Nous passerons ensuite aux options de sources et de récepteurs dans vos pipelines, aux schémas pour présenter vos données structurées, et nous verrons comment effectuer des transformations avec état à l'aide des API State et Timer. Nous aborderons ensuite les bonnes pratiques qui vous aideront à maximiser les performances de vos pipelines. Vers la fin du cours, nous présentons le langage SQL et les DataFrames pour représenter votre logique métier dans Beam, et nous expliquons comment développer des pipelines de manière itérative à l'aide des notebooks Beam.

Gagnez un badge aujourd'hui !

info

Informations sur le cours

Objectifs

Passer en revue les principaux concepts d'Apache Beam abordés dans le cours "Data Engineering on Google Cloud"
Passer en revue les concepts de base du traitement par flux abordés dans le cours "Ingénierie des données" (PCollections illimitées, fenêtres, filigranes et déclencheurs)
Sélectionnez et ajustez les E/S de votre choix pour votre pipeline Dataflow
Utilisez des schémas pour simplifier votre code Beam et améliorer les performances de votre pipeline
Implémenter les bonnes pratiques pour les pipelines Dataflow
Développer un pipeline Beam à l'aide de SQL et de DataFrames

Prérequis

Traitement des données sans serveur avec Dataflow : principes de base

Cible

Ingénieurs de données, analystes de données et data scientists souhaitant développer des compétences en ingénierie des données

Langues disponibles

English, español (Latinoamérica), 日本語, português (Brasil) et français

Que faire après avoir terminé ce cours ?

Après avoir terminé ce cours, vous pouvez consulter des contenus supplémentaires de votre parcours de formation ou parcourir le catalogue de formations.

Quels badges pouvez-vous gagner ?

Lorsque vous terminez un cours, vous obtenez un badge de réussite. Vos badges s'affichent sur votre profil, et vous pouvez les partager sur les réseaux sociaux.

Vous souhaitez suivre ce cours à la demande avec l'un de nos partenaires ?

Consultez les contenus Google Cloud disponibles sur Coursera et Pluralsight.

Vous préférez suivre un cours animé par un formateur ?

Consultez le calendrier des formations en salle

08

Traitement des données sans serveur avec Dataflow : développer des pipelines

08

Traitement des données sans serveur avec Dataflow : développer des pipelines

La puissance des ateliers challenge