Dans cet atelier, vous allez découvrir comment créer et exécuter un workflow SQL dans Dataform pour charger des données dans BigQuery.
Objectifs de la formation
Créer un dépôt Dataform
Créer et initialiser un espace de travail de développement Dataform
Créer et exécuter un workflow SQL
Afficher les journaux d'exécution dans Dataform
Prérequis
Pour chaque atelier, nous vous attribuons un nouveau projet Google Cloud et un nouvel ensemble de ressources pour une durée déterminée, sans frais.
Connectez-vous à Qwiklabs dans une fenêtre de navigation privée.
Vérifiez le temps imparti pour l'atelier (par exemple : 01:15:00) : vous devez pouvoir le terminer dans ce délai.
Une fois l'atelier lancé, vous ne pouvez pas le mettre en pause. Si nécessaire, vous pourrez le redémarrer, mais vous devrez tout reprendre depuis le début.
Lorsque vous êtes prêt, cliquez sur Démarrer l'atelier.
Notez vos identifiants pour l'atelier (Nom d'utilisateur et Mot de passe). Ils vous serviront à vous connecter à Google Cloud Console.
Cliquez sur Ouvrir la console Google.
Cliquez sur Utiliser un autre compte, puis copiez-collez les identifiants de cet atelier lorsque vous y êtes invité.
Si vous utilisez d'autres identifiants, des messages d'erreur s'afficheront ou des frais seront appliqués.
Acceptez les conditions d'utilisation et ignorez la page concernant les ressources de récupération des données.
Tâche 1 : Créer un dépôt Dataform
Dans la console, développez le menu de navigation, puis sélectionnez BigQuery > Dataform.
Cliquez sur CRÉER UN DÉPÔT.
Sur la page CRÉER UN DÉPÔT, procédez comme suit :
Dans le champ ID du dépôt, saisissez quickstart-repository.
Dans la liste Région, sélectionnez .
Cliquez sur CRÉER.
Une fois que le dépôt est créé, le compte de service Dataform s'affiche. Veuillez le copier pour pouvoir l'utiliser par la suite afin d'attribuer les autorisations nécessaires.
Cliquez sur Accéder aux dépôts.
Remarque : Si un message d'erreur de type "autorisation refusée" lié à la requête API s'affiche, attendez quelques minutes et essayez de créer le dépôt une nouvelle fois.
Tester la tâche terminée
Cliquez sur Vérifier ma progression pour valider l'objectif.
Créer un dépôt Dataform
Tâche 2 : Créer et initialiser un espace de travail de développement Dataform
Sur la page Dataform, cliquez sur le dépôt quickstart-repository que vous venez de créer.
Cliquez sur CRÉER UN ESPACE DE TRAVAIL DE DÉVELOPPEMENT.
Dans la fenêtre Créer un espace de travail de développement, procédez comme suit :
Dans le champ ID de l'espace de travail, saisissez quickstart-workspace.
Cliquez sur CRÉER.
Une fois qu'il est créé, cliquez sur l'espace de travail de développement quickstart-workspace.
Cliquez sur INITIALISER L'ESPACE DE TRAVAIL.
Tester la tâche terminée
Cliquez sur Vérifier ma progression pour valider l'objectif.
Créer un espace de travail Dataform
Tâche 3 : Créer un fichier SQLX pour définir une vue
Dans cette section, vous allez définir une vue que vous utiliserez ultérieurement comme source de données pour une table.
Dans le volet Fichiers, à côté de definitions, cliquez sur le menu Plus.
Cliquez sur Créer un fichier.
Dans le volet Créer un fichier, procédez comme suit :
Dans le champ Ajouter un chemin d'accès au fichier, saisissez definitions/quickstart-source.sqlx.
Cliquez sur CRÉER UN FICHIER.
Définir une vue
Dans le volet Fichiers, développez le dossier definitions.
Cliquez sur quickstart-source.sqlx.
Dans le fichier, saisissez l'extrait de code suivant :
config {
type: "view"
}
SELECT
"apples" AS fruit,
2 AS count
UNION ALL
SELECT
"oranges" AS fruit,
5 AS count
UNION ALL
SELECT
"pears" AS fruit,
1 AS count
UNION ALL
SELECT
"bananas" AS fruit,
0 AS count
Tâche 4 : Créer un fichier SQLX pour définir une table
Dans les sections suivantes, vous allez définir le type de la table dans un fichier SQLX, puis écrire une instruction SELECT pour définir la structure de la table dans ce même fichier.
Dans le volet Fichiers, à côté de definitions, cliquez sur le menu Plus, puis sélectionnez Créer un fichier.
Dans le champ Ajouter un chemin d'accès au fichier, saisissez definitions/quickstart-table.sqlx.
Cliquez sur CRÉER UN FICHIER.
Définir le type de la table, sa structure et ses dépendances
Dans le volet Fichiers, développez le répertoire definitions.
Sélectionnez quickstart-table.sqlx, puis spécifiez le type "table" et cette instruction SELECT :
config {
type: "table"
}
SELECT
fruit,
SUM(count) as count
FROM ${ref("quickstart-source")}
GROUP BY 1
Remarque : Une notification d'erreur peut s'afficher dans la section des requêtes compilées. Ignorez ce message et passez aux étapes suivantes pour exécuter le workflow.
Tâche 5 : Accorder à Dataform l'accès à BigQuery
Dans la console Google Cloud, accédez au menu de navigation (), puis sélectionnez IAM et administration > IAM.
Cliquez sur AFFICHER PAR COMPTE PRINCIPAL. Ensuite, cliquez sur ACCORDER L'ACCÈS.
Dans le champ Nouveaux comptes principaux, saisissez l'ID de votre compte de service Dataform.
Dans la liste déroulante Sélectionner un rôle, choisissez le rôle Utilisateur de job BigQuery.
Cliquez sur Ajouter un autre rôle, puis choisissez le rôle Éditeur de données BigQuery dans la liste déroulante Sélectionner un rôle.
Cliquez sur Ajouter un autre rôle, puis choisissez le rôle Lecteur de données BigQuery dans la liste déroulante Sélectionner un rôle.
Cliquez sur Enregistrer.
Tester la tâche terminée
Cliquez sur Vérifier ma progression pour valider l'objectif.
Accorder à Dataform l'accès à BigQuery
Tâche 6 : Exécuter le workflow
Dans la console, accédez au menu de navigation > BigQuery > Dataform.
Cliquez sur quickstart-repository pour ouvrir le dépôt.
Cliquez sur quickstart-workspace pour ouvrir l'espace de travail de développement.
Sur la page quickstart-workspace, cliquez sur DÉMARRER L'EXÉCUTION.
Cliquez sur Actions à exécuter.
Cliquez sur l'onglet Toutes les actions.
Dans le volet Exécuter, cliquez sur DÉMARRER L'EXÉCUTION.
Dataform utilise les paramètres du dépôt par défaut pour créer le contenu de votre workflow dans un ensemble de données BigQuery nommé dataform.
Tester la tâche terminée
Cliquez sur Vérifier ma progression pour valider l'objectif.
Créer et exécuter le workflow SQL
Afficher les journaux d'exécution
Sur la page quickstart-workspace, cliquez sur EXÉCUTIONS pour ouvrir le volet "Exécutions".
Pour afficher les détails de votre exécution, cliquez sur la dernière exécution.
Terminer l'atelier
Une fois l'atelier terminé, cliquez sur End Lab (Terminer l'atelier). Qwiklabs supprime les ressources que vous avez utilisées, puis efface le compte.
Si vous le souhaitez, vous pouvez noter l'atelier. Sélectionnez le nombre d'étoiles correspondant à votre note, saisissez un commentaire, puis cliquez sur Submit (Envoyer).
Le nombre d'étoiles que vous pouvez attribuer à un atelier correspond à votre degré de satisfaction :
1 étoile = très mécontent(e)
2 étoiles = insatisfait(e)
3 étoiles = ni insatisfait(e), ni satisfait(e)
4 étoiles = satisfait(e)
5 étoiles = très satisfait(e)
Si vous ne souhaitez pas donner votre avis, vous pouvez fermer la boîte de dialogue.
Pour soumettre des commentaires, suggestions ou corrections, veuillez utiliser l'onglet Support (Assistance).
Copyright 2020 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.
Les ateliers créent un projet Google Cloud et des ressources pour une durée déterminée.
Les ateliers doivent être effectués dans le délai imparti et ne peuvent pas être mis en pause. Si vous quittez l'atelier, vous devrez le recommencer depuis le début.
En haut à gauche de l'écran, cliquez sur Démarrer l'atelier pour commencer.
Utilisez la navigation privée
Copiez le nom d'utilisateur et le mot de passe fournis pour l'atelier
Cliquez sur Ouvrir la console en navigation privée
Connectez-vous à la console
Connectez-vous à l'aide des identifiants qui vous ont été attribués pour l'atelier. L'utilisation d'autres identifiants peut entraîner des erreurs ou des frais.
Acceptez les conditions d'utilisation et ignorez la page concernant les ressources de récupération des données.
Ne cliquez pas sur Terminer l'atelier, à moins que vous n'ayez terminé l'atelier ou que vous ne vouliez le recommencer, car cela effacera votre travail et supprimera le projet.
Ce contenu n'est pas disponible pour le moment
Nous vous préviendrons par e-mail lorsqu'il sera disponible
Parfait !
Nous vous contacterons par e-mail s'il devient disponible
Un atelier à la fois
Confirmez pour mettre fin à tous les ateliers existants et démarrer celui-ci
Utilisez la navigation privée pour effectuer l'atelier
Ouvrez une fenêtre de navigateur en mode navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.
Dans cet atelier, vous allez découvrir comment créer et exécuter un workflow SQL dans Dataform pour charger des données dans BigQuery.
Durée :
0 min de configuration
·
Accessible pendant 60 min
·
Terminé après 60 min