Points de contrôle
Create a lake, zone, and asset in Dataplex
/ 30
Create a tag template
/ 30
Apply a tag template to Dataplex assets
/ 40
Ajouter des tags aux éléments Dataplex
GSP1145
Présentation
Dataplex est une data fabric intelligente qui permet aux entreprises de découvrir, de gérer, de surveiller et de gouverner leurs données de façon centralisée sur des lacs, des entrepôts et des magasins de données pour optimiser les analyses à grande échelle.
Data Catalog est un service de gestion des métadonnées entièrement géré et évolutif au sein de Dataplex. Vous pouvez l'utiliser pour ajouter des tags aux éléments de données et rechercher des éléments auxquels vous avez accès. Les tags vous permettent d'associer des champs de métadonnées personnalisés à des éléments de données spécifiques pour en simplifier l'identification et la récupération : vous pouvez par exemple taguer certains éléments comme contenant des données protégées ou sensibles. Vous pouvez aussi créer des modèles de tag réutilisables pour attribuer rapidement les mêmes tags à différents éléments de données.
Dans cet atelier, vous allez apprendre à utiliser Data Catalog dans Dataplex pour créer un modèle de tag, l'appliquer aux éléments Dataplex, puis utiliser le tag pour rechercher des éléments.
Objectifs de l'atelier
- Activer les API Dataplex et Data Catalog
- Créer un lac, une zone et un élément dans Dataplex
- Créer un modèle de tag
- Appliquer un modèle de tag aux éléments Dataplex
- Rechercher des éléments à l'aide de tags
Préparation
Avant de cliquer sur le bouton "Démarrer l'atelier"
Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.
Cet atelier pratique vous permet de suivre vous-même les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Nous vous fournissons des identifiants temporaires pour vous connecter à Google Cloud le temps de l'atelier.
Pour réaliser cet atelier :
- vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome) ;
- vous disposez d'un temps limité ; une fois l'atelier commencé, vous ne pouvez pas le mettre en pause.
Démarrer l'atelier et se connecter à la console Google Cloud
-
Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, un pop-up s'affiche pour vous permettre de sélectionner un mode de paiement. Sur la gauche, vous trouverez le panneau Détails concernant l'atelier, qui contient les éléments suivants :
- Le bouton Ouvrir la console Google
- Le temps restant
- Les identifiants temporaires que vous devez utiliser pour cet atelier
- Des informations complémentaires vous permettant d'effectuer l'atelier
-
Cliquez sur Ouvrir la console Google. L'atelier lance les ressources, puis ouvre la page Se connecter dans un nouvel onglet.
Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.
Remarque : Si la boîte de dialogue Sélectionner un compte s'affiche, cliquez sur Utiliser un autre compte. -
Si nécessaire, copiez le nom d'utilisateur inclus dans le panneau Détails concernant l'atelier et collez-le dans la boîte de dialogue Se connecter. Cliquez sur Suivant.
-
Copiez le mot de passe inclus dans le panneau Détails concernant l'atelier et collez-le dans la boîte de dialogue de bienvenue. Cliquez sur Suivant.
Important : Vous devez utiliser les identifiants fournis dans le panneau de gauche. Ne saisissez pas vos identifiants Google Cloud Skills Boost. Remarque : Si vous utilisez votre propre compte Google Cloud pour cet atelier, des frais supplémentaires peuvent vous être facturés. -
Accédez aux pages suivantes :
- Acceptez les conditions d'utilisation.
- N'ajoutez pas d'options de récupération ni d'authentification à deux facteurs (ce compte est temporaire).
- Ne vous inscrivez pas aux essais offerts.
Après quelques instants, la console Cloud s'ouvre dans cet onglet.
Activer les API Dataplex et Data Catalog
-
Dans la console Google Cloud, saisissez API Cloud Dataplex dans la barre de recherche en haut de l'écran.
-
Dans les résultats, cliquez sur Cloud Dataplex API (API Cloud Dataplex) sous "Marketplace".
-
Cliquez sur Activer.
-
Répétez les étapes 1 à 3 pour l'API Data Catalog Google Cloud.
Tâche 1 : Créer un lac, une zone et un élément
Dans cette tâche, vous allez créer un lac Dataplex pour stocker les informations sur les commandes des clients, ajouter une zone suggérée au lac, puis associer à cette zone un ensemble de données BigQuery préalablement créé en tant que nouvel élément.
Créer un lac
- Dans la console Google Cloud, accédez au menu de navigation (), puis à Analyse > Dataplex.
Si la fenêtre Bienvenue dans la nouvelle interface Dataplex
apparaît, cliquez sur Fermer.
-
Sous Gérer les lacs, cliquez sur Gérer.
-
Cliquez sur Créer un lac de données.
-
Saisissez les informations requises pour créer un lac de données :
Propriété | Valeur |
---|---|
Nom à afficher | Orders Lake |
ID | Conservez la valeur par défaut. |
Région |
Conservez les autres valeurs par défaut.
- Cliquez sur Créer.
La création d'un lac peut prendre jusqu'à trois minutes.
Ajouter une zone au lac
-
Dans l'onglet Gérer, cliquez sur le nom de votre lac.
-
Cliquez sur Ajouter une zone.
-
Saisissez les informations requises pour créer une zone :
Propriété | Valeur |
---|---|
Nom à afficher | Customer Curated Zone |
ID | Conservez la valeur par défaut. |
Type | Zone suggérée |
Emplacements des données | Régional |
Conservez les autres valeurs par défaut.
Par exemple, l'option Activer la découverte des métadonnées sous les paramètres de découverte est activée par défaut. Elle permet aux utilisateurs autorisés de découvrir les données dans la zone.
- Cliquez sur Créer.
La création de la zone peut prendre jusqu'à deux minutes.
Associer un élément à une zone
-
Dans l'onglet Zones, cliquez sur le nom de votre zone.
-
Dans l'onglet Éléments, cliquez sur Ajouter des éléments.
-
Cliquez sur Ajouter un élément.
-
Saisissez les informations requises pour associer un élément :
Propriété | Valeur |
---|---|
Type | Ensemble de données BigQuery |
Nom à afficher | Customer Details Dataset |
ID | Conservez la valeur par défaut. |
Ensemble de données |
|
Conservez les autres valeurs par défaut.
-
Cliquez sur OK.
-
Cliquez sur Continuer.
-
Dans les paramètres de découverte, sélectionnez Hériter pour hériter des paramètres de découverte du niveau de la zone, puis cliquez sur Continuer.
-
Cliquez sur Envoyer.
Tâche 2 : Créer un modèle de tag
Pour commencer à ajouter des tags, vous devez créer un ou plusieurs modèles de tags, qui peuvent être publics ou privés. Lorsque vous créez un modèle de tag, l'option par défaut et recommandée est de créer un modèle de tag public. Les utilisateurs disposant des autorisations requises pour consulter un élément de données peuvent afficher tous les tags publics qui lui sont associés. Cela facilite les recherches et permet de respecter les contrôles d'accès aux données déjà mis en œuvre sur les données sous-jacentes.
Dans cette tâche, vous allez créer un modèle de tag public pour indiquer que les colonnes d'une table BigQuery contiennent des données protégées. Avec un modèle de ce type, les utilisateurs ayant accès aux colonnes sous-jacentes de la table BigQuery pourront voir les tags appliqués aux colonnes.
-
Dans le menu de gauche, sous Gérer le catalogue, cliquez sur Modèles de tag.
-
Cliquez sur Créer un modèle de tag.
-
Saisissez les informations requises pour définir le modèle de tag :
Propriété | Valeur |
---|---|
Nom à afficher du modèle | Protected Data Template |
ID du modèle | Conservez la valeur par défaut. |
Emplacement | |
Visibilité | Publique |
- Cliquez sur Ajouter un champ et saisissez les informations requises pour ajouter un champ au modèle :
Propriété | Valeur |
---|---|
Nom à afficher du champ | Protected Data Flag |
ID du champ | Conservez la valeur par défaut. |
Type | Énuméré |
-
Pour le champ Valeurs énumérées > Values 1, saisissez
YES
(OUI). -
Cliquez sur Ajouter une valeur. Pour Values 2, saisissez
NO
(NON). -
Cliquez sur OK.
-
Cliquez sur Créer.
Tâche 3 : Appliquer un modèle de tag aux éléments Dataplex
Après avoir créé un modèle de tag, vous pouvez l'utiliser pour associer des tags à autant d'éléments de données que vous le souhaitez du moment que vous y avez accès.
Dans cette tâche, vous allez appliquer le modèle de tag que vous avez créé pour indiquer que certaines colonnes de la table BigQuery contiennent des données protégées.
-
Dans le menu de gauche, sous Découvrir, cliquez sur Recherche.
-
Dans Filtres > Systèmes, cochez la case correspondant à Dataplex.
-
Cliquez sur la table customer_details.
Si la table customer_details n'apparaît pas, patientez quelques minutes, puis actualisez la page pour que la liste des éléments Dataplex se mette à jour.
-
Cliquez sur Associer des tags.
-
Pour Choisir l'élément auquel ajouter un tag, cochez les cases correspondant aux colonnes suivantes :
- zip
- state
- last_name
- country
- latitude
- first_name
- city
- longitude
-
Cliquez sur OK.
-
Pour Choisir les modèles de tag, sélectionnez Protected data template.
-
Pour Protected data flag, sélectionnez YES.
-
Cliquez sur Enregistrer.
Tâche 4 : Rechercher des éléments à l'aide de tags
Une fois que vous avez ajouté un tag aux éléments de données, vous pouvez les rechercher à l'aide de Data Catalog dans Dataplex.
Dans cette tâche, vous allez rechercher les éléments qui ont été tagués grâce au modèle de tag "Protected data".
-
Dans le menu de gauche, sous Découvrir, cliquez sur Recherche.
-
Pour Filtres > Tags, cochez la case correspondant à Protected data template.
-
Cliquez sur la table customer_details.
-
Cliquez sur l'onglet Tags de colonne et de schéma pour voir les tags "Protected data" sur les colonnes concernées.
Félicitations !
Vous avez utilisé Data Catalog dans Dataplex pour créer un modèle de tag, vous l'avez appliqué à des éléments Dataplex, puis vous avez utilisé le tag pour rechercher des éléments.
Formations et certifications Google Cloud
Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.
Dernière mise à jour du manuel : 20 septembre 2023
Dernier test de l'atelier : 20 septembre 2023
Copyright 2024 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.