GSP1145

Présentation
Dataplex est une data fabric intelligente qui permet aux entreprises de découvrir, de gérer, de surveiller et de gouverner leurs données de façon centralisée sur des lacs, des entrepôts et des magasins de données pour optimiser les analyses à grande échelle.
Data Catalog est un service de gestion des métadonnées entièrement géré et évolutif au sein de Dataplex. Vous pouvez l'utiliser pour ajouter des tags aux éléments de données et rechercher des éléments auxquels vous avez accès. Les tags vous permettent d'associer des champs de métadonnées personnalisés à des éléments de données spécifiques pour en simplifier l'identification et la récupération : vous pouvez par exemple taguer certains éléments comme contenant des données protégées ou sensibles. Vous pouvez aussi créer des modèles de tag réutilisables pour attribuer rapidement les mêmes tags à différents éléments de données.
Dans cet atelier, vous allez apprendre à utiliser Data Catalog dans Dataplex pour créer un modèle de tag, l'appliquer aux éléments Dataplex, puis utiliser le tag pour rechercher des éléments.
Objectifs de l'atelier
- Activer les API Dataplex et Data Catalog
- Créer un lac, une zone et un élément dans Dataplex
- Créer un modèle de tag
- Appliquer un modèle de tag aux éléments Dataplex
- Rechercher des éléments à l'aide de tags
Préparation
Avant de cliquer sur le bouton "Démarrer l'atelier"
Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.
Cet atelier pratique vous permet de suivre les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Des identifiants temporaires vous sont fournis pour vous permettre de vous connecter à Google Cloud le temps de l'atelier.
Pour réaliser cet atelier :
- Vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome).
Remarque : Ouvrez une fenêtre de navigateur en mode incognito (recommandé) ou de navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.
- Vous disposez d'un temps limité. N'oubliez pas qu'une fois l'atelier commencé, vous ne pouvez pas le mettre en pause.
Remarque : Utilisez uniquement le compte de participant pour cet atelier. Si vous utilisez un autre compte Google Cloud, des frais peuvent être facturés à ce compte.
Démarrer l'atelier et se connecter à la console Google Cloud
-
Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, une boîte de dialogue s'affiche pour vous permettre de sélectionner un mode de paiement.
Sur la gauche, vous trouverez le panneau "Détails concernant l'atelier", qui contient les éléments suivants :
- Le bouton "Ouvrir la console Google Cloud"
- Le temps restant
- Les identifiants temporaires que vous devez utiliser pour cet atelier
- Des informations complémentaires vous permettant d'effectuer l'atelier
-
Cliquez sur Ouvrir la console Google Cloud (ou effectuez un clic droit et sélectionnez Ouvrir le lien dans la fenêtre de navigation privée si vous utilisez le navigateur Chrome).
L'atelier lance les ressources, puis ouvre la page "Se connecter" dans un nouvel onglet.
Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.
Remarque : Si la boîte de dialogue Sélectionner un compte s'affiche, cliquez sur Utiliser un autre compte.
-
Si nécessaire, copiez le nom d'utilisateur ci-dessous et collez-le dans la boîte de dialogue Se connecter.
{{{user_0.username | "Username"}}}
Vous trouverez également le nom d'utilisateur dans le panneau "Détails concernant l'atelier".
-
Cliquez sur Suivant.
-
Copiez le mot de passe ci-dessous et collez-le dans la boîte de dialogue Bienvenue.
{{{user_0.password | "Password"}}}
Vous trouverez également le mot de passe dans le panneau "Détails concernant l'atelier".
-
Cliquez sur Suivant.
Important : Vous devez utiliser les identifiants fournis pour l'atelier. Ne saisissez pas ceux de votre compte Google Cloud.
Remarque : Si vous utilisez votre propre compte Google Cloud pour cet atelier, des frais supplémentaires peuvent vous être facturés.
-
Accédez aux pages suivantes :
- Acceptez les conditions d'utilisation.
- N'ajoutez pas d'options de récupération ni d'authentification à deux facteurs (ce compte est temporaire).
- Ne vous inscrivez pas à des essais sans frais.
Après quelques instants, la console Cloud s'ouvre dans cet onglet.
Remarque : Pour accéder aux produits et services Google Cloud, cliquez sur le menu de navigation ou saisissez le nom du service ou du produit dans le champ Recherche.
Activer les API Dataplex et Data Catalog
-
Dans la console Google Cloud, saisissez API Cloud Dataplex dans la barre de recherche en haut de l'écran.
-
Dans les résultats, cliquez sur API Cloud Dataplex sous "Marketplace".
-
Si l'API est désactivée, cliquez sur Activer.
-
Répétez les étapes 1 à 3 pour l'API Data Catalog Google Cloud.
Tâche 1 : Créer un lac, une zone et un élément
Dans cette tâche, vous allez créer un lac Dataplex pour stocker les informations sur les commandes des clients, ajouter une zone de données organisées au lac, puis associer à cette zone un ensemble de données BigQuery préalablement créé en tant que nouvel élément.
Créer un lac
- Dans la console Google Cloud, accédez au menu de navigation (
), puis cliquez sur Afficher tous les produits. Sous Analyse, cliquez sur Catalogue universel Dataplex.
Si la fenêtre Bienvenue dans la nouvelle interface Dataplex
apparaît, cliquez sur Fermer.
-
Sous Gérer les lacs, cliquez sur Gérer.
-
Cliquez sur Créer.
-
Saisissez les informations requises pour créer un lac de données :
Propriété |
Valeur |
Nom à afficher |
Orders Lake |
ID |
Conservez la valeur par défaut. |
Région |
|
Conservez les autres valeurs par défaut.
- Cliquez sur Créer.
La création du lac peut prendre quelques minutes.
Vous pouvez passer à la section suivante lorsque l'état du lac est Actif.
Ajouter une zone au lac
-
Dans l'onglet Gérer, cliquez sur le nom de votre lac.
-
Cliquez sur Ajouter une zone.
-
Saisissez les informations requises pour créer une zone :
Propriété |
Valeur |
Nom à afficher |
Customer Curated Zone |
ID |
Conservez la valeur par défaut. |
Type |
Zone de données organisées |
Emplacements des données |
Régional |
Conservez les autres valeurs par défaut.
Par exemple, l'option Activer la découverte des métadonnées sous les paramètres de découverte est activée par défaut. Elle permet aux utilisateurs autorisés de découvrir les données dans la zone.
- Cliquez sur Créer.
La création de la zone peut prendre quelques minutes.
Vous pouvez passer à la section suivante lorsque l'état de la zone est Actif.
Associer un élément à une zone
-
Dans l'onglet Zones, cliquez sur le nom de votre zone.
-
Dans l'onglet Éléments, cliquez sur Ajouter des éléments.
-
Cliquez sur Ajouter un élément.
-
Saisissez les informations requises pour associer un élément :
Propriété |
Valeur |
Type |
Ensemble de données BigQuery |
Nom à afficher |
Customer Details Dataset |
ID |
Conservez la valeur par défaut. |
Ensemble de données |
.customers |
Conservez les autres valeurs par défaut.
-
Cliquez sur Continuer.
-
Dans les paramètres de découverte, sélectionnez Hériter pour hériter des paramètres de découverte du niveau de la zone, puis cliquez sur Continuer.
-
Cliquez sur Envoyer.
Créer un lac, une zone et un élément dans Dataplex
Tâche 2 : Créer un modèle de tag
Pour commencer à ajouter des tags, vous devez créer un ou plusieurs modèles de tags, qui peuvent être publics ou privés. Lorsque vous créez un modèle de tag, l'option par défaut et recommandée est de créer un modèle de tag public. Les utilisateurs disposant des autorisations requises pour consulter un élément de données peuvent afficher tous les tags publics qui lui sont associés. Cela facilite les recherches et permet de respecter les contrôles d'accès aux données déjà mis en œuvre sur les données sous-jacentes.
Dans cette tâche, vous allez créer un modèle de tag public pour indiquer que les colonnes d'une table BigQuery contiennent des données protégées. Avec un modèle de ce type, les utilisateurs ayant accès aux colonnes sous-jacentes de la table BigQuery pourront voir les tags appliqués aux colonnes.
-
Dans le menu de gauche, sous Gérer les métadonnées, cliquez sur Catalogue.
-
Cliquez sur Créer un modèle de tag (obsolète).
-
Lorsque le message Voulez-vous vraiment continuer ? s'affiche, cliquez sur Continuer.
Remarque : Les modèles de tag sont progressivement remplacés par des types d'aspect, mais ils fonctionnent toujours pour le moment. Vous pouvez passer aux étapes suivantes pour créer un modèle de tag.
Cet atelier va être mis à jour pour utiliser les types d'aspect. Ces modifications seront bientôt visibles.
- Saisissez les informations requises pour définir le modèle de tag :
Propriété |
Valeur |
Nom à afficher du modèle |
Protected Data Template |
ID du modèle |
Conservez la valeur par défaut. |
Emplacement |
|
Visibilité |
Publique |
- Cliquez sur Ajouter un champ et saisissez les informations requises pour ajouter un champ au modèle :
Propriété |
Valeur |
Nom à afficher du champ |
Protected Data Flag |
ID du champ |
Conservez la valeur par défaut. |
Type |
Énuméré |
-
Pour le champ Valeurs énumérées > Values 1, saisissez YES
(OUI).
-
Cliquez sur Ajouter une valeur. Pour Values 2, saisissez NO
(NON).
-
Cliquez sur OK.
-
Cliquez sur Créer.
Remarque : La validation de la progression peut prendre quelques minutes en raison du temps de création du modèle de tag.
Créer un modèle de tag
Tâche 3 : Appliquer un modèle de tag aux éléments Dataplex
Après avoir créé un modèle de tag, vous pouvez l'utiliser pour associer des tags à autant d'éléments de données que vous le souhaitez du moment que vous y avez accès.
Dans cette tâche, vous allez appliquer le modèle de tag que vous avez créé pour indiquer que certaines colonnes de la table BigQuery contiennent des données protégées.
-
Dans le menu de gauche, sous Découvrir, cliquez sur Recherche.
-
Dans Filtres > Systèmes, cochez la case correspondant à Dataplex.
-
Cliquez sur la table customer_details.
Si la table customer_details n'apparaît pas, patientez quelques minutes, puis actualisez la page pour que la liste des éléments Dataplex se mette à jour.
-
Cliquez sur Associer des tags.
-
Pour Choisir l'élément auquel ajouter un tag, cochez les cases correspondant aux colonnes suivantes :
- zip
- state
- last_name
- country
- email
- latitude
- first_name
- city
- longitude
-
Cliquez sur OK.
-
Pour Choisir les modèles de tag, sélectionnez Protected data template.
-
Pour Protected data flag, sélectionnez YES.
-
Cliquez sur Enregistrer.
Remarque : La validation de la progression peut prendre quelques minutes en raison du temps d'application du modèle de tag.
Appliquer un modèle de tag aux éléments Dataplex
Tâche 4 : Rechercher des éléments à l'aide de tags
Une fois que vous avez ajouté un tag aux éléments de données, vous pouvez les rechercher à l'aide de Data Catalog dans Dataplex.
Dans cette tâche, vous allez rechercher les éléments qui ont été tagués grâce au modèle de tag "Protected data".
-
Dans le menu de gauche, sous Découvrir, cliquez sur Recherche.
-
Pour Filtres > Tags, cochez la case correspondant à Protected data template.
-
Cliquez sur la table customer_details.
-
Cliquez sur l'onglet Tags de colonne et de schéma pour voir les tags "Protected data" sur les colonnes concernées.
Félicitations !
Vous avez utilisé Data Catalog dans Dataplex pour créer un modèle de tag, vous l'avez appliqué à des éléments Dataplex, puis vous avez utilisé le tag pour rechercher des éléments.
Formations et certifications Google Cloud
Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.
Dernière mise à jour du manuel : 23 mai 2025
Dernier test de l'atelier : 23 mai 2025
Copyright 2025 Google LLC. Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.