arrow_back

Dataplex : Qwik Start – Console

Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Dataplex : Qwik Start – Console

Lab 30 minutes universal_currency_alt 1 crédit show_chart Débutant
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP1143

Google Cloud – Ateliers adaptés au rythme de chacun

Présentation

Dataplex est une data fabric intelligente qui permet aux entreprises de découvrir, de gérer, de surveiller et de gouverner leurs données de façon centralisée sur des lacs, des entrepôts et des magasins de données pour optimiser les analyses à grande échelle. Vous pouvez utiliser Dataplex pour développer une architecture de maillage de données, c'est-à-dire une approche technique destinée aux entreprises qui décentralise la propriété des données parmi les propriétaires de données du domaine.

Dataplex gère les données d'une manière qui ne nécessite pas de les déplacer ni de les dupliquer. Lorsque vous ajoutez des éléments de données, Dataplex collecte les métadonnées des données structurées et non structurées, puis les enregistre dans un metastore sécurisé et unifié. Grâce à des services Google Cloud tels que Data Catalog et BigQuery, vous pouvez ensuite évaluer ces données et métadonnées.

Dans cet atelier, vous allez apprendre à développer votre propre maillage de données en créant et en supprimant des lacs, des zones et des éléments dans Dataplex à l'aide de la console Google Cloud.

Objectifs de l'atelier

  • Activer l'API Dataplex
  • Créer un lac
  • Ajouter une zone à votre lac
  • Associer et dissocier des éléments
  • Supprimer des zones et des lacs

Préparation

Avant de cliquer sur le bouton "Démarrer l'atelier"

Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.

Cet atelier pratique vous permet de suivre vous-même les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Nous vous fournissons des identifiants temporaires pour vous connecter à Google Cloud le temps de l'atelier.

Pour réaliser cet atelier :

  • vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome) ;
Remarque : Ouvrez une fenêtre de navigateur en mode incognito/navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le temporaire étudiant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.
  • vous disposez d'un temps limité ; une fois l'atelier commencé, vous ne pouvez pas le mettre en pause.
Remarque : Si vous possédez déjà votre propre compte ou projet Google Cloud, veillez à ne pas l'utiliser pour réaliser cet atelier afin d'éviter que des frais supplémentaires ne vous soient facturés.

Démarrer l'atelier et se connecter à la console Google Cloud

  1. Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, un pop-up s'affiche pour vous permettre de sélectionner un mode de paiement. Sur la gauche, vous trouverez le panneau Détails concernant l'atelier, qui contient les éléments suivants :

    • Le bouton Ouvrir la console Google
    • Le temps restant
    • Les identifiants temporaires que vous devez utiliser pour cet atelier
    • Des informations complémentaires vous permettant d'effectuer l'atelier
  2. Cliquez sur Ouvrir la console Google. L'atelier lance les ressources, puis ouvre la page Se connecter dans un nouvel onglet.

    Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.

    Remarque : Si la boîte de dialogue Sélectionner un compte s'affiche, cliquez sur Utiliser un autre compte.
  3. Si nécessaire, copiez le nom d'utilisateur inclus dans le panneau Détails concernant l'atelier et collez-le dans la boîte de dialogue Se connecter. Cliquez sur Suivant.

  4. Copiez le mot de passe inclus dans le panneau Détails concernant l'atelier et collez-le dans la boîte de dialogue de bienvenue. Cliquez sur Suivant.

    Important : Vous devez utiliser les identifiants fournis dans le panneau de gauche. Ne saisissez pas vos identifiants Google Cloud Skills Boost. Remarque : Si vous utilisez votre propre compte Google Cloud pour cet atelier, des frais supplémentaires peuvent vous être facturés.
  5. Accédez aux pages suivantes :

    • Acceptez les conditions d'utilisation.
    • N'ajoutez pas d'options de récupération ni d'authentification à deux facteurs (ce compte est temporaire).
    • Ne vous inscrivez pas aux essais offerts.

Après quelques instants, la console Cloud s'ouvre dans cet onglet.

Remarque : Vous pouvez afficher le menu qui contient la liste des produits et services Google Cloud en cliquant sur le menu de navigation en haut à gauche. Icône du menu de navigation

Activer l'API Cloud Dataplex

  1. Dans la console Google Cloud, saisissez API Cloud Dataplex dans la barre de recherche en haut de l'écran.

  2. Dans les résultats, cliquez sur API Cloud Dataplex sous "Marketplace".

  3. Cliquez sur Activer.

Tâche 1 : Créer un lac

Dans Dataplex, un lac est le domaine d'organisation le plus élevé qui représente une zone de données ou une unité d'entreprise spécifique. Par exemple, vous pouvez créer un lac pour chaque service ou domaine de données de votre organisation. Vous aurez ainsi la possibilité d'organiser et de fournir des données à des groupes d'utilisateurs particuliers.

Dans cette tâche, vous allez créer un lac pour commencer à développer un maillage de données.

  1. Dans la console Google Cloud, accédez au menu de navigation (Menu de navigation), puis à Analyse > Dataplex.

Si la fenêtre Bienvenue dans la nouvelle interface Dataplex apparaît, cliquez sur Fermer.

  1. Sous Gérer les lacs, cliquez sur Gérer.

  2. Cliquez sur Créer un lac de données.

  3. Saisissez les informations requises pour créer un lac de données :

Propriété Valeur
Nom à afficher sensors
ID Conservez la valeur par défaut.
Région

Conservez les autres valeurs par défaut.

  1. Cliquez sur Créer.

La création d'un lac peut prendre jusqu'à trois minutes.

Cliquez sur Vérifier ma progression pour valider l'objectif. Créer un lac de données sensors

Tâche 2 : Ajouter une zone à votre lac

Après avoir créé un lac, vous pouvez y ajouter des zones. Il s'agit de sous-domaines vous permettant de classer vos données. Par exemple, vous pouvez classer vos données par étape, utilisation ou restrictions.

Il existe deux types de zones :

  • Les zones brutes contiennent des données dans des formats bruts (par exemple, les fichiers dans des buckets Cloud Storage) et ne sont pas soumises à une vérification stricte du type.
  • Les zones sélectionnées contiennent des données nettoyées, formatées et prêtes à être analysées, comme les tables BigQuery.

Dans cette tâche, vous allez créer une zone brute pour exploiter des fichiers dans un bucket Cloud Storage.

  1. Dans l'onglet Gérer, cliquez sur le nom de votre lac.

  2. Cliquez sur Ajouter une zone.

  3. Saisissez les informations requises pour créer une zone :

Propriété Valeur
Nom à afficher temperature raw data
ID Conservez la valeur par défaut.
Type Zone brute
Emplacements des données Régional

Conservez les autres valeurs par défaut.

Par exemple, l'option Activer la découverte des métadonnées sous les paramètres de découverte est activée par défaut. Elle permet aux utilisateurs autorisés de découvrir les données dans la zone.

  1. Cliquez sur Créer.

La création de la zone peut prendre jusqu'à deux minutes.

Vous pouvez passer à l'étape suivante lorsque l'état de la zone bascule sur Actif.

Cliquez sur Vérifier ma progression pour valider l'objectif. Ajouter une zone temperature raw data au lac de données "sensors"

Tâche 3 : Associer un élément à une zone

Les données stockées dans des buckets Cloud Storage ou des ensembles de données BigQuery peuvent être associées en tant qu'éléments aux zones d'un lac Dataplex.

Dans cette tâche, vous allez associer un bucket Cloud Storage créé dans la console Google Cloud.

  1. Dans l'onglet Zones, cliquez sur le nom de votre zone.

  2. Dans l'onglet Éléments, cliquez sur Ajouter des éléments.

  3. Cliquez sur Ajouter un élément.

  4. Saisissez les informations requises pour associer un élément :

Propriété Valeur
Type Bucket de stockage
Nom à afficher measurements
ID Conservez la valeur par défaut.

Conservez les autres valeurs par défaut.

  1. Dans le champ Bucket, cliquez sur Parcourir.

Vous pouvez associer un bucket Cloud Storage existant ou en créer un nouveau sans quitter Dataplex. Lors des étapes suivantes, vous allez créer un bucket et l'associer à la zone.

  1. Cliquez sur Créer un bucket (Icône de panier d'achats).

  2. Indiquez l'ID de votre projet comme nom de bucket (), puis cliquez sur Continuer.

  3. Dans le champ Type d'emplacement, sélectionnez Région, puis .

Conservez les autres valeurs par défaut.

  1. Cliquez sur Créer.

Si le message L'accès public sera bloqué s'affiche, cliquez sur Confirmer.

  1. Cliquez sur Sélectionner pour sélectionner le bucket que vous venez de créer, puis cliquez sur Continuer.

  2. Dans les paramètres de découverte, sélectionnez Hériter pour hériter des paramètres de découverte du niveau de la zone, puis cliquez sur Continuer.

  3. Cliquez sur Envoyer.

Cliquez sur Vérifier ma progression pour valider l'objectif. Créer un bucket Cloud Storage et associer un élément measurements à la zone temperature raw data

Tâche 4 : Supprimer des éléments, des zones et des lacs

Pour supprimer un lac de données, vous devez d'abord dissocier les éléments, puis supprimer les zones.

Dans cette tâche, vous allez dissocier l'élément de la zone, supprimer la zone, puis supprimer le lac.

Dissocier un élément

  1. Dans le menu de gauche, cliquez sur l'onglet Gérer, puis cliquez sur le nom de votre lac de données.

  2. Dans l'onglet Zones, cliquez sur le nom de votre zone.

  3. Dans l'onglet Éléments, cochez la case située à gauche du nom de l'élément.

  4. Cliquez sur Supprimer des éléments.

  5. Cliquez sur Supprimer pour confirmer.

Cette action ne supprime pas les données sous-jacentes dans le bucket Cloud Storage. Elle empêche seulement d'accéder au bucket Cloud Storage ou de le découvrir à l'aide du lac de données dans Dataplex.

Supprimer une zone

  1. Dans le menu de gauche, cliquez sur l'onglet Gérer, puis cliquez sur le nom de votre lac de données.

  2. Dans l'onglet Zones, cochez la case située à gauche du nom de la zone.

  3. Cliquez sur Supprimer la zone.

  4. Cliquez sur Supprimer pour confirmer.

Supprimer le lac de données

  1. Dans le menu de gauche, cliquez sur l'onglet Gérer, puis cliquez sur le nom de votre lac de données.

  2. En haut de la page, cliquez sur Supprimer.

  3. Pour confirmer la suppression, saisissez delete dans la zone de texte.

  4. Cliquez sur Supprimer le lac de données pour confirmer.

Cliquez sur Vérifier ma progression pour valider l'objectif. Supprimer le lac sensors et les ressources imbriquées

Félicitations !

Vous avez utilisé la console Google Cloud pour créer et supprimer des lacs, des zones et des éléments dans Dataplex.

Formations et certifications Google Cloud

Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.

Dernière mise à jour du manuel : 20 septembre 2023

Dernier test de l'atelier : 20 septembre 2023

Copyright 2024 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.