arrow_back

Tagging degli asset di Dataplex

Accedi Partecipa
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Tagging degli asset di Dataplex

Lab 45 minuti universal_currency_alt 1 credito show_chart Introduttivi
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP1145

Laboratori autogestiti Google Cloud

Panoramica

Dataplex è un data fabric intelligente che consente alle organizzazioni l'individuazione, la gestione, il monitoraggio e la governance dei dati a livello centralizzato tra data lake, data warehouse e data mart per potenziare l'analisi su larga scala.

Data Catalog è un servizio di gestione dei metadati completamente gestito e scalabile all'interno di Dataplex che puoi utilizzare per il tagging degli asset di dati e per cercare gli asset a cui hai accesso. I tag consentono di collegare campi di metadati personalizzati ad asset di dati specifici per facilitarne l'identificazione e il recupero (ad esempio applicando tag a determinati asset per indicare che contengono dati protetti o sensibili); puoi anche creare modelli di tag riutilizzabili per assegnare rapidamente gli stessi tag a diversi asset di dati.

In questo lab imparerai come utilizzare Data Catalog all'interno di Dataplex per creare un modello di tag, applicarlo agli asset Dataplex e quindi utilizzare il tag per cercare gli asset.

In questo lab proverai a:

  • Abilitare le API Dataplex e Data Catalog
  • Creare un lake, una zona e un asset in Dataplex
  • Creare un modello di tag
  • Applicare un modello di tag alle risorse Dataplex
  • Cercare gli asset utilizzando i tag

Configurazione e requisiti

Prima di fare clic sul pulsante Avvia lab

Leggi le seguenti istruzioni. I lab sono a tempo e non possono essere messi in pausa. Il timer si avvia quando fai clic su Avvia lab e ti mostra per quanto tempo avrai a disposizione le risorse Google Cloud.

Con questo lab pratico avrai la possibilità di completare le attività in prima persona, in un ambiente cloud reale e non di simulazione o demo. Riceverai delle nuove credenziali temporanee che potrai utilizzare per accedere a Google Cloud per la durata del lab.

Per completare il lab, avrai bisogno di:

  • Accesso a un browser internet standard (Chrome è il browser consigliato).
Nota: utilizza una finestra del browser in incognito o privata per eseguire questo lab. Ciò evita eventuali conflitti tra il tuo account personale e l'account Studente, che potrebbero causare addebiti aggiuntivi sul tuo account personale.
  • È ora di completare il lab: ricorda che, una volta iniziato, non puoi metterlo in pausa.
Nota: se hai già un account o un progetto Google Cloud personale, non utilizzarlo per questo lab per evitare addebiti aggiuntivi al tuo account.

Come avviare il lab e accedere alla console Google Cloud

  1. Fai clic sul pulsante Avvia lab. Se devi effettuare il pagamento per il lab, si apre una finestra popup per permetterti di selezionare il metodo di pagamento. A sinistra, trovi il riquadro Dettagli lab con le seguenti informazioni:

    • Pulsante Apri console Google
    • Tempo rimanente
    • Credenziali temporanee da utilizzare per il lab
    • Altre informazioni per seguire questo lab, se necessario
  2. Fai clic su Apri console Google. Il lab avvia le risorse e apre un'altra scheda con la pagina di accesso.

    Suggerimento: disponi le schede in finestre separate posizionate fianco a fianco.

    Note: se visualizzi la finestra di dialogo Scegli un account, fai clic su Utilizza un altro account.
  3. Se necessario, copia il Nome utente dal riquadro Dettagli lab e incollalo nella finestra di dialogo di accesso. Fai clic su Avanti.

  4. Copia la Password dal riquadro Dettagli lab e incollala nella finestra di dialogo di benvenuto. Fai clic su Avanti.

    Importante: devi utilizzare le credenziali presenti nel riquadro di sinistra. Non utilizzare le tue credenziali Google Cloud Skills Boost. Nota: utilizzare il tuo account Google Cloud per questo lab potrebbe comportare addebiti aggiuntivi.
  5. Fai clic nelle pagine successive:

    • Accetta i termini e le condizioni.
    • Non inserire opzioni di recupero o l'autenticazione a due fattori, perché si tratta di un account temporaneo.
    • Non registrarti per le prove gratuite.

Dopo qualche istante, la console Google Cloud si apre in questa scheda.

Nota: puoi visualizzare il menu con un elenco di prodotti e servizi Google Cloud facendo clic sul menu di navigazione in alto a sinistra. Icona menu di navigazione

Abilita le API Dataplex e Data Catalog

  1. Nella console Google Cloud, inserisci API Cloud Dataplex nella barra di ricerca in alto.

  2. Fai clic sul risultato per API Cloud Dataplex in Marketplace.

  3. Fai clic su Abilita.

  4. Ripeti i passaggi da 1 a 3 per l'API Google Cloud Data Catalog.

Attività 1: crea un lake, una zona e un asset in Dataplex

In questa attività creerai un nuovo lake Dataplex per archiviare le informazioni sugli ordini dei clienti, aggiungerai una zona organizzata al lake e quindi collegherai un set di dati BigQuery creato in precedenza come nuovo asset nella zona.

Crea un lake

  1. Nella console Google Cloud, nel menu di navigazione (Menu di navigazione), vai ad Analisi > Dataplex.

Se viene visualizzato Welcome to the new Dataplex experience, fai clic su Chiudi.

  1. In Gestisci lake, fai clic su Gestisci.

  2. Fai clic su Crea lake.

  3. Inserisci le informazioni richieste per creare un nuovo lake:

Proprietà Valore
Nome visualizzato Orders Lake
ID Lascia il valore predefinito.
Regione

Lascia invariati gli altri valori predefiniti.

  1. Fai clic su Crea.

La creazione del lake può richiedere fino a 3 minuti.

Aggiungi una zona al lake

  1. Nella scheda Gestisci, fai clic sul nome del tuo lake.

  2. Fai clic su Aggiungi zona.

  3. Inserisci le informazioni richieste per creare una nuova zona:

Proprietà Valore
Nome visualizzato Customer Curated Zone
ID Lascia il valore predefinito.
Tipo Zona organizzata
Posizioni dei dati A livello di regione

Lascia invariati gli altri valori predefiniti.

Ad esempio, l'opzione Attiva rilevamento metadati in Impostazioni di rilevamento è abilitata per impostazione predefinita e consente agli utenti autorizzati di rilevare i dati nella zona.

  1. Fai clic su Crea.

La creazione della zona può richiedere fino a 2 minuti.

Puoi eseguire l'attività successiva una volta che lo stato della zona è Attivo.

Collega un asset a una zona

  1. Nella scheda Zone, fai clic sul nome della tua zona.

  2. Nella scheda Asset, fai clic su Aggiungi asset.

  3. Fai clic su Aggiungi un asset.

  4. Inserisci le informazioni richieste per collegare un nuovo asset:

Proprietà Valore
Tipo Set di dati BigQuery
Nome visualizzato Customer Details Dataset
ID Lascia il valore predefinito.
Set di dati .customers

Lascia invariati gli altri valori predefiniti.

  1. Fai clic su Fine.

  2. Fai clic su Continua.

  3. Per Impostazioni di rilevamento, seleziona Eredita per ereditare le impostazioni di rilevamento dal livello di zona, quindi fai clic su Continua.

  4. Fai clic su Invia.

Crea un lake, una zona e un asset in Dataplex

Attività 2: crea un modello di tag

Per iniziare a utilizzare il tagging dei dati, devi prima creare uno o più modelli di tag. Un modello di tag può essere un modello di tag pubblico o privato. Quando crei un nuovo modello di tag, l'opzione per creare un modello di tag pubblico è l'opzione predefinita e consigliata. Gli utenti che dispongono delle autorizzazioni di visualizzazione richieste per un asset di dati possono visualizzare tutti i tag pubblici associati. Ciò supporta la semplice ricerca per l'individuazione rispettando al tempo stesso i controlli dell'accesso ai dati già implementati sui dati sottostanti.

In questa attività creerai un modello di tag pubblico per etichettare le colonne della tabella BigQuery con uno stato protetto. Con un modello di tag pubblico, gli utenti che hanno accesso alle colonne della tabella BigQuery sottostante potranno vedere i tag applicati alle colonne.

  1. Nel menu a sinistra, in Gestisci catalogo, fai clic su Modelli di tag.

  2. Fai clic su Crea modello di tag.

  3. Inserisci le informazioni richieste per definire il modello di tag:

Proprietà Valore
Nome visualizzato del modello Protected Data Template
ID modello Lascia il valore predefinito.
Località
Visibilità Pubblica
  1. Fai clic su Aggiungi campo e inserisci le informazioni richieste per aggiungere un nuovo campo al modello:
Proprietà Valore
Nome visualizzato del campo Protected Data Flag
ID campo Lascia il valore predefinito.
Tipo Enumerato
  1. Per Valori enumerati > Valore 1, inserisci YES.

  2. Fai clic su Aggiungi valore e per Valore 2, inserisci NO.

  3. Fai clic su Fine.

  4. Fai clic su Crea.

Crea un modello di tag

Attività 3: applica un modello di tag alle risorse Dataplex

Dopo aver creato un modello di tag, puoi utilizzarlo per applicare tag a tutti gli asset di dati desiderati a cui hai accesso.

In questa attività, applicherai il modello di tag creato in precedenza a colonne specifiche nella tabella BigQuery che vuoi etichettare con uno stato di dati protetti.

  1. Nel menu a sinistra, in Scopri, fai clic su Cerca.

  2. Per Filtri > Sistemi, seleziona la casella di controllo per Dataplex.

  3. Fai clic sulla tabella customer_details.

Se non vedi la tabella customer_details, attendi qualche minuto, quindi aggiorna la pagina per consentire l'aggiornamento dell'elenco degli asset Dataplex.

  1. Fai clic su Associa tag.

  2. Per Scegli cosa taggare, seleziona le caselle di controllo corrispondenti alle seguenti colonne:

    • zip
    • state
    • last_name
    • country
    • email
    • latitude
    • first_name
    • city
    • longitude
  3. Fai clic su Ok.

  4. Per Scegli i modelli di tag, seleziona Protected Data Template.

  5. Per Protected Data Flag, seleziona YES.

  6. Fai clic su Salva.

Applica un modello di tag agli asset Dataplex

Attività 4: cerca gli asset utilizzando i tag

Dopo aver associato i tag agli asset di dati, puoi cercarli utilizzando Data Catalog in Dataplex.

In questa attività cercherai gli asset che sono stati taggati utilizzando il modello di tag Protected Data.

  1. Nel menu a sinistra, in Scopri, fai clic su Cerca.

  2. Per Filtri > Tag, seleziona la casella di controllo per Protected Data Template.

  3. Fai clic sulla tabella customer_details.

  4. Fai clic sulla scheda Tag di schema e colonna per visualizzare i tag Protected Data sulla colonna specificata.

Complimenti!

Hai utilizzato Data Catalog all'interno di Dataplex per creare un modello di tag, applicarlo agli asset Dataplex e quindi hai utilizzato il tag per cercare gli asset.

Formazione e certificazione Google Cloud

… per utilizzare al meglio le tecnologie Google Cloud. I nostri corsi ti consentono di sviluppare competenze tecniche e best practice per aiutarti a metterti subito al passo e avanzare nel tuo percorso di apprendimento. Offriamo vari livelli di formazione, dal livello base a quello avanzato, con opzioni di corsi on demand, dal vivo e virtuali, in modo da poter scegliere il più adatto in base ai tuoi impegni. Le certificazioni ti permettono di confermare e dimostrare le tue abilità e competenze relative alle tecnologie Google Cloud.

Ultimo aggiornamento del manuale: 20 settembre 2023

Ultimo test del lab: 20 settembre 2023

Copyright 2024 Google LLC Tutti i diritti riservati. Google e il logo Google sono marchi di Google LLC. Tutti gli altri nomi di società e prodotti sono marchi delle rispettive società a cui sono associati.