Dataplex ist eine intelligente Datenstruktur, mit der Organisationen ihre Daten in Data Lakes, Data Warehouses und Data-Marts zentral erfassen, verwalten, überwachen und steuern können. Sie unterstützt Analysen in großem Maßstab.
Data Catalog ist ein vollständig verwalteter, skalierbarer Dienst zur Metadatenverwaltung in Dataplex, mit dem Sie Daten-Assets taggen und nach Assets suchen können, auf die Sie Zugriff haben. Mit Tags können Sie benutzerdefinierte Metadatenfelder an spezielle Daten-Assets anhängen, um diese leichter zu identifizieren und abzurufen. So lassen sich etwa bestimmte Assets als geschützte oder sensible Daten mit Tags kennzeichnen. Außerdem können Sie wiederverwendbare Tag-Vorlagen erstellen, um verschiedenen Daten-Assets schnell die gleichen Tags zuzuweisen.
In diesem Lab verwenden Sie Data Catalog in Dataplex und erstellen damit eine Tag-Vorlage, wenden diese auf Dataplex-Assets an und suchen dann mit dem Tag nach Assets.
Aufgaben
Dataplex und Data Catalog APIs aktivieren
Lake, Zone und Asset in Dataplex erstellen
Tag-Vorlage erstellen
Tag-Vorlage auf Dataplex-Assets anwenden
Mit Tags nach Assets suchen
Einrichtung und Anforderungen
Vor dem Klick auf „Start Lab“ (Lab starten)
Lesen Sie diese Anleitung. Labs sind zeitlich begrenzt und können nicht pausiert werden. Der Timer beginnt zu laufen, wenn Sie auf Lab starten klicken, und zeigt Ihnen, wie lange Google Cloud-Ressourcen für das Lab verfügbar sind.
In diesem praxisorientierten Lab können Sie die Lab-Aktivitäten in einer echten Cloud-Umgebung durchführen – nicht in einer Simulations- oder Demo-Umgebung. Dazu erhalten Sie neue, temporäre Anmeldedaten, mit denen Sie für die Dauer des Labs auf Google Cloud zugreifen können.
Für dieses Lab benötigen Sie Folgendes:
Einen Standardbrowser (empfohlen wird Chrome)
Hinweis: Nutzen Sie den privaten oder Inkognitomodus (empfohlen), um dieses Lab durchzuführen. So wird verhindert, dass es zu Konflikten zwischen Ihrem persönlichen Konto und dem Teilnehmerkonto kommt und zusätzliche Gebühren für Ihr persönliches Konto erhoben werden.
Zeit für die Durchführung des Labs – denken Sie daran, dass Sie ein begonnenes Lab nicht unterbrechen können.
Hinweis: Verwenden Sie für dieses Lab nur das Teilnehmerkonto. Wenn Sie ein anderes Google Cloud-Konto verwenden, fallen dafür möglicherweise Kosten an.
Lab starten und bei der Google Cloud Console anmelden
Klicken Sie auf Lab starten. Wenn Sie für das Lab bezahlen müssen, wird ein Dialogfeld geöffnet, in dem Sie Ihre Zahlungsmethode auswählen können.
Auf der linken Seite befindet sich der Bereich „Details zum Lab“ mit diesen Informationen:
Schaltfläche „Google Cloud Console öffnen“
Restzeit
Temporäre Anmeldedaten für das Lab
Ggf. weitere Informationen für dieses Lab
Klicken Sie auf Google Cloud Console öffnen (oder klicken Sie mit der rechten Maustaste und wählen Sie Link in Inkognitofenster öffnen aus, wenn Sie Chrome verwenden).
Im Lab werden Ressourcen aktiviert. Anschließend wird ein weiterer Tab mit der Seite „Anmelden“ geöffnet.
Tipp: Ordnen Sie die Tabs nebeneinander in separaten Fenstern an.
Hinweis: Wird das Dialogfeld Konto auswählen angezeigt, klicken Sie auf Anderes Konto verwenden.
Kopieren Sie bei Bedarf den folgenden Nutzernamen und fügen Sie ihn in das Dialogfeld Anmelden ein.
{{{user_0.username | "Username"}}}
Sie finden den Nutzernamen auch im Bereich „Details zum Lab“.
Klicken Sie auf Weiter.
Kopieren Sie das folgende Passwort und fügen Sie es in das Dialogfeld Willkommen ein.
{{{user_0.password | "Password"}}}
Sie finden das Passwort auch im Bereich „Details zum Lab“.
Klicken Sie auf Weiter.
Wichtig: Sie müssen die für das Lab bereitgestellten Anmeldedaten verwenden. Nutzen Sie nicht die Anmeldedaten Ihres Google Cloud-Kontos.
Hinweis: Wenn Sie Ihr eigenes Google Cloud-Konto für dieses Lab nutzen, können zusätzliche Kosten anfallen.
Klicken Sie sich durch die nachfolgenden Seiten:
Akzeptieren Sie die Nutzungsbedingungen.
Fügen Sie keine Wiederherstellungsoptionen oder Zwei-Faktor-Authentifizierung hinzu (da dies nur ein temporäres Konto ist).
Melden Sie sich nicht für kostenlose Testversionen an.
Nach wenigen Augenblicken wird die Google Cloud Console in diesem Tab geöffnet.
Hinweis: Wenn Sie auf Google Cloud-Produkte und ‑Dienste zugreifen möchten, klicken Sie auf das Navigationsmenü oder geben Sie den Namen des Produkts oder Dienstes in das Feld Suchen ein.
Dataplex und Data Catalog APIs aktivieren
Geben Sie in der Google Cloud Console oben in der Suchleiste Cloud Dataplex API ein.
Klicken Sie unter „Marketplace“ auf das Ergebnis für Cloud Dataplex API.
Ist sie noch nicht aktiviert, klicken Sie auf Aktivieren.
Wiederholen Sie die Schritte 1 bis 3 für die Google Cloud Data Catalog API.
Aufgabe 1: Lake, Zone und Asset erstellen
In dieser Aufgabe erstellen Sie einen neuen Dataplex-Lake zum Speichern von Kundenbestelldaten, fügen dem Lake eine kuratierte Zone hinzu und hängen dann ein bereits erstelltes BigQuery-Dataset als neues Asset in der Zone an.
Lakes erstellen
Klicken Sie in der Google Cloud Console im Navigationsmenü () auf Alle Produkte ansehen. Klicken Sie unter Analyse auf Dataplex Universal Catalog.
Wenn die Meldung Welcome to the new Dataplex experience angezeigt wird, klicken Sie auf Schließen.
Klicken Sie unter Lakes verwalten auf Verwalten.
Klicken Sie auf Erstellen.
Geben Sie die erforderlichen Informationen ein, um einen neuen Data Lake zu erstellen:
Attribut
Wert
Anzeigename
Orders Lake
ID
Übernehmen Sie den Standardwert.
Region
Übernehmen Sie die anderen Standardwerte.
Klicken Sie auf Erstellen.
Es kann einige Minuten dauern, bis der Data Lake erstellt ist.
Sie können mit dem nächsten Abschnitt fortfahren, sobald der Status des Lake Aktiv lautet.
Zone zum Lake hinzufügen
Klicken Sie auf dem Tab Verwalten auf den Namen Ihres Lake.
Klicken Sie auf Zone hinzufügen.
Geben Sie die erforderlichen Informationen ein, um eine neue Zone zu erstellen:
Attribut
Wert
Anzeigename
Customer Curated Zone
ID
Übernehmen Sie den Standardwert.
Typ
Kuratierte Zone
Datenstandorte
Regional
Übernehmen Sie die anderen Standardwerte.
Beispielsweise ist unter Erkennungseinstellungen die Option Metadatenerkennung aktivieren standardmäßig aktiviert. Dadurch können autorisierte Nutzer die Daten in der Zone sehen.
Klicken Sie auf Erstellen.
Es kann einige Minuten dauern, bis die Zone erstellt ist.
Sie können mit dem nächsten Abschnitt fortfahren, sobald der Status der Zone Aktiv lautet.
Asset an eine Zone anhängen
Klicken Sie auf dem Tab Zonen auf den Namen Ihrer Zone.
Klicken Sie auf dem Tab Assets auf Assets hinzufügen.
Klicken Sie auf Asset hinzufügen.
Geben Sie die erforderlichen Informationen ein, um ein neues Asset anzuhängen:
Attribut
Wert
Typ
BigQuery-Dataset
Anzeigename
Customer Details Dataset
ID
Übernehmen Sie den Standardwert.
Dataset
.customers
Übernehmen Sie die anderen Standardwerte.
Klicken Sie auf Weiter.
Wählen Sie unter Erkennungseinstellungen die Option Übernehmen aus, um die Erkennungseinstellungen auf Zonenebene zu übernehmen, und klicken Sie dann auf Weiter.
Klicken Sie auf Senden.
Lake, Zone und Asset in Dataplex erstellen
Aufgabe 2: Tag-Vorlage erstellen
Um Daten mit Tags zu kennzeichnen, müssen Sie zuerst mindestens eine Tag-Vorlage erstellen. Eine Tag-Vorlage kann öffentlich oder privat sein. Wenn Sie eine neue Tag-Vorlage erstellen, ist die Option zum Erstellen einer öffentlichen Tag-Vorlage die empfohlene Standardoption. Nutzer mit den erforderlichen Leseberechtigungen für ein Daten-Asset können alle zugehörigen öffentlichen Tags sehen. Dies ermöglicht eine einfache Suche zur Datenerkennung und sorgt gleichzeitig dafür, dass die für die zugrunde liegenden Daten bereits implementierten Datenzugriffssteuerungen beachtet werden.
In dieser Aufgabe erstellen Sie eine öffentliche Tag-Vorlage, um Spalten in BigQuery-Tabellen mit einem geschützten Status zu kennzeichnen. Mit einer öffentlichen Tag-Vorlage können Nutzer, die Zugriff auf die zugrunde liegenden BigQuery-Tabellenspalten haben, die auf die Spalten angewendeten Tags sehen.
Klicken Sie im Menü auf der linken Seite unter Metadaten verwalten auf Katalog.
Klicken Sie auf Tag-Vorlage erstellen (verworfen).
Wenn die Meldung Möchten Sie wirklich fortfahren? angezeigt wird, klicken Sie auf Fortfahren.
Hinweis: Tag-Vorlagen werden künftig durch Aspekttypen ersetzt, können derzeit aber noch genutzt werden. Sie können mit den nächsten Schritten fortfahren, um eine Tag-Vorlage zu erstellen.
Dieses Lab wird hinsichtlich der Verwendung von Aspekttypen aktualisiert und demnächst entsprechend geändert.
Geben Sie die erforderlichen Informationen ein, um die Tag-Vorlage zu definieren:
Attribut
Wert
Anzeigename der Vorlage
Protected Data Template
Vorlagen-ID
Übernehmen Sie den Standardwert.
Standort
Sichtbarkeit
Öffentlich
Klicken Sie auf Feld hinzufügen und geben Sie die erforderlichen Informationen ein, um der Vorlage ein neues Feld hinzuzufügen:
Attribut
Wert
Anzeigename des Feldes
Protected Data Flag
Feld-ID
Übernehmen Sie den Standardwert.
Typ
Aufgezählt
Geben Sie für Aufzählungswerte > Werte 1YES ein.
Klicken Sie auf Wert hinzufügen und geben Sie für Werte 2NO ein.
Klicken Sie auf Fertig.
Klicken Sie auf Erstellen.
Hinweis: Es kann einige Minuten dauern, bis die Tag-Vorlage erstellt und nach der Fortschrittsüberprüfung eine Erfolgsmeldung zurückgegeben wird.
Tag-Vorlage erstellen
Aufgabe 3: Tag-Vorlage auf Dataplex-Assets anwenden
Nachdem Sie eine Tag-Vorlage erstellt haben, können Sie damit Tags an beliebig viele Daten-Assets anhängen, auf die Sie Zugriff haben.
In dieser Aufgabe wenden Sie die zuvor erstellte Tag-Vorlage auf bestimmte Spalten in der BigQuery-Tabelle an, die Sie mit einem Status für geschützte Daten kennzeichnen möchten.
Klicken Sie im Menü auf der linken Seite unter Entdecken auf Suchen.
Aktivieren Sie unter Filter > Systeme das Kästchen für Dataplex.
Klicken Sie auf die Tabelle customer_details.
Wenn die Tabelle customer_details nicht angezeigt wird, warten Sie einige Minuten und aktualisieren Sie dann die Seite, damit die Dataplex-Asset-Liste auf den neuen Stand gebracht wird.
Klicken Sie auf Tags anhängen.
Aktivieren Sie unter Auswählen, was mit Tags versehen werden soll die Kästchen für die folgenden Spalten:
zip
state
last_name
country
email
latitude
first_name
city
longitude
Klicken Sie auf OK.
Wählen Sie unter Tag-Vorlagen auswählen die Option Vorlage für geschützte Daten aus.
Wählen Sie für Flag für geschützte Daten die Option JA aus.
Klicken Sie auf Speichern.
Hinweis: Es kann einige Minuten dauern, bis die Tag-Vorlage angewendet und nach der Fortschrittsüberprüfung eine Erfolgsmeldung zurückgegeben wird.
Tag-Vorlage auf Dataplex-Assets anwenden
Aufgabe 4: Mit Tags nach Assets suchen
Nachdem Sie Daten-Assets getaggt haben, können Sie mit Data Catalog in Dataplex nach ihnen suchen.
In dieser Aufgabe suchen Sie nach Assets, die mit der Tag-Vorlage für geschützte Daten getaggt wurden.
Klicken Sie im Menü auf der linken Seite unter Entdecken auf Suchen.
Aktivieren Sie unter Filter > Tags das Kästchen für Vorlage für geschützte Daten.
Klicken Sie auf die Tabelle customer_details.
Klicken Sie auf den Tab Schema und Spalten-Tags, um die Tags für geschützte Daten in den angegebenen Spalten zu sehen.
Das wars! Sie haben das Lab erfolgreich abgeschlossen.
Sie haben mit Data Catalog in Dataplex eine Tag-Vorlage erstellt, diese auf Dataplex-Assets angewendet und dann mit dem Tag nach Assets gesucht.
Google Cloud-Schulungen und -Zertifizierungen
In unseren Schulungen erfahren Sie alles zum optimalen Einsatz unserer Google Cloud-Technologien und können sich entsprechend zertifizieren lassen. Unsere Kurse vermitteln technische Fähigkeiten und Best Practices, damit Sie möglichst schnell mit Google Cloud loslegen und Ihr Wissen fortlaufend erweitern können. Wir bieten On-Demand-, Präsenz- und virtuelle Schulungen für Anfänger wie Fortgeschrittene an, die Sie individuell in Ihrem eigenen Zeitplan absolvieren können. Mit unseren Zertifizierungen weisen Sie nach, dass Sie Experte im Bereich Google Cloud-Technologien sind.
Labs erstellen ein Google Cloud-Projekt und Ressourcen für einen bestimmten Zeitraum
Labs haben ein Zeitlimit und keine Pausenfunktion. Wenn Sie das Lab beenden, müssen Sie von vorne beginnen.
Klicken Sie links oben auf dem Bildschirm auf Lab starten, um zu beginnen
Privates Surfen verwenden
Kopieren Sie den bereitgestellten Nutzernamen und das Passwort für das Lab
Klicken Sie im privaten Modus auf Konsole öffnen
In der Konsole anmelden
Melden Sie sich mit Ihren Lab-Anmeldedaten an. Wenn Sie andere Anmeldedaten verwenden, kann dies zu Fehlern führen oder es fallen Kosten an.
Akzeptieren Sie die Nutzungsbedingungen und überspringen Sie die Seite zur Wiederherstellung der Ressourcen
Klicken Sie erst auf Lab beenden, wenn Sie das Lab abgeschlossen haben oder es neu starten möchten. Andernfalls werden Ihre bisherige Arbeit und das Projekt gelöscht.
Diese Inhalte sind derzeit nicht verfügbar
Bei Verfügbarkeit des Labs benachrichtigen wir Sie per E-Mail
Sehr gut!
Bei Verfügbarkeit kontaktieren wir Sie per E-Mail
Es ist immer nur ein Lab möglich
Bestätigen Sie, dass Sie alle vorhandenen Labs beenden und dieses Lab starten möchten
Privates Surfen für das Lab verwenden
Nutzen Sie den privaten oder Inkognitomodus, um dieses Lab durchzuführen. So wird verhindert, dass es zu Konflikten zwischen Ihrem persönlichen Konto und dem Teilnehmerkonto kommt und zusätzliche Gebühren für Ihr persönliches Konto erhoben werden.
In diesem Lab wird gezeigt, wie Sie mit dem Tagging von Dataplex-Assets Data Governance und Datenerkennung unterstützen können.