GSP1143

Übersicht
Dataplex Universal Catalog ist eine intelligente Datenstruktur, mit der Organisationen ihre Daten in Data Lakes, Data Warehouses und Data-Marts zentral erfassen, verwalten, überwachen und steuern können. Sie unterstützt Analysen in großem Maßstab. Mit Dataplex Universal Catalog können Sie insbesondere eine Data-Mesh-Architektur erstellen. Das ist ein organisatorischer und technischer Ansatz, der die Inhaberschaft von Daten dezentralisiert und auf die Domain-Dateninhaber verteilt.
Dataplex Universal Catalog verwaltet Daten, ohne dass diese verschoben oder dupliziert werden müssen. Wenn Sie neue Daten-Assets hinzufügen, erfasst Dataplex Universal Catalog die Metadaten sowohl von strukturierten als auch von unstrukturierten Daten und registriert automatisch alle Metadaten in einem sicheren, einheitlichen Metastore. Daten und Metadaten können dann über Google Cloud-Dienste wie Data Catalog und BigQuery ausgewertet werden.
In diesem Lab erfahren Sie, wie Sie mit dem Aufbau Ihres eigenen Data Mesh beginnen, indem Sie mit der Google Cloud Console im Dataplex Universal Catalog Lakes, Zonen und Assets erstellen und entfernen.
Aufgaben
- Dataplex API aktivieren
- Lake erstellen
- Zone zum Lake hinzufügen
- Assets anhängen und trennen
- Zonen und Lakes löschen
Einrichtung und Anforderungen
Vor dem Klick auf „Start Lab“ (Lab starten)
Lesen Sie diese Anleitung. Labs sind zeitlich begrenzt und können nicht pausiert werden. Der Timer beginnt zu laufen, wenn Sie auf Lab starten klicken, und zeigt Ihnen, wie lange Google Cloud-Ressourcen für das Lab verfügbar sind.
In diesem praxisorientierten Lab können Sie die Lab-Aktivitäten in einer echten Cloud-Umgebung durchführen – nicht in einer Simulations- oder Demo-Umgebung. Dazu erhalten Sie neue, temporäre Anmeldedaten, mit denen Sie für die Dauer des Labs auf Google Cloud zugreifen können.
Für dieses Lab benötigen Sie Folgendes:
- Einen Standardbrowser (empfohlen wird Chrome)
Hinweis: Nutzen Sie den privaten oder Inkognitomodus (empfohlen), um dieses Lab durchzuführen. So wird verhindert, dass es zu Konflikten zwischen Ihrem persönlichen Konto und dem Teilnehmerkonto kommt und zusätzliche Gebühren für Ihr persönliches Konto erhoben werden.
- Zeit für die Durchführung des Labs – denken Sie daran, dass Sie ein begonnenes Lab nicht unterbrechen können.
Hinweis: Verwenden Sie für dieses Lab nur das Teilnehmerkonto. Wenn Sie ein anderes Google Cloud-Konto verwenden, fallen dafür möglicherweise Kosten an.
Lab starten und bei der Google Cloud Console anmelden
-
Klicken Sie auf Lab starten. Wenn Sie für das Lab bezahlen müssen, wird ein Dialogfeld geöffnet, in dem Sie Ihre Zahlungsmethode auswählen können.
Auf der linken Seite befindet sich der Bereich „Details zum Lab“ mit diesen Informationen:
- Schaltfläche „Google Cloud Console öffnen“
- Restzeit
- Temporäre Anmeldedaten für das Lab
- Ggf. weitere Informationen für dieses Lab
-
Klicken Sie auf Google Cloud Console öffnen (oder klicken Sie mit der rechten Maustaste und wählen Sie Link in Inkognitofenster öffnen aus, wenn Sie Chrome verwenden).
Im Lab werden Ressourcen aktiviert. Anschließend wird ein weiterer Tab mit der Seite „Anmelden“ geöffnet.
Tipp: Ordnen Sie die Tabs nebeneinander in separaten Fenstern an.
Hinweis: Wird das Dialogfeld Konto auswählen angezeigt, klicken Sie auf Anderes Konto verwenden.
-
Kopieren Sie bei Bedarf den folgenden Nutzernamen und fügen Sie ihn in das Dialogfeld Anmelden ein.
{{{user_0.username | "Username"}}}
Sie finden den Nutzernamen auch im Bereich „Details zum Lab“.
-
Klicken Sie auf Weiter.
-
Kopieren Sie das folgende Passwort und fügen Sie es in das Dialogfeld Willkommen ein.
{{{user_0.password | "Password"}}}
Sie finden das Passwort auch im Bereich „Details zum Lab“.
-
Klicken Sie auf Weiter.
Wichtig: Sie müssen die für das Lab bereitgestellten Anmeldedaten verwenden. Nutzen Sie nicht die Anmeldedaten Ihres Google Cloud-Kontos.
Hinweis: Wenn Sie Ihr eigenes Google Cloud-Konto für dieses Lab nutzen, können zusätzliche Kosten anfallen.
-
Klicken Sie sich durch die nachfolgenden Seiten:
- Akzeptieren Sie die Nutzungsbedingungen.
- Fügen Sie keine Wiederherstellungsoptionen oder Zwei-Faktor-Authentifizierung hinzu (da dies nur ein temporäres Konto ist).
- Melden Sie sich nicht für kostenlose Testversionen an.
Nach wenigen Augenblicken wird die Google Cloud Console in diesem Tab geöffnet.
Hinweis: Wenn Sie auf Google Cloud-Produkte und ‑Dienste zugreifen möchten, klicken Sie auf das Navigationsmenü oder geben Sie den Namen des Produkts oder Dienstes in das Feld Suchen ein.
Cloud Dataplex API aktivieren
-
Geben Sie in der Google Cloud Console oben in der Suchleiste Cloud Dataplex API ein.
-
Klicken Sie unter „Marketplace“ auf das Ergebnis für Cloud Dataplex API.
-
Klicken Sie auf AKTIVIEREN.
Aufgabe 1: Lake erstellen
In Dataplex Universal Catalog ist ein Lake die höchste Organisations-Domain, die einen bestimmten Datenbereich oder eine bestimmte Geschäftseinheit repräsentiert. Sie können beispielsweise für jede Abteilung bzw. Data Domain in Ihrem Unternehmen einen eigenen Data Lake erstellen, um so Daten für bestimmte Nutzergruppen zu organisieren und bereitzustellen.
In dieser Aufgabe erstellen Sie einen Lake, um mit dem Aufbau eines Data Mesh zu beginnen.
- Klicken Sie in der Google Cloud Console im Navigationsmenü (
) auf Alle Produkte ansehen. Wählen Sie unter Analysen die Option Dataplex Universal Catalog aus.
Wenn die Meldung Willkommen bei der neuen Dataplex Universal Catalog-Umgebung
angezeigt wird, klicken Sie auf Schließen.
-
Klicken Sie unter Lakes verwalten auf Verwalten.
-
Klicken Sie auf + Lake erstellen.
-
Geben Sie die erforderlichen Informationen ein, um einen neuen Data Lake zu erstellen:
Attribut |
Wert |
Anzeigename |
sensors |
ID |
Übernehmen Sie den Standardwert. |
Region |
|
Übernehmen Sie die anderen Standardwerte.
- Klicken Sie auf Erstellen.
Es kann bis zu 3 Minuten dauern, bis der Data Lake erstellt ist.
Klicken Sie auf Fortschritt prüfen.
sensors-Data Lake erstellen
Aufgabe 2: Zone zum Lake hinzufügen
Nachdem Sie einen Lake erstellt haben, können Sie ihm Zonen hinzufügen. Zonen sind Subdomains innerhalb eines Lakes, mit denen Sie Daten weiter kategorisieren können. Sie können Daten beispielsweise nach Phase, Nutzung oder Einschränkungen kategorisieren.
Es gibt zwei Arten von Zonen:
- Rohdatenzonen enthalten Daten in Rohformaten (z. B. Dateien in Cloud Storage-Buckets) und unterliegen keiner strikten Typ-Prüfung.
- Kuratierte Zonen enthalten Daten, die bereinigt und formatiert wurden und für Analysen wie mit BigQuery-Tabellen bereitstehen.
In dieser Aufgabe erstellen Sie eine Rohdatenzone für die Arbeit mit Dateien in einem Cloud Storage-Bucket.
-
Klicken Sie auf dem Tab Verwalten auf den Namen Ihres Lake.
-
Klicken Sie auf + Zone hinzufügen.
-
Geben Sie die erforderlichen Informationen ein, um eine neue Zone zu erstellen:
Attribut |
Wert |
Anzeigename |
temperature raw data |
ID |
Übernehmen Sie den Standardwert. |
Typ |
Rohdatenzone |
Datenstandorte |
Regional |
Übernehmen Sie die anderen Standardwerte.
Beispielsweise ist unter Erkennungseinstellungen die Option Metadatenerkennung aktivieren standardmäßig aktiviert. Dadurch können autorisierte Nutzer die Daten in der Zone sehen.
- Klicken Sie auf Erstellen.
Es kann bis zu 2 Minuten dauern, bis die Zone erstellt ist.
Sie können mit der nächsten Aufgabe fortfahren, sobald der Status der Zone Aktiv lautet.
Klicken Sie auf Fortschritt prüfen.
Fügen Sie den Lake-Sensoren die Zone temperature raw data hinzu.
Aufgabe 3: Asset an eine Zone anhängen
In Cloud Storage-Buckets oder BigQuery-Datasets gespeicherte Daten können an Zonen in einem Dataplex Universal Catalog-Lake als Assets angehängt werden.
In dieser Aufgabe hängen Sie einen Cloud Storage-Bucket an, den Sie zuvor in der Google Cloud Console erstellen werden.
-
Klicken Sie auf dem Tab Zonen auf den Namen Ihrer Zone.
-
Klicken Sie auf dem Tab Assets auf + ASSET HINZUFÜGEN.
-
Klicken Sie auf + ASSET HINZUFÜGEN.
-
Geben Sie die erforderlichen Informationen ein, um ein neues Asset anzuhängen:
Attribut |
Wert |
Typ |
Storage-Bucket |
Anzeigename |
measurements |
ID |
Übernehmen Sie den Standardwert. |
Übernehmen Sie die anderen Standardwerte.
- Klicken Sie unter Bucket auf Durchsuchen.
Sie können einen vorhandenen Cloud Storage-Bucket anhängen oder einen neuen erstellen, ohne Dataplex Universal Catalog zu verlassen. In den nächsten Schritten erstellen Sie einen neuen Cloud Storage-Bucket und hängen ihn an die Zone an.
-
Klicken Sie auf + Neuen Bucket erstellen (
).
-
Geben Sie Ihre Projekt-ID als Bucket-Namen ein () und klicken Sie auf Weiter.
-
Wählen Sie als Standorttyp die Option Region und dann aus.
Übernehmen Sie alle anderen Standardwerte.
- Klicken Sie auf Erstellen.
Wenn Sie dazu aufgefordert werden, klicken Sie im Dialogfeld Public access will be prevented
auf Bestätigen.
-
Klicken Sie auf Auswählen, um den gerade erstellten Bucket auszuwählen, und klicken Sie dann auf Weiter.
-
Wählen Sie unter Erkennungseinstellungen die Option Übernehmen aus, um die Erkennungseinstellungen auf Zonenebene zu übernehmen, und klicken Sie dann auf Weiter.
-
Klicken Sie auf Senden.
Klicken Sie auf Fortschritt prüfen.
Cloud Storage-Bucket erstellen und measurements-Asset an die Zone temperature raw data anhängen
Aufgabe 4: Assets, Zonen und Lakes löschen
Um einen Lake zu löschen, müssen Sie zuerst dessen Assets trennen und dann die Zonen löschen.
In dieser Aufgabe trennen Sie ein Asset von seiner Zone, löschen dann die Zone und schließlich den Lake.
Asset trennen
-
Klicken Sie im Menü auf der linken Seite auf den Tab Verwalten und dann auf den Namen Ihres Lakes.
-
Klicken Sie auf dem Tab Zonen auf den Namen Ihrer Zone.
-
Aktivieren Sie auf dem Tab Assets das Kästchen links neben dem Asset-Namen.
-
Klicken Sie auf Assets löschen.
-
Klicken Sie zur Bestätigung auf Löschen.
Die zugrunde liegenden Daten im Cloud Storage-Bucket werden dadurch nicht gelöscht. Es wird lediglich dafür gesorgt, dass der Cloud Storage-Bucket nicht mehr mithilfe des Lakes in Dataplex Universal Catalog zugänglich und auffindbar ist.
Zone löschen
-
Klicken Sie im Menü auf der linken Seite auf den Tab Verwalten und dann auf den Namen Ihres Lakes.
-
Klicken Sie auf dem Tab Zonen auf das Kästchen links neben dem Zonennamen.
-
Klicken Sie auf Zone löschen.
-
Klicken Sie zur Bestätigung auf Löschen.
Lake löschen
-
Klicken Sie im Menü auf der linken Seite auf den Tab Verwalten und dann auf den Namen Ihres Lakes.
-
Klicken Sie oben auf der Seite auf Löschen.
-
Bestätigen Sie das Löschen, indem Sie in das Textfeld delete eingeben.
-
Klicken Sie zur Bestätigung auf Lake löschen.
Klicken Sie auf Fortschritt prüfen.
Lake-sensors und verschachtelte Ressourcen löschen
Das wars! Sie haben das Lab erfolgreich abgeschlossen.
Sie haben mit der Google Cloud Console Lakes, Zonen und Assets in Dataplex Universal Catalog erstellt und gelöscht.
Google Cloud-Schulungen und -Zertifizierungen
In unseren Schulungen erfahren Sie alles zum optimalen Einsatz unserer Google Cloud-Technologien und können sich entsprechend zertifizieren lassen. Unsere Kurse vermitteln technische Fähigkeiten und Best Practices, damit Sie möglichst schnell mit Google Cloud loslegen und Ihr Wissen fortlaufend erweitern können. Wir bieten On-Demand-, Präsenz- und virtuelle Schulungen für Anfänger wie Fortgeschrittene an, die Sie individuell in Ihrem eigenen Zeitplan absolvieren können. Mit unseren Zertifizierungen weisen Sie nach, dass Sie Experte im Bereich Google Cloud-Technologien sind.
Anleitung zuletzt am 4. Juni 2025 aktualisiert
Lab zuletzt am 4. Juni 2025 getestet
© 2025 Google LLC. Alle Rechte vorbehalten. Google und das Google-Logo sind Marken von Google LLC. Alle anderen Unternehmens- und Produktnamen können Marken der jeweils mit ihnen verbundenen Unternehmen sein.