arrow_back

SQL-Workflow in Dataform erstellen und ausführen

Anmelden Teilnehmen
Zugriff auf über 700 Labs und Kurse nutzen

SQL-Workflow in Dataform erstellen und ausführen

Lab 1 Stunde universal_currency_alt 1 Guthabenpunkt show_chart Einsteiger
info Dieses Lab kann KI-Tools enthalten, die den Lernprozess unterstützen.
Zugriff auf über 700 Labs und Kurse nutzen

Übersicht

In diesem Lab wird beschrieben, wie Sie einen SQL-Workflow in Dataform erstellen und ausführen, um Daten in BigQuery zu laden.

Lernziele

  1. Dataform-Repository erstellen
  2. Entwicklungsarbeitsbereich für Dataform erstellen und initialisieren
  3. SQL-Workflow erstellen und ausführen
  4. Ausführungslogs in Dataform aufrufen

Einrichtung

Für jedes Lab werden Ihnen ein neues Google Cloud-Projekt und die entsprechenden Ressourcen für eine bestimmte Zeit kostenlos zur Verfügung gestellt.

  1. Melden Sie sich über ein Inkognitofenster in Qwiklabs an.

  2. Beachten Sie die Zugriffszeit (z. B. 1:15:00). Das Lab muss in dieser Zeit abgeschlossen werden.
    Es gibt keine Pausenfunktion. Sie können bei Bedarf neu starten, müssen dann aber von vorn beginnen.

  3. Wenn Sie bereit sind, klicken Sie auf Lab starten.

  4. Notieren Sie sich Ihre Anmeldedaten (Nutzername und Passwort). Mit diesen Daten melden Sie sich in der Google Cloud Console an.

  5. Klicken Sie auf Google Console öffnen.

  6. Klicken Sie auf Anderes Konto verwenden. Kopieren Sie den Nutzernamen und das Passwort für dieses Lab und fügen Sie beides in die entsprechenden Felder ein.
    Wenn Sie andere Anmeldedaten verwenden, tritt ein Fehler auf oder es fallen Kosten an.

  7. Akzeptieren Sie die Nutzungsbedingungen und überspringen Sie die Seite zur Wiederherstellung der Ressourcen.

Aufgabe 1: Dataform-Repository erstellen

  1. Erweitern Sie in der Console das Navigationsmenü und wählen Sie BigQuery > Dataform aus.

  2. Klicken Sie auf Repository erstellen.

  3. Führen Sie auf der Seite Repository erstellen die folgenden Schritte aus:

    1. Geben Sie im Feld Repository-ID den Wert quickstart-repository ein.

    2. Wählen Sie in der Liste Region die Option aus.

    3. Klicken Sie auf Erstellen.

    4. Nachdem das Repository erstellt wurde, wird Ihnen das Dataform-Dienstkonto angezeigt. Kopieren Sie diese ID, damit Sie sie später verwenden können, um die erforderlichen Berechtigungen zuzuweisen.

    5. Klicken Sie auf Zu Repositories.

Hinweis: Wenn Sie einen Berechtigungsfehler im Zusammenhang mit der API-Anfrage erhalten, warten Sie einige Minuten und erstellen Sie das Repository dann noch einmal.

Abgeschlossene Aufgabe testen

Klicken Sie auf Fortschritt prüfen.

Dataform-Repository erstellen

Aufgabe 2: Entwicklungsarbeitsbereich für Dataform erstellen und initialisieren

  1. Klicken Sie auf der Dataform-Seite auf das Repository quickstart-repository, das Sie gerade erstellt haben.

  2. Klicken Sie auf Entwicklungsarbeitsbereich erstellen.

  3. Führen Sie im Fenster Entwicklungsarbeitsbereich erstellen die folgenden Schritte aus:

    1. Geben Sie im Feld Workspace-ID den Wert quickstart-workspace ein.

    2. Klicken Sie auf Erstellen.

  4. Klicken Sie dann auf den Entwicklungsarbeitsbereich quickstart-workspace.

  5. Klicken Sie auf Arbeitsbereich initialisieren.

Abgeschlossene Aufgabe testen

Klicken Sie auf Fortschritt prüfen.

Dataform-Arbeitsbereich erstellen

Aufgabe 3: SQLX-Datei zur Definition einer Ansicht erstellen

In diesem Abschnitt definieren Sie eine Ansicht, die Sie später als Datenquelle für eine Tabelle verwenden.

  1. Klicken Sie im Bereich Dateien neben definitions auf das Menü Mehr.

  2. Klicken Sie auf Datei erstellen.

  3. Führen Sie im Bereich Neue Datei erstellen die folgenden Schritte aus:

    1. Geben Sie im Feld Dateipfad hinzufügen definitions/quickstart-source.sqlx ein.

    2. Klicken Sie auf Datei erstellen.

Ansicht definieren

  1. Maximieren Sie im Bereich Dateien den Ordner definitions.

  2. Klicken Sie auf quickstart-source.sqlx.

  3. Geben Sie in die Datei das folgende Code-Snippet ein:

    config { type: "view" } SELECT "apples" AS fruit, 2 AS count UNION ALL SELECT "oranges" AS fruit, 5 AS count UNION ALL SELECT "pears" AS fruit, 1 AS count UNION ALL SELECT "bananas" AS fruit, 0 AS count

Aufgabe 4: SQLX-Datei für Tabellendefinition erstellen

In den folgenden Abschnitten definieren Sie den Tabellentyp in einer SQLX-Datei und schreiben dann eine SELECT-Anweisung, um die Tabellenstruktur in dieser Datei zu definieren.

  1. Klicken Sie im Bereich Dateien neben definitions auf das Menü Mehr und wählen Sie Datei erstellen aus.

  2. Geben Sie im Feld Dateipfad hinzufügen definitions/quickstart-table.sqlx ein.

  3. Klicken Sie auf Datei erstellen.

Tabellentyp, Struktur und Abhängigkeiten definieren

  1. Maximieren Sie im Bereich Dateien das Verzeichnis definitions.

  2. Wählen Sie quickstart-table.sqlx aus und geben Sie dann den folgenden Tabellentyp und die SELECT-Anweisung ein:

    config { type: "table" } SELECT fruit, SUM(count) as count FROM ${ref("quickstart-source")} GROUP BY 1
Hinweis: Im Abschnitt mit den kompilierten Abfragen wird möglicherweise ein Fehlerhinweis angezeigt. Ignorieren Sie die Meldung und fahren Sie mit den weiteren Schritten zur Ausführung des Workflows fort.

Aufgabe 5: Dataform Zugriff auf BigQuery gewähren

  1. Klicken Sie in der Google Cloud Console im Navigationsmenü (Symbol für Navigationsmenü) auf IAM und Verwaltung > IAM.

  2. Klicken Sie auf Nach Hauptkonten ansehen. Klicken Sie auf Zugriff gewähren.

  3. Geben Sie im Feld Neue Hauptkonten die ID Ihres Dataform-Dienstkontos ein.

  4. Wählen Sie in der Drop-down-Liste Rolle auswählen die Rolle BigQuery Job User aus.

  5. Klicken Sie auf Weitere Rolle hinzufügen und wählen Sie in der Drop-down-Liste Rolle auswählen die Rolle BigQuery Data Editor aus.

  6. Klicken Sie auf Weitere Rolle hinzufügen und wählen Sie in der Drop-down-Liste Rolle auswählen die Rolle BigQuery Data Viewer aus.

  7. Klicken Sie auf Speichern.

Abgeschlossene Aufgabe testen

Klicken Sie auf Fortschritt prüfen.

Dataform Zugriff auf BigQuery gewähren

Aufgabe 6: Workflow ausführen

  1. Klicken Sie in der Console auf Navigationsmenü > BigQuery > Dataform.

  2. Klicken Sie auf quickstart-repository, um das Repository zu öffnen.

  3. Klicken Sie auf quickstart-workspace, um den Entwicklungsarbeitsbereich zu öffnen.

  4. Klicken Sie auf der Seite quickstart-workspace auf Ausführung starten.

  5. Klicken Sie auf Aktionen ausführen.

  6. Klicken Sie auf den Tab Alle Aktionen.

  7. Klicken Sie im Bereich Ausführung auf Ausführung starten.

    Dataform verwendet die Standard-Repository-Einstellungen, um den Inhalt Ihres Workflows in einem BigQuery-Dataset mit dem Namen dataform zu erstellen.

Abgeschlossene Aufgabe testen

Klicken Sie auf Fortschritt prüfen.

SQL-Workflow erstellen und ausführen

Ausführungsprotokolle ansehen

  1. Klicken Sie auf der Seite quickstart-workspace auf Ausführungen, um den Bereich „Ausführungen“ zu öffnen.

  2. Klicken Sie auf die letzte Ausführung, um deren Details aufzurufen.

Lab beenden

Wenn Sie das Lab abgeschlossen haben, klicken Sie auf Lab beenden. Qwiklabs entfernt daraufhin die von Ihnen genutzten Ressourcen und bereinigt das Konto.

Anschließend erhalten Sie die Möglichkeit, das Lab zu bewerten. Wählen Sie die entsprechende Anzahl von Sternen aus, schreiben Sie einen Kommentar und klicken Sie anschließend auf Senden.

Die Anzahl der Sterne hat folgende Bedeutung:

  • 1 Stern = Sehr unzufrieden
  • 2 Sterne = Unzufrieden
  • 3 Sterne = Neutral
  • 4 Sterne = Zufrieden
  • 5 Sterne = Sehr zufrieden

Wenn Sie kein Feedback geben möchten, können Sie das Dialogfeld einfach schließen.

Verwenden Sie für Feedback, Vorschläge oder Korrekturen den Tab Support.

© 2022 Google LLC. Alle Rechte vorbehalten. Google und das Google-Logo sind Marken von Google LLC. Alle anderen Unternehmens - und Produktnamen können Marken der jeweils mit ihnen verbundenen Unternehmen sein.

Vorbereitung

  1. Labs erstellen ein Google Cloud-Projekt und Ressourcen für einen bestimmten Zeitraum
  2. Labs haben ein Zeitlimit und keine Pausenfunktion. Wenn Sie das Lab beenden, müssen Sie von vorne beginnen.
  3. Klicken Sie links oben auf dem Bildschirm auf Lab starten, um zu beginnen

Privates Surfen verwenden

  1. Kopieren Sie den bereitgestellten Nutzernamen und das Passwort für das Lab
  2. Klicken Sie im privaten Modus auf Konsole öffnen

In der Konsole anmelden

  1. Melden Sie sich mit Ihren Lab-Anmeldedaten an. Wenn Sie andere Anmeldedaten verwenden, kann dies zu Fehlern führen oder es fallen Kosten an.
  2. Akzeptieren Sie die Nutzungsbedingungen und überspringen Sie die Seite zur Wiederherstellung der Ressourcen
  3. Klicken Sie erst auf Lab beenden, wenn Sie das Lab abgeschlossen haben oder es neu starten möchten. Andernfalls werden Ihre bisherige Arbeit und das Projekt gelöscht.

Diese Inhalte sind derzeit nicht verfügbar

Bei Verfügbarkeit des Labs benachrichtigen wir Sie per E-Mail

Sehr gut!

Bei Verfügbarkeit kontaktieren wir Sie per E-Mail

Es ist immer nur ein Lab möglich

Bestätigen Sie, dass Sie alle vorhandenen Labs beenden und dieses Lab starten möchten

Privates Surfen für das Lab verwenden

Nutzen Sie den privaten oder Inkognitomodus, um dieses Lab durchzuführen. So wird verhindert, dass es zu Konflikten zwischen Ihrem persönlichen Konto und dem Teilnehmerkonto kommt und zusätzliche Gebühren für Ihr persönliches Konto erhoben werden.