In diesem Lab wird beschrieben, wie Sie einen SQL-Workflow in Dataform erstellen und ausführen, um Daten in BigQuery zu laden.
Lernziele
Dataform-Repository erstellen
Entwicklungsarbeitsbereich für Dataform erstellen und initialisieren
SQL-Workflow erstellen und ausführen
Ausführungslogs in Dataform aufrufen
Einrichtung
Für jedes Lab werden Ihnen ein neues Google Cloud-Projekt und die entsprechenden Ressourcen für eine bestimmte Zeit kostenlos zur Verfügung gestellt.
Melden Sie sich über ein Inkognitofenster in Qwiklabs an.
Beachten Sie die Zugriffszeit (z. B. 1:15:00). Das Lab muss in dieser Zeit abgeschlossen werden.
Es gibt keine Pausenfunktion. Sie können bei Bedarf neu starten, müssen dann aber von vorn beginnen.
Wenn Sie bereit sind, klicken Sie auf Lab starten.
Notieren Sie sich Ihre Anmeldedaten (Nutzername und Passwort). Mit diesen Daten melden Sie sich in der Google Cloud Console an.
Klicken Sie auf Google Console öffnen.
Klicken Sie auf Anderes Konto verwenden. Kopieren Sie den Nutzernamen und das Passwort für dieses Lab und fügen Sie beides in die entsprechenden Felder ein.
Wenn Sie andere Anmeldedaten verwenden, tritt ein Fehler auf oder es fallen Kosten an.
Akzeptieren Sie die Nutzungsbedingungen und überspringen Sie die Seite zur Wiederherstellung der Ressourcen.
Aufgabe 1: Dataform-Repository erstellen
Erweitern Sie in der Console das Navigationsmenü und wählen Sie BigQuery > Dataform aus.
Klicken Sie auf Repository erstellen.
Führen Sie auf der Seite Repository erstellen die folgenden Schritte aus:
Geben Sie im Feld Repository-ID den Wert quickstart-repository ein.
Wählen Sie in der Liste Region die Option aus.
Klicken Sie auf Erstellen.
Nachdem das Repository erstellt wurde, wird Ihnen das Dataform-Dienstkonto angezeigt. Kopieren Sie diese ID, damit Sie sie später verwenden können, um die erforderlichen Berechtigungen zuzuweisen.
Klicken Sie auf Zu Repositories.
Hinweis: Wenn Sie einen Berechtigungsfehler im Zusammenhang mit der API-Anfrage erhalten, warten Sie einige Minuten und erstellen Sie das Repository dann noch einmal.
Abgeschlossene Aufgabe testen
Klicken Sie auf Fortschritt prüfen.
Dataform-Repository erstellen
Aufgabe 2: Entwicklungsarbeitsbereich für Dataform erstellen und initialisieren
Klicken Sie auf der Dataform-Seite auf das Repository quickstart-repository, das Sie gerade erstellt haben.
Klicken Sie auf Entwicklungsarbeitsbereich erstellen.
Führen Sie im Fenster Entwicklungsarbeitsbereich erstellen die folgenden Schritte aus:
Geben Sie im Feld Workspace-ID den Wert quickstart-workspace ein.
Klicken Sie auf Erstellen.
Klicken Sie dann auf den Entwicklungsarbeitsbereich quickstart-workspace.
Klicken Sie auf Arbeitsbereich initialisieren.
Abgeschlossene Aufgabe testen
Klicken Sie auf Fortschritt prüfen.
Dataform-Arbeitsbereich erstellen
Aufgabe 3: SQLX-Datei zur Definition einer Ansicht erstellen
In diesem Abschnitt definieren Sie eine Ansicht, die Sie später als Datenquelle für eine Tabelle verwenden.
Klicken Sie im Bereich Dateien neben definitions auf das Menü Mehr.
Klicken Sie auf Datei erstellen.
Führen Sie im Bereich Neue Datei erstellen die folgenden Schritte aus:
Geben Sie im Feld Dateipfad hinzufügendefinitions/quickstart-source.sqlx ein.
Klicken Sie auf Datei erstellen.
Ansicht definieren
Maximieren Sie im Bereich Dateien den Ordner definitions.
Klicken Sie auf quickstart-source.sqlx.
Geben Sie in die Datei das folgende Code-Snippet ein:
config {
type: "view"
}
SELECT
"apples" AS fruit,
2 AS count
UNION ALL
SELECT
"oranges" AS fruit,
5 AS count
UNION ALL
SELECT
"pears" AS fruit,
1 AS count
UNION ALL
SELECT
"bananas" AS fruit,
0 AS count
Aufgabe 4: SQLX-Datei für Tabellendefinition erstellen
In den folgenden Abschnitten definieren Sie den Tabellentyp in einer SQLX-Datei und schreiben dann eine SELECT-Anweisung, um die Tabellenstruktur in dieser Datei zu definieren.
Klicken Sie im Bereich Dateien neben definitions auf das Menü Mehr und wählen Sie Datei erstellen aus.
Geben Sie im Feld Dateipfad hinzufügendefinitions/quickstart-table.sqlx ein.
Klicken Sie auf Datei erstellen.
Tabellentyp, Struktur und Abhängigkeiten definieren
Maximieren Sie im Bereich Dateien das Verzeichnis definitions.
Wählen Sie quickstart-table.sqlx aus und geben Sie dann den folgenden Tabellentyp und die SELECT-Anweisung ein:
config {
type: "table"
}
SELECT
fruit,
SUM(count) as count
FROM ${ref("quickstart-source")}
GROUP BY 1
Hinweis: Im Abschnitt mit den kompilierten Abfragen wird möglicherweise ein Fehlerhinweis angezeigt. Ignorieren Sie die Meldung und fahren Sie mit den weiteren Schritten zur Ausführung des Workflows fort.
Aufgabe 5: Dataform Zugriff auf BigQuery gewähren
Klicken Sie in der Google Cloud Console im Navigationsmenü () auf IAM und Verwaltung > IAM.
Klicken Sie auf Nach Hauptkonten ansehen. Klicken Sie auf Zugriff gewähren.
Geben Sie im Feld Neue Hauptkonten die ID Ihres Dataform-Dienstkontos ein.
Wählen Sie in der Drop-down-Liste Rolle auswählen die Rolle BigQuery Job User aus.
Klicken Sie auf Weitere Rolle hinzufügen und wählen Sie in der Drop-down-Liste Rolle auswählen die Rolle BigQuery Data Editor aus.
Klicken Sie auf Weitere Rolle hinzufügen und wählen Sie in der Drop-down-Liste Rolle auswählen die Rolle BigQuery Data Viewer aus.
Klicken Sie auf Speichern.
Abgeschlossene Aufgabe testen
Klicken Sie auf Fortschritt prüfen.
Dataform Zugriff auf BigQuery gewähren
Aufgabe 6: Workflow ausführen
Klicken Sie in der Console auf Navigationsmenü > BigQuery > Dataform.
Klicken Sie auf quickstart-repository, um das Repository zu öffnen.
Klicken Sie auf quickstart-workspace, um den Entwicklungsarbeitsbereich zu öffnen.
Klicken Sie auf der Seite quickstart-workspace auf Ausführung starten.
Klicken Sie auf Aktionen ausführen.
Klicken Sie auf den Tab Alle Aktionen.
Klicken Sie im Bereich Ausführung auf Ausführung starten.
Dataform verwendet die Standard-Repository-Einstellungen, um den Inhalt Ihres Workflows in einem BigQuery-Dataset mit dem Namen dataform zu erstellen.
Abgeschlossene Aufgabe testen
Klicken Sie auf Fortschritt prüfen.
SQL-Workflow erstellen und ausführen
Ausführungsprotokolle ansehen
Klicken Sie auf der Seite quickstart-workspace auf Ausführungen, um den Bereich „Ausführungen“ zu öffnen.
Klicken Sie auf die letzte Ausführung, um deren Details aufzurufen.
Lab beenden
Wenn Sie das Lab abgeschlossen haben, klicken Sie auf Lab beenden. Qwiklabs entfernt daraufhin die von Ihnen genutzten Ressourcen und bereinigt das Konto.
Anschließend erhalten Sie die Möglichkeit, das Lab zu bewerten. Wählen Sie die entsprechende Anzahl von Sternen aus, schreiben Sie einen Kommentar und klicken Sie anschließend auf Senden.
Die Anzahl der Sterne hat folgende Bedeutung:
1 Stern = Sehr unzufrieden
2 Sterne = Unzufrieden
3 Sterne = Neutral
4 Sterne = Zufrieden
5 Sterne = Sehr zufrieden
Wenn Sie kein Feedback geben möchten, können Sie das Dialogfeld einfach schließen.
Verwenden Sie für Feedback, Vorschläge oder Korrekturen den Tab Support.
Labs erstellen ein Google Cloud-Projekt und Ressourcen für einen bestimmten Zeitraum
Labs haben ein Zeitlimit und keine Pausenfunktion. Wenn Sie das Lab beenden, müssen Sie von vorne beginnen.
Klicken Sie links oben auf dem Bildschirm auf Lab starten, um zu beginnen
Privates Surfen verwenden
Kopieren Sie den bereitgestellten Nutzernamen und das Passwort für das Lab
Klicken Sie im privaten Modus auf Konsole öffnen
In der Konsole anmelden
Melden Sie sich mit Ihren Lab-Anmeldedaten an. Wenn Sie andere Anmeldedaten verwenden, kann dies zu Fehlern führen oder es fallen Kosten an.
Akzeptieren Sie die Nutzungsbedingungen und überspringen Sie die Seite zur Wiederherstellung der Ressourcen
Klicken Sie erst auf Lab beenden, wenn Sie das Lab abgeschlossen haben oder es neu starten möchten. Andernfalls werden Ihre bisherige Arbeit und das Projekt gelöscht.
Diese Inhalte sind derzeit nicht verfügbar
Bei Verfügbarkeit des Labs benachrichtigen wir Sie per E-Mail
Sehr gut!
Bei Verfügbarkeit kontaktieren wir Sie per E-Mail
Es ist immer nur ein Lab möglich
Bestätigen Sie, dass Sie alle vorhandenen Labs beenden und dieses Lab starten möchten
Privates Surfen für das Lab verwenden
Nutzen Sie den privaten oder Inkognitomodus, um dieses Lab durchzuführen. So wird verhindert, dass es zu Konflikten zwischen Ihrem persönlichen Konto und dem Teilnehmerkonto kommt und zusätzliche Gebühren für Ihr persönliches Konto erhoben werden.
In diesem Lab wird beschrieben, wie Sie einen SQL-Workflow in Dataform erstellen und ausführen, um Daten in BigQuery zu laden.