GSP1248

Übersicht
In diesem Lab erfahren Sie, wie Sie einen Workflow zur Bildklassifizierung in BigQuery mit GoogleSQL-Abfragen und einem importierten, im ONNX-Format erstellten PyTorch-Modell optimieren.
Als neuer Datenanalyst bei Cymbal Media and Entertainment sollen Sie mit einem importierten Modell und BigQuery Machine Learning für Inferenzen experimentieren, um Wildtieraufnahmen zu klassifizieren. Ziel dieses Projekts ist es, den Prozess der Bildklassifizierung zu automatisieren, das Erstellen von Inhalten zu vereinfachen und eine größere Datenbank für zukünftige Wildtieraufnahmen auf der Streamingplattform von Cymbal zu erstellen.
ONNX ist ein offenes Format zur Darstellung von Machine-Learning-Modellen. ONNX definiert eine gemeinsame Menge von Operatoren, den Bausteinen von Machine-Learning- und Deep-Learning-Modellen. Es bietet ein gemeinsames Dateiformat, mit dem KI-Entwickler Modelle mit einer Vielzahl von Frameworks, Tools, Laufzeiten und Compilern nutzen können.
BigQuery ist eine vollständig verwaltete, KI-fähige Datenanalyseplattform, mit der Sie die Wertschöpfung aus Daten maximieren können. Sie ist als Multi-Engine-, Multi-Format- und Multi-Cloud-Plattform konzipiert. Ein zentrales Feature ist BigQuery Machine Learning für Inferenzen. Damit können Sie ML-Modelle (Machine Learning) mithilfe von SQL-Abfragen erstellen und ausführen.
ML-Modelle mit GoogleSQL-Abfragen ausführen
Normalerweise erfordert die Anwendung von ML oder künstlicher Intelligenz (KI) für große Datasets umfangreiche Programmier- und ML-Framework-Kenntnisse. Das beschränkt die Entwicklung von Lösungen in den meisten Unternehmen auf einen kleinen Personenkreis. Datenanalysten gehören in der Regel nicht dazu, da sie Daten zwar verstehen, aber ihre Kenntnisse in Sachen Programmierung und ML begrenzt sind. BigQuery ML bietet SQL-Experten jedoch die Möglichkeit, ihre vorhandenen Kenntnisse, Fertigkeiten und Tools zu nutzen. Sie können so Modelle erstellen und Ergebnisse aus Modellen generieren, die mit ONNX entwickelt und in einem Cloud Storage-Bucket gespeichert wurden. So haben Unternehmen aus MLOps-Sicht mehr Auswahl und Flexibilität bei Modellen. Außerdem können sie ihre ML-Initiativen besser skalieren.
Das Bild-Dataset
Die in diesem Lab verwendeten Bilder stammen aus dem Animals Detection Images Dataset von Kaggle.
Lernziele
Aufgaben in diesem Lab:
- Cloud-Ressourcenverbindung erstellen
- Dem Dienstkonto der Verbindung Berechtigungen gewähren
- BigQuery-Dataset und ‑Tabellen erstellen
- ONNX-Modell in BigQuery importieren
- Bilder mit dem importierten Modell klassifizieren
Einrichtung und Anforderungen
Vor dem Klick auf „Start Lab“ (Lab starten)
Lesen Sie diese Anleitung. Labs sind zeitlich begrenzt und können nicht pausiert werden. Der Timer beginnt zu laufen, wenn Sie auf Lab starten klicken, und zeigt Ihnen, wie lange Google Cloud-Ressourcen für das Lab verfügbar sind.
In diesem praxisorientierten Lab können Sie die Lab-Aktivitäten in einer echten Cloud-Umgebung durchführen – nicht in einer Simulations- oder Demo-Umgebung. Dazu erhalten Sie neue, temporäre Anmeldedaten, mit denen Sie für die Dauer des Labs auf Google Cloud zugreifen können.
Für dieses Lab benötigen Sie Folgendes:
- Einen Standardbrowser (empfohlen wird Chrome)
Hinweis: Nutzen Sie den privaten oder Inkognitomodus (empfohlen), um dieses Lab durchzuführen. So wird verhindert, dass es zu Konflikten zwischen Ihrem persönlichen Konto und dem Teilnehmerkonto kommt und zusätzliche Gebühren für Ihr persönliches Konto erhoben werden.
- Zeit für die Durchführung des Labs – denken Sie daran, dass Sie ein begonnenes Lab nicht unterbrechen können.
Hinweis: Verwenden Sie für dieses Lab nur das Teilnehmerkonto. Wenn Sie ein anderes Google Cloud-Konto verwenden, fallen dafür möglicherweise Kosten an.
Lab starten und bei der Google Cloud Console anmelden
-
Klicken Sie auf Lab starten. Wenn Sie für das Lab bezahlen müssen, wird ein Dialogfeld geöffnet, in dem Sie Ihre Zahlungsmethode auswählen können.
Auf der linken Seite befindet sich der Bereich „Details zum Lab“ mit diesen Informationen:
- Schaltfläche „Google Cloud Console öffnen“
- Restzeit
- Temporäre Anmeldedaten für das Lab
- Ggf. weitere Informationen für dieses Lab
-
Klicken Sie auf Google Cloud Console öffnen (oder klicken Sie mit der rechten Maustaste und wählen Sie Link in Inkognitofenster öffnen aus, wenn Sie Chrome verwenden).
Im Lab werden Ressourcen aktiviert. Anschließend wird ein weiterer Tab mit der Seite „Anmelden“ geöffnet.
Tipp: Ordnen Sie die Tabs nebeneinander in separaten Fenstern an.
Hinweis: Wird das Dialogfeld Konto auswählen angezeigt, klicken Sie auf Anderes Konto verwenden.
-
Kopieren Sie bei Bedarf den folgenden Nutzernamen und fügen Sie ihn in das Dialogfeld Anmelden ein.
{{{user_0.username | "Username"}}}
Sie finden den Nutzernamen auch im Bereich „Details zum Lab“.
-
Klicken Sie auf Weiter.
-
Kopieren Sie das folgende Passwort und fügen Sie es in das Dialogfeld Willkommen ein.
{{{user_0.password | "Password"}}}
Sie finden das Passwort auch im Bereich „Details zum Lab“.
-
Klicken Sie auf Weiter.
Wichtig: Sie müssen die für das Lab bereitgestellten Anmeldedaten verwenden. Nutzen Sie nicht die Anmeldedaten Ihres Google Cloud-Kontos.
Hinweis: Wenn Sie Ihr eigenes Google Cloud-Konto für dieses Lab nutzen, können zusätzliche Kosten anfallen.
-
Klicken Sie sich durch die nachfolgenden Seiten:
- Akzeptieren Sie die Nutzungsbedingungen.
- Fügen Sie keine Wiederherstellungsoptionen oder Zwei-Faktor-Authentifizierung hinzu (da dies nur ein temporäres Konto ist).
- Melden Sie sich nicht für kostenlose Testversionen an.
Nach wenigen Augenblicken wird die Google Cloud Console in diesem Tab geöffnet.
Hinweis: Wenn Sie auf Google Cloud-Produkte und ‑Dienste zugreifen möchten, klicken Sie auf das Navigationsmenü oder geben Sie den Namen des Produkts oder Dienstes in das Feld Suchen ein.
Aufgabe 1: Cloud-Ressourcenverbindung erstellen
In dieser Aufgabe erstellen Sie eine Cloud-Ressourcenverbindung in BigQuery, mit der Sie die Bilder aus Cloud Storage in die Objekttabelle in Ihrem Dataset importieren.
Hinweis: Erstellen Sie die Ressourcenverbindung mit der Google Cloud-Region, die im Lab-Leitfaden angegeben ist. Wir empfehlen, auch das Dataset in dieser Region zu erstellen, um Fehler im Lab zu reduzieren.
-
Klicken Sie in der Google Cloud Console im Navigationsmenü auf BigQuery.
-
Das Pop‑up-Fenster „Willkommen bei BigQuery“ wird angezeigt. Klicken Sie auf FERTIG.
-
Klicken Sie auf + HINZUFÜGEN und dann auf Verbindungen zu externen Datenquellen, um eine Verbindung zu erstellen.
-
Wählen Sie in der Liste „Verbindungstyp“ die Option Vertex AI-Remote-Modelle, Remote-Funktionen und BigLake (Cloud-Ressource) aus.
-
Geben Sie im Feld „Verbindungs-ID“ onnx_conn für Ihre Verbindung ein.
-
Wählen Sie als Standorttyp die Option Region aus.
-
Wählen Sie für die Region aus.
-
Klicken Sie auf VERBINDUNG ERSTELLEN.
-
Klicken Sie auf ZUR VERBINDUNG.
-
Die hinzugefügte Verbindung ist auch im BigQuery Explorer Ihres Projekts im Abschnitt „Externe Verbindungen“ enthalten. Kopieren Sie im Bereich „Verbindungsinformationen“ die Dienstkonto-ID in eine Textdatei für die nächste Aufgabe.
Klicken Sie auf Fortschritt prüfen.
Cloud-Ressourcenverbindung erstellen
Aufgabe 2: Bilder und Dateien überprüfen und dem Dienstkonto Zugriff gewähren
In dieser Aufgabe überprüfen Sie Bilder und Dateien (ONNX-Modell und die Datei „classifier.csv“) und gewähren dem Dienstkonto der Cloud-Ressourcenverbindung IAM-Berechtigungen.
Bilder und ONNX-Modell in Cloud Storage überprüfen
Bevor Sie in dieser Aufgabe dem Dienstkonto der Cloud-Ressourcenverbindung Berechtigungen gewähren, überprüfen Sie die Bilder, das Modell und die Datei „classifier.csv“, die im Cloud Storage-Bucket gespeichert sind.
-
Wählen Sie in der Cloud Console das Navigationsmenü (
) und dann Cloud Storage aus.
-
Klicken Sie auf den Bucket ‑bucket.
-
Der Bucket enthält den Ordner „gsp1248“. Öffnen Sie diesen Ordner. Darin sind drei Elemente enthalten:
- Der Ordner „images“ enthält alle Bilder, die Sie klassifizieren werden. Sie können auf den Ordner „images“ zugreifen und die Bilder überprüfen. Er enthält ein Bild von einem Löwen, einem schwarzen Schwan, einem Nilpferd, einem Schwarzbären und einer Königskrabbe.
- Die Datei „resnet18.onnx“ ist die Modelldatei. Sie importieren sie in BigQuery und verwenden sie dann in späteren Aufgaben.
- Die Datei „classifier.csv“ wird mit dem Modell in einer Abfrage verwendet, um die Bilder zu klassifizieren.
Dem Dienstkonto der Verbindung IAM-Berechtigungen gewähren
Gewähren Sie dem Dienstkonto der Ressourcenverbindung IAM-Berechtigungen, bevor Sie mit der Arbeit in BigQuery beginnen. Dadurch können Sie Fehler des Typs „Zugriff verweigert“ vermeiden.
-
Kehren Sie zum Stammverzeichnis des Buckets zurück.
-
Klicken Sie auf BERECHTIGUNGEN.
-
Klicken Sie auf ZUGRIFF GEWÄHREN.
-
Geben Sie im Feld Neue Hauptkonten die Dienstkonto-ID ein, die Sie zuvor kopiert haben.
-
Geben Sie im Feld „Rolle auswählen“ Storage Object ein und wählen Sie die Rolle Storage Object Admin aus.
-
Klicken Sie auf Speichern.
Die Dienstkonto-ID beinhaltet nun die Rolle „Storage Object Admin“.
Klicken Sie auf Fortschritt prüfen.
Dem Dienstkonto der Verbindung IAM-Berechtigungen gewähren
Aufgabe 3: Dataset und Tabellen in BigQuery erstellen
In dieser Aufgabe erstellen Sie ein Dataset für das Projekt, eine Objekttabelle zum Speichern der Bilder und eine Tabelle für die Klassifizierungsliste.
Dataset erstellen
-
Klicken Sie in der Google Cloud Console auf das Navigationsmenü (
) und dann auf BigQuery.
-
Wählen Sie im Bereich Explorer unter die Option Aktionen ansehen (
) und dann Dataset erstellen.
Sie erstellen ein Dataset, um Datenbankobjekte zu speichern, einschließlich Tabellen und Modellen.
-
Geben Sie im Bereich Dataset erstellen die folgenden Informationen ein:
Feld |
Wert |
Dataset-ID |
onnx_demo |
Standorttyp |
auswählen |
Übernehmen Sie für alle anderen Felder die Standardeinstellung.
-
Klicken Sie auf Dataset erstellen.
Das Dataset „onnx_demo“ wird nun erstellt und unter Ihrem Projekt im BigQuery Explorer aufgeführt.
Objekttabelle für die Bilder erstellen
Nachdem das Dataset erstellt wurde, können Sie nun die Objekttabelle erstellen, die auf die Bilder im Bucket verweist.
Zum Erstellen der Objekttabelle verwenden Sie eine SQL-Abfrage.
-
Klicken Sie auf das Symbol „+“, um eine neue SQL-Abfrage zu erstellen.
-
Kopieren Sie die folgende Abfrage und fügen Sie sie in den Abfrageeditor ein.
CREATE OR REPLACE EXTERNAL TABLE
`onnx_demo.wildlife`
WITH CONNECTION `{{{project_0.default_region|lab region}}}.onnx_conn`
OPTIONS (
object_metadata = 'SIMPLE',
uris = ['gs://{{{project_0.project_id|set at lab start}}}-bucket/gsp1248/images/*']
);
-
Führen Sie die Abfrage aus.
Die Objekttabelle „wildlife“ wurde dem Dataset „onnx_demo“ hinzugefügt und mit dem URI (dem Cloud-Storage-Standort) jedes Tierbilds geladen.
-
Klicken Sie im Explorer auf die Tabelle wildlife und überprüfen Sie das Schema sowie die Details.
Tabelle für die Klassifizierungsliste erstellen
Zum Erstellen der Liste der Tabellenklassifizierungen führen Sie eine SQL-Abfrage durch.
-
Klicken Sie auf das Symbol „+“, um eine neue SQL-Abfrage zu erstellen.
-
Kopieren Sie die folgende Abfrage und fügen Sie sie in den Abfrageeditor ein.
LOAD DATA OVERWRITE onnx_demo.classifier
(ID INT64,Classification STRING)
FROM FILES (
format = 'CSV',
uris = ['gs://{{{project_0.project_id|set at lab start}}}-bucket/gsp1248/classifier.csv']);
-
Führen Sie die Abfrage aus.
Die Klassifikatortabelle wurde dem Dataset „onnx_demo“ hinzugefügt. Alle Elemente im Dataset werden mit der ID und der Klassifizierung in die Tabelle geladen. Dazu gehören auch die Wildtiere, die Sie später im Lab klassifizieren werden.
-
Klicken Sie im Explorer auf die Tabelle classifier und überprüfen Sie das Schema sowie die Details. Sie können nun zur Überprüfung der Klassifizierung einzelner Elemente die Tabelle abfragen. Hinweis: Die Tabelle enthält auch viele andere Tiere, nicht nur Wildtiere (z. B. Fische, Insekten, Vögel).
Klicken Sie auf Fortschritt prüfen.
Dataset und Tabellen in BigQuery erstellen
Aufgabe 4: Modell in BigQuery importieren
In dieser Aufgabe importieren Sie das ONNX-Modell „resnet18“ in BigQuery, damit Sie es zum Klassifizieren von Bildern verwenden können.
-
Klicken Sie auf das Symbol „+“, um eine neue SQL-Abfrage zu erstellen.
-
Kopieren Sie die folgende Abfrage und fügen Sie sie in den Abfrageeditor ein.
CREATE OR REPLACE MODEL `onnx_demo.model`
OPTIONS (MODEL_TYPE='ONNX',
MODEL_PATH='gs://{{{project_0.project_id|set at lab start}}}-bucket/gsp1248/resnet18.onnx')
-
Führen Sie die Abfrage aus.
Das Modell wird dem Dataset „onnx_demo“ im Abschnitt „Modelle“ hinzugefügt.
-
Klicken Sie im Explorer auf das Modell und überprüfen Sie die Details.
Klicken Sie auf Fortschritt prüfen.
Modell in BigQuery importieren
Aufgabe 5: Bilder mit dem importierten ONNX-Modell klassifizieren
In dieser Aufgabe reservieren Sie einen Slot, weisen ihn Ihrem Projekt zu und verwenden eine Abfrage, um neue Bilder mit dem ONNX-Modell zu klassifizieren.
Slotreservierung hinzufügen
Damit Sie das ONNX-Modell verwenden können, müssen Sie eine Slotreservierung erstellen und sie Ihrem Projekt zuweisen.
-
Klicken Sie im BigQuery-Menü auf Kapazitätsverwaltung.
-
Klicken Sie auf der Seite „Kapazitätsverwaltung“ auf RESERVIERUNG ERSTELLEN.
-
Geben Sie auf der Seite „Reservierung erstellen“ reservation
als Namen der Reservierung ein.
-
Wählen Sie für den Standort aus.
-
Wählen Sie unter „Maximale Reservierungsgröße“ die Option Klein (100 Slots) aus.
-
Klicken Sie auf SPEICHERN.
Weisen Sie die Slotreservierung Ihrem Projekt zu.
-
Klicken Sie für Ihre Reservierung auf die Schaltfläche Reservierungsaktionen (Aktionen ansehen).
-
Klicken Sie im Pop‑up-Menü auf Zuweisung erstellen.
-
Im Pop‑up-Fenster „Zuweisung erstellen“ ist der Jobtyp standardmäßig auf „ABFRAGE“ festgelegt. Übernehmen Sie diese Option.
-
Klicken Sie auf DURCHSUCHEN.
-
Wählen Sie im Pop‑up-Fenster den Projektnamen aus. Das Projekt wird dem Feld „Organisation, Ordner oder Projekt auswählen“ hinzugefügt.
-
Klicken Sie auf ERSTELLEN.
Das Projekt wird dann der Slotreservierung zugewiesen, die Sie gerade erstellt haben.
-
Warten Sie 2 Minuten. Die Zuweisung der Slotreservierung ist für das Konto erst nach einer gewissen Zeit wirksam.
Mit dem Modell Bilder klassifizieren
-
Kehren Sie zu BigQuery Studio zurück.
-
Klicken Sie auf das Symbol „+“, um eine neue SQL-Abfrage zu erstellen.
-
Kopieren Sie die folgende Abfrage und fügen Sie sie in den Abfrageeditor ein.
SELECT * FROM `{{{project_0.project_id|set at lab start}}}.onnx_demo.classifier`
WHERE EXISTS (
SELECT
1
FROM
ML.PREDICT(MODEL onnx_demo.model,
(
SELECT
ML.RESIZE_IMAGE(ML.DECODE_IMAGE(DATA),
224,
224,
FALSE) AS input
FROM
`onnx_demo.wildlife`
)
)
WHERE
class_label = ID - 1
)
-
Führen Sie die Abfrage aus.
Die Bilder werden nun in Zeilen mit der ID und der vorhergesagten Klassifizierung basierend auf dem ONNX-Modell klassifiziert.
Klicken Sie auf Fortschritt prüfen.
Bilder mit dem importierten ONNX-Modell klassifizieren
Glückwunsch!
Sie haben eine Cloud-Ressourcenverbindung erstellt, dem Dienstkonto für die Verbindung Zugriff gewährt, ein Dataset und Tabellen erstellt, ein ONNX-Modell in BigQuery importiert und Bilder mithilfe des Modells klassifiziert.
Weitere Informationen
Google Cloud-Schulungen und -Zertifizierungen
In unseren Schulungen erfahren Sie alles zum optimalen Einsatz unserer Google Cloud-Technologien und können sich entsprechend zertifizieren lassen. Unsere Kurse vermitteln technische Fähigkeiten und Best Practices, damit Sie möglichst schnell mit Google Cloud loslegen und Ihr Wissen fortlaufend erweitern können. Wir bieten On-Demand-, Präsenz- und virtuelle Schulungen für Anfänger wie Fortgeschrittene an, die Sie individuell in Ihrem eigenen Zeitplan absolvieren können. Mit unseren Zertifizierungen weisen Sie nach, dass Sie Experte im Bereich Google Cloud-Technologien sind.
Anleitung zuletzt am 24. Mai 2024 aktualisiert
Lab zuletzt am 24. Mai 2024 getestet
© 2025 Google LLC. Alle Rechte vorbehalten. Google und das Google-Logo sind Marken von Google LLC. Alle anderen Unternehmens- und Produktnamen können Marken der jeweils mit ihnen verbundenen Unternehmen sein.