Mit Imagen in Vertex AI eine Anwendung zur KI-Bildgenerierung erstellen
Lab
15 Minuten
universal_currency_alt
Keine Kosten
show_chart
Einsteiger
info
Dieses Lab kann KI-Tools enthalten, die den Lernprozess unterstützen.
Zugriff auf über 700 Labs und Kurse nutzen
bb-ide-genai-002

Übersicht
- Labs sind zeitlich begrenzt und können nicht pausiert werden. Der Timer beginnt zu laufen, wenn Sie auf Lab starten klicken.
- Das enthaltene Cloud-Terminal ist mit dem gcloud SDK vorkonfiguriert.
- Führen Sie Befehle über das Terminal aus und klicken Sie dann auf Fortschritt prüfen, um Ihre Arbeit zu überprüfen.
Ziel
Generative KI (auch als GenAI bezeichnet) in Vertex AI ermöglicht Ihnen Zugriff auf die großen generativen KI-Modelle von Google. So können Sie diese testen, abstimmen und in Ihren KI-basierten Anwendungen nutzen. Aufgaben in diesem Lab:
-
Verbindung zu Vertex AI (KI-Plattform von Google Cloud) herstellen: Sie lernen, wie Sie mit dem Vertex AI SDK eine Verbindung zu den KI-Diensten von Google herstellen.
-
Vortrainiertes Modell zur Bildgenerierung laden : Sie erfahren, wie Sie ein leistungsstarkes, vortrainiertes KI-Modell verwenden können, ohne es von Grund auf neu zu erstellen.
-
Text an das KI-Modell senden: Sie lernen, Eingaben bereitzustellen, die von der KI verarbeitet werden können.
-
Bildbasierte Antworten aus der KI extrahieren: Sie erfahren, wie Sie die vom KI-Modell generierten Bildantworten verarbeiten und interpretieren.
-
Grundlagen für das Erstellen von KI-Anwendungen: Sie erhalten Einblicke in die wichtigsten Konzepte für die Integration von KI in Softwareprojekte.
Arbeiten mit generativer KI
Wenn Sie das Lab starten, wird Ihnen eine Ansicht mit zwei Bereichen angezeigt: links sehen Sie den Code-Editor und rechts die Lab-Anleitung. Führen Sie folgenden Schritte aus, um mithilfe des Vertex AI Python SDK mit den APIs für generative KI zu interagieren.
- Klicken Sie auf Datei > Neue Datei, um eine neue Datei im Code-Editor zu öffnen.
- Kopieren Sie das bereitgestellte Code-Snippet und fügen Sie es in Ihre Datei ein.
import argparse
import vertexai
from vertexai.preview.vision_models import ImageGenerationModel
def generate_image(
project_id: str, location: str, output_file: str, prompt: str
) -> vertexai.preview.vision_models.ImageGenerationResponse:
"""Generate an image using a text prompt.
Args:
project_id: Google Cloud project ID, used to initialize Vertex AI.
location: Google Cloud region, used to initialize Vertex AI.
output_file: Local path to the output image file.
prompt: The text prompt describing what you want to see."""
vertexai.init(project=project_id, location=location)
model = ImageGenerationModel.from_pretrained("imagen-3.0-generate-002")
images = model.generate_images(
prompt=prompt,
# Optional parameters
number_of_images=1,
seed=1,
add_watermark=False,
)
images[0].save(location=output_file)
return images
generate_image(
project_id='{{{ project_0.project_id | "project-id" }}}',
location='{{{ project_0.default_region | "REGION" }}}',
output_file='image.jpeg',
prompt='Create an image of a cricket ground in the heart of Los Angeles',
)
- Klicken Sie auf Datei > Speichern, geben Sie
GenerateImage.py
in das Feld „Name“ ein und klicken Sie auf Speichern.
- Führen Sie die Python-Datei aus, indem Sie auf das Dreieckssymbol im Code-Editor klicken oder den folgenden Befehl im Terminalbereich des Code-Editors aufrufen. Dadurch wird eine Bilddatei mit dem Namen
image.jpeg
erstellt.
/usr/bin/python3 /GenerateImage.py
- Klicken Sie auf EXPLORER > image.jpeg, um das generierte Bild anzusehen.
Erläuterung zum Code:
- Mit dem Code-Snippet wird ein vortrainiertes KI-Modell namens ImageGenerationModel (imagen-3.0-generate-002) in Vertex AI geladen.
- Der Code ruft die Methode
generate_image
des geladenen Gemini-Modells auf.
- Die Eingabe für die Methode ist ein Text-Prompt.
- Der Code nutzt die Fähigkeit von Gemini, den Text-Prompt zu verstehen und damit ein KI-Bild zu erstellen.
Hinweis: Standardmäßig wird Bildern ein SynthID-Wasserzeichen hinzugefügt. Sie können dies jedoch deaktivieren, indem Sie den optionalen Parameter add_watermark=False
angeben. Sie können nicht gleichzeitig einen Startwert und ein Wasserzeichen verwenden. Weitere Informationen zum SynthID-Wasserzeichen
Sie möchten es selbst ausprobieren? Experimentieren Sie mit verschiedenen Prompts, um die Möglichkeiten von Gemini zu erkunden.
Klicken Sie auf Fortschritt prüfen.
Anfragen für Text-Prompts an generative KI senden und eine Antwort erhalten
Das wars!
Sie haben das Lab erfolgreich abgeschlossen. Glückwunsch!
© 2025 Google LLC. Alle Rechte vorbehalten. Google und das Google-Logo sind Marken von Google LLC. Alle anderen Unternehmens- und Produktnamen können Marken der jeweils mit ihnen verbundenen Unternehmen sein.