Créer une application de générateur d'images IA à l'aide d'Imagen sur Vertex AI
Atelier
15 minutes
universal_currency_alt
Sans frais
show_chart
Débutant
info
Cet atelier peut intégrer des outils d'IA pour vous accompagner dans votre apprentissage.
Accédez à plus de 700 ateliers et cours
bb-ide-genai-002

Présentation
- Les ateliers sont minutés et ne peuvent pas être mis en pause. Le minuteur démarre lorsque vous cliquez sur Démarrer l'atelier.
- Le terminal cloud inclus est préconfiguré avec le SDK gcloud.
- Utilisez le terminal pour exécuter les commandes, puis cliquez sur Vérifier ma progression pour que votre travail soit validé.
Objectif
L'IA générative sur Vertex AI vous donne accès aux grands modèles d'IA générative de Google. Vous pouvez ainsi les tester, les régler et les déployer pour les utiliser dans vos applications optimisées par l'IA. Au cours de cet atelier, vous allez :
-
Vous connecter à Vertex AI (plate-forme d'IA de Google Cloud) : découvrez comment établir une connexion aux services d'IA de Google à l'aide du SDK Vertex AI.
-
Charger un modèle de génération d'images pré-entraîné : découvrez comment utiliser un modèle d'IA pré-entraîné performant sans avoir à le créer de toutes pièces.
-
Envoyer du texte au modèle d'IA : apprenez à fournir des entrées à traiter par l'IA.
-
Extraire des réponses basées sur des images de l'IA : apprenez à gérer et à interpréter les réponses basées sur des images qui sont générées par le modèle d'IA.
-
Comprendre les bases de la création d'applications d'IA : explorez les concepts de base de l'intégration de l'IA dans les projets logiciels.
Travailler avec l'IA générative
Une fois l'atelier démarré, vous obtenez une vue divisée en deux volets : l'éditeur de code à gauche et les instructions de l'atelier à droite. Suivez ces étapes pour exploiter les API Generative AI à l'aide du SDK Vertex AI pour Python.
- Cliquez sur Fichier > Nouveau fichier pour ouvrir un nouveau fichier dans l'éditeur de code.
- Copiez l'extrait de code fourni et collez-le dans votre fichier.
import argparse
import vertexai
from vertexai.preview.vision_models import ImageGenerationModel
def generate_image(
project_id: str, location: str, output_file: str, prompt: str
) -> vertexai.preview.vision_models.ImageGenerationResponse:
"""Generate an image using a text prompt.
Args:
project_id: Google Cloud project ID, used to initialize Vertex AI.
location: Google Cloud region, used to initialize Vertex AI.
output_file: Local path to the output image file.
prompt: The text prompt describing what you want to see."""
vertexai.init(project=project_id, location=location)
model = ImageGenerationModel.from_pretrained("imagen-3.0-generate-002")
images = model.generate_images(
prompt=prompt,
# Optional parameters
number_of_images=1,
seed=1,
add_watermark=False,
)
images[0].save(location=output_file)
return images
generate_image(
project_id='{{{ project_0.project_id | "project-id" }}}',
location='{{{ project_0.default_region | "REGION" }}}',
output_file='image.jpeg',
prompt='Create an image of a cricket ground in the heart of Los Angeles',
)
- Cliquez sur Fichier > Enregistrer, saisissez
GenerateImage.py
dans le champ "Nom", puis cliquez sur Enregistrer.
- Exécutez le fichier Python en cliquant sur l'icône en forme de triangle dans l'éditeur de code ou en saisissant la commande ci-dessous dans le terminal du volet "Éditeur de code". Cela générera un fichier image nommé
image.jpeg
.
/usr/bin/python3 /GenerateImage.py
- Pour afficher l'image générée, cliquez sur EXPLORATEUR > image.jpeg.
Explication du code
- L'extrait de code charge un modèle d'IA pré-entraîné appelé ImageGenerationModel (imagen-3.0-generate-002) sur Vertex AI.
- Le code appelle la méthode
generate_image
du modèle Gemini chargé.
- La méthode accepte en entrée un prompt textuel.
- Le code utilise la capacité de Gemini à comprendre le prompt textuel et à l'utiliser pour créer une image d'IA.
Remarque : Par défaut, un filigrane SynthID est ajouté aux images, mais vous pouvez le désactiver en spécifiant le paramètre facultatif add_watermark=False
. Vous ne pouvez pas utiliser à la fois une valeur de graine et un filigrane. En savoir plus sur le filigrane SynthID
Essayez vous-même ! Testez différents prompts pour explorer les fonctionnalités de Gemini.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Envoyer des prompts textuels à l'IA générative et recevoir une réponse
Félicitations !
Vous avez terminé l'atelier. Bravo !
Copyright 2025 Google LLC. Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.