使用 Vertex AI 上的 Gemini 构建 AI 图像识别应用
实验
15 分钟
universal_currency_alt
免费
show_chart
入门级
info
此实验可能会提供 AI 工具来支持您学习。

概览
- 实验是计时的,并且无法暂停。计时器在您点击开始实验后即开始计时。
- 随附的云终端已预先配置了 gcloud SDK。
- 使用终端执行命令,然后点击检查我的进度以验证您的实验成果。
目标
借助 Vertex AI 上的生成式 AI,您可以访问 Google 的大型生成式 AI 模型,对模型进行测试、调优并将其部署到依托 AI 的应用中。在本实验中,您将执行以下操作:
-
连接到 Vertex AI(Google Cloud 的 AI 平台):学习使用 Vertex AI SDK 与 Google AI 服务建立连接。
-
加载预训练的生成式 AI 模型 - Gemini:学习使用强大的预训练 AI 模型,无需从头构建。
-
向 AI 模型发送图片和文本问题:学习为 AI 提供输入。
-
提取 AI 提供的文本回答:学习处理和解读 AI 模型生成的文本回答。
-
了解构建 AI 应用的基础知识:深入了解将 AI 集成到软件项目中的核心概念。
使用 Vertex AI Python SDK
开始实验后,您将看到一个分屏视图,左侧是代码编辑器,右侧是实验说明。按照说明步骤使用 Vertex AI Python SDK 与生成式 AI API 进行交互。
- 点击文件 > 新建文件,在代码编辑器中打开一个新文件。
- 复制提供的代码段并将其粘贴到文件中。
from google import genai
from google.genai.types import HttpOptions, Part
client = genai.Client(http_options=HttpOptions(api_version="v1"))
response = client.models.generate_content(
model="gemini-2.0-flash-001",
contents=[
"What is shown in this image?",
Part.from_uri(
file_uri="https://storage.googleapis.com/cloud-samples-data/generative-ai/image/scones.jpg",
mime_type="image/jpeg",
),
],
)
print(response.text)
-
依次点击文件 > 保存,在“名称”字段中输入 genai.py
,然后点击保存。
-
如需在新终端中设置环境变量,请运行以下命令:
export GOOGLE_CLOUD_PROJECT='{{{ project_0.project_id | "project-id" }}}'
export GOOGLE_CLOUD_LOCATION='{{{ project_0.default_region | "REGION" }}}'
export GOOGLE_GENAI_USE_VERTEXAI=True
-
在代码编辑器窗格内的终端中调用以下命令,执行 Python 文件并查看输出。
/usr/bin/python3 /genai.py
注意:如果您遇到 400 错误,请尝试重新运行代码。
代码说明
- 此代码段会加载一个名为 Gemini (gemini-2.0-flash-001) on Vertex AI 的预训练 AI 模型。
- 该代码会调用已加载的 Gemini 模型的
generate_content
方法。
- 该方法的输入是图片 URI 和包含图片相关问题的提示。
- 该代码使用 Gemini 理解图片和文本的能力。它使用提示中提供的文本来描述图片的内容。
亲自尝试一下吧!尝试使用不同的图片 URI 和提示问题,看看 Gemini 的表现。
点击检查我的进度,验证是否完成了以下目标:
针对图片生成内容
恭喜!
您已完成本实验!恭喜!
版权所有 2025 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。