Vertex AI の Gemini を使用して AI 画像認識アプリを構築する
ラボ
15分
universal_currency_alt
無料
show_chart
入門
info
このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。

概要
- ラボの時間は記録されており、一時停止できません。[ラボを開始] をクリックすると、タイマーが開始されます。
- クラウド ターミナルには、gcloud SDK が事前に構成されています。
- ターミナルを使用してコマンドを実行し、[進行状況を確認] をクリックして作業を確認してください。
目標
Vertex AI の生成 AI では、Google の大規模な生成 AI モデルにアクセスして、AI を活用したアプリケーションでモデルを使用するためのテスト、チューニング、デプロイを行うことができます。このラボでは、次の作業を行います。
-
Vertex AI(Google Cloud AI プラットフォーム)に接続する: Vertex AI SDK を使用して Google AI サービスへの接続を確立する方法を学びます。
-
事前トレーニング済みの生成 AI モデル(Gemini)を読み込む: 一からモデルを構築せずに、強力な事前トレーニング済み AI モデルを使用する方法を確認します。
-
AI モデルに画像とテキストの質問を送信する: 処理する入力を AI に提供する方法を理解します。
-
AI からのテキストベースの回答を抽出する: AI モデルによって生成されたテキストの回答を処理して解釈する方法を学びます。
-
AI アプリケーション構築の基本を理解する: AI をソフトウェア プロジェクトに統合する際の重要ポイントについて理解を深めます。
Vertex AI Python SDK を使用する
ラボを開始すると、分割ペイン ビューの左側にコードエディタ、右側にラボの手順が表示されます。Vertex AI Python SDK を使用して生成 AI API を操作するには、次の手順を行います。
-
[File] > [New File] をクリックして、コードエディタ内に新しいファイルを開きます。
- 下のコード スニペットをコピーしてファイルに貼り付けます。
from google import genai
from google.genai.types import HttpOptions, Part
client = genai.Client(http_options=HttpOptions(api_version="v1"))
response = client.models.generate_content(
model="gemini-2.0-flash-001",
contents=[
"What is shown in this image?",
Part.from_uri(
file_uri="https://storage.googleapis.com/cloud-samples-data/generative-ai/image/scones.jpg",
mime_type="image/jpeg",
),
],
)
print(response.text)
-
[File] > [Save] をクリックし、[Name] フィールドに「genai.py
」と入力して [Save] をクリックします。
-
新しいターミナルで環境変数を設定するには、次のコマンドを実行します。
export GOOGLE_CLOUD_PROJECT='{{{ project_0.project_id | "project-id" }}}'
export GOOGLE_CLOUD_LOCATION='{{{ project_0.default_region | "REGION" }}}'
export GOOGLE_GENAI_USE_VERTEXAI=True
-
コードエディタ ペイン内のターミナルで以下のコマンドを入力して Python ファイルを実行し、出力を確認します。
/usr/bin/python3 /genai.py
注: 400 エラーが発生した場合は、コードを再実行してみてください。
コードの説明
- このコード スニペットは、Vertex AI で Gemini(gemini-2.0-flash-001)という事前トレーニング済み AI モデルを読み込みます。
- このコードは、読み込まれた Gemini モデルの
generate_content
メソッドを呼び出します。
- メソッドへの入力は、画像の URI と、画像に関する質問を含むプロンプトです。
- このコードでは、Gemini が持つ、画像とテキストを一緒に理解する機能を使用し、プロンプトで提供されたテキストを使用して、画像の内容を説明しています。
実際に試してみましょう。さまざまな画像の URI とプロンプトの質問を試して、Gemini の機能を試してみましょう。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
画像のコンテンツを生成する
お疲れさまでした
これでラボは完了です。お疲れさまでした。
Copyright 2025 Google LLC. All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。