700 以上のラボとコースにアクセス

Vertex AI の Gemini を使用して AI 画像認識アプリを構築する

ラボ 15分 universal_currency_alt 無料 show_chart 入門

info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。

概要
目標
Vertex AI Python SDK を使用する
コードの説明
お疲れさまでした

700 以上のラボとコースにアクセス

Google Cloud セルフペースラボのロゴ

概要

ラボの時間は記録されており、一時停止できません。[ラボを開始] をクリックすると、タイマーが開始されます。
クラウドターミナルには、gcloud SDK が事前に構成されています。
ターミナルを使用してコマンドを実行し、[進行状況を確認] をクリックして作業を確認してください。

目標

Vertex AI の生成 AI では、Google の大規模な生成 AI モデルにアクセスして、AI を活用したアプリケーションでモデルを使用するためのテスト、チューニング、デプロイを行うことができます。このラボでは、次の作業を行います。

Vertex AI（Google Cloud AI プラットフォーム）に接続する: Vertex AI SDK を使用して Google AI サービスへの接続を確立する方法を学びます。
事前トレーニング済みの生成 AI モデル（Gemini）を読み込む: 一からモデルを構築せずに、強力な事前トレーニング済み AI モデルを使用する方法を確認します。
AI モデルに画像とテキストの質問を送信する: 処理する入力を AI に提供する方法を理解します。
AI からのテキストベースの回答を抽出する: AI モデルによって生成されたテキストの回答を処理して解釈する方法を学びます。
AI アプリケーション構築の基本を理解する: AI をソフトウェアプロジェクトに統合する際の重要ポイントについて理解を深めます。

Vertex AI Python SDK を使用する

ラボを開始すると、分割ペインビューの左側にコードエディタ、右側にラボの手順が表示されます。Vertex AI Python SDK を使用して生成 AI API を操作するには、次の手順を行います。

[File] > [New File] をクリックして、コードエディタ内に新しいファイルを開きます。
下のコードスニペットをコピーしてファイルに貼り付けます。

from google import genai from google.genai.types import HttpOptions, Part client = genai.Client(http_options=HttpOptions(api_version="v1")) response = client.models.generate_content( model="gemini-2.0-flash-001", contents=[ "What is shown in this image?", Part.from_uri( file_uri="https://storage.googleapis.com/cloud-samples-data/generative-ai/image/scones.jpg", mime_type="image/jpeg", ), ], ) print(response.text)

[File] > [Save] をクリックし、[Name] フィールドに「genai.py」と入力して [Save] をクリックします。
新しいターミナルで環境変数を設定するには、次のコマンドを実行します。
export GOOGLE_CLOUD_PROJECT='{{{ project_0.project_id | "project-id" }}}' export GOOGLE_CLOUD_LOCATION='{{{ project_0.default_region | "REGION" }}}' export GOOGLE_GENAI_USE_VERTEXAI=True
コードエディタペイン内のターミナルで以下のコマンドを入力して Python ファイルを実行し、出力を確認します。

/usr/bin/python3 /genai.py

注: 400 エラーが発生した場合は、コードを再実行してみてください。

コードの説明

このコードスニペットは、Vertex AI で Gemini（gemini-2.0-flash-001）という事前トレーニング済み AI モデルを読み込みます。
このコードは、読み込まれた Gemini モデルの generate_content メソッドを呼び出します。
メソッドへの入力は、画像の URI と、画像に関する質問を含むプロンプトです。
このコードでは、Gemini が持つ、画像とテキストを一緒に理解する機能を使用し、プロンプトで提供されたテキストを使用して、画像の内容を説明しています。

実際に試してみましょう。さまざまな画像の URI とプロンプトの質問を試して、Gemini の機能を試してみましょう。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。

画像のコンテンツを生成する

お疲れさまでした

これでラボは完了です。お疲れさまでした。

Vertex AI の Gemini を使用して AI 画像認識アプリを構築する

Vertex AI の Gemini を使用して AI 画像認識アプリを構築する

概要

目標

Vertex AI Python SDK を使用する

コードの説明

お疲れさまでした

始める前に

シークレット ブラウジングを使用する

コンソールにログインする

シークレット ブラウジングを使用してラボを実行する

シークレットブラウジングを使用する

シークレットブラウジングを使用してラボを実行する