arrow_back

Vertex AI の Gemini を使用して AI 画像認識アプリを構築する

ログイン 参加
700 以上のラボとコースにアクセス

Vertex AI の Gemini を使用して AI 画像認識アプリを構築する

ラボ 15分 universal_currency_alt 無料 show_chart 入門
info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。
700 以上のラボとコースにアクセス

Google Cloud セルフペース ラボのロゴ

概要

  • ラボの時間は記録されており、一時停止できません。[ラボを開始] をクリックすると、タイマーが開始されます。
  • クラウド ターミナルには、gcloud SDK が事前に構成されています。
  • ターミナルを使用してコマンドを実行し、[進行状況を確認] をクリックして作業を確認してください。

目標

Vertex AI の生成 AI では、Google の大規模な生成 AI モデルにアクセスして、AI を活用したアプリケーションでモデルを使用するためのテスト、チューニング、デプロイを行うことができます。このラボでは、次の作業を行います。

  • Vertex AI(Google Cloud AI プラットフォーム)に接続する: Vertex AI SDK を使用して Google AI サービスへの接続を確立する方法を学びます。
  • 事前トレーニング済みの生成 AI モデル(Gemini)を読み込む: 一からモデルを構築せずに、強力な事前トレーニング済み AI モデルを使用する方法を確認します。
  • AI モデルに画像とテキストの質問を送信する: 処理する入力を AI に提供する方法を理解します。
  • AI からのテキストベースの回答を抽出する: AI モデルによって生成されたテキストの回答を処理して解釈する方法を学びます。
  • AI アプリケーション構築の基本を理解する: AI をソフトウェア プロジェクトに統合する際の重要ポイントについて理解を深めます。

Vertex AI Python SDK を使用する

ラボを開始すると、分割ペイン ビューの左側にコードエディタ、右側にラボの手順が表示されます。Vertex AI Python SDK を使用して生成 AI API を操作するには、次の手順を行います。

  1. [File] > [New File] をクリックして、コードエディタ内に新しいファイルを開きます。
  2. 下のコード スニペットをコピーしてファイルに貼り付けます。
from google import genai from google.genai.types import HttpOptions, Part client = genai.Client(http_options=HttpOptions(api_version="v1")) response = client.models.generate_content( model="gemini-2.0-flash-001", contents=[ "What is shown in this image?", Part.from_uri( file_uri="https://storage.googleapis.com/cloud-samples-data/generative-ai/image/scones.jpg", mime_type="image/jpeg", ), ], ) print(response.text)
  1. [File] > [Save] をクリックし、[Name] フィールドに「genai.py」と入力して [Save] をクリックします。

  2. 新しいターミナルで環境変数を設定するには、次のコマンドを実行します。

    export GOOGLE_CLOUD_PROJECT='{{{ project_0.project_id | "project-id" }}}' export GOOGLE_CLOUD_LOCATION='{{{ project_0.default_region | "REGION" }}}' export GOOGLE_GENAI_USE_VERTEXAI=True
  3. コードエディタ ペイン内のターミナルで以下のコマンドを入力して Python ファイルを実行し、出力を確認します。

/usr/bin/python3 /genai.py 注: 400 エラーが発生した場合は、コードを再実行してみてください。

コードの説明

  • このコード スニペットは、Vertex AI で Gemini(gemini-2.0-flash-001)という事前トレーニング済み AI モデルを読み込みます。
  • このコードは、読み込まれた Gemini モデルの generate_content メソッドを呼び出します。
  • メソッドへの入力は、画像の URI と、画像に関する質問を含むプロンプトです。
  • このコードでは、Gemini が持つ、画像とテキストを一緒に理解する機能を使用し、プロンプトで提供されたテキストを使用して、画像の内容を説明しています。

実際に試してみましょう。さまざまな画像の URI とプロンプトの質問を試して、Gemini の機能を試してみましょう。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。

画像のコンテンツを生成する

お疲れさまでした

これでラボは完了です。お疲れさまでした。

Copyright 2025 Google LLC. All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。

始める前に

  1. ラボでは、Google Cloud プロジェクトとリソースを一定の時間利用します
  2. ラボには時間制限があり、一時停止機能はありません。ラボを終了した場合は、最初からやり直す必要があります。
  3. 画面左上の [ラボを開始] をクリックして開始します

シークレット ブラウジングを使用する

  1. ラボで使用するユーザー名パスワードをコピーします
  2. プライベート モードで [コンソールを開く] をクリックします

コンソールにログインする

    ラボの認証情報を使用して
  1. ログインします。他の認証情報を使用すると、エラーが発生したり、料金が発生したりする可能性があります。
  2. 利用規約に同意し、再設定用のリソースページをスキップします
  3. ラボを終了する場合や最初からやり直す場合を除き、[ラボを終了] はクリックしないでください。クリックすると、作業内容がクリアされ、プロジェクトが削除されます

このコンテンツは現在ご利用いただけません

利用可能になりましたら、メールでお知らせいたします

ありがとうございます。

利用可能になりましたら、メールでご連絡いたします

1 回に 1 つのラボ

既存のラボをすべて終了して、このラボを開始することを確認してください

シークレット ブラウジングを使用してラボを実行する

このラボの実行には、シークレット モードまたはシークレット ブラウジング ウィンドウを使用してください。これにより、個人アカウントと受講者アカウントの競合を防ぎ、個人アカウントに追加料金が発生することを防ぎます。