arrow_back

Vertex AI Gemini API と cURL のスタートガイド

ログイン 参加
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Vertex AI Gemini API と cURL のスタートガイド

Lab 45分 universal_currency_alt クレジット: 5 show_chart 中級
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP1228

Google Cloud セルフペース ラボ

概要

Gemini は、Google の DeepMind が開発した、生成 AI モデルのファミリーであり、マルチモーダル ユースケース用に設計されています。Gemini API を使用すると、Gemini Pro Vision モデルと Gemini Pro モデルにアクセスできます。このラボでは、Vertex AI Gemini API と cURL コマンドを使用して、Gemini Pro(gemini-pro)モデルと Gemini Pro Vision(gemini-pro-vision)モデルを操作する方法を学びます。

Vertex AI Gemini API

Vertex AI Gemini API は、Gemini モデルを操作するための統合インターフェースを提供します。現在、Gemini API では次の 2 つのモデルが利用可能です。

  1. Gemini Pro モデルgemini-pro): 自然言語タスク、マルチターン テキストとコードチャット、コード生成を処理するように設計されています。
  2. Gemini Pro Vision モデルgemini-pro-vision): マルチモーダル プロンプトをサポートします。プロンプト リクエストにテキスト、画像、動画を含めて、テキストまたはコードのレスポンスを取得できます。

Gemini API を操作するには、次の方法を使用します。

  • Vertex AI Studio を使用して迅速なテストとコマンド生成を行う
  • cURL コマンドを使用する
  • Vertex AI SDK を使用する

このラボでは、cURL コマンドを使用して Vertex AI Gemini API を呼び出す方法に焦点を合わせます。

詳細については、Vertex AI での生成 AI に関するドキュメントをご覧ください。

目標

このラボでは、次のタスクの実行方法について学びます。

  • Python SDK をインストールする。
  • Vertex AI Gemini API を使用して各モデルを操作する。
  • Gemini Pro(gemini-pro)モデルを使用して、テキスト プロンプトからテキストを生成する。
  • Gemini Pro Vision(gemini-pro-vision)モデルを使用して、画像や動画のプロンプトからテキストを生成する。

設定と要件

[ラボを開始] ボタンをクリックする前に

こちらの手順をお読みください。ラボの時間は記録されており、一時停止することはできません。[ラボを開始] をクリックするとスタートするタイマーは、Google Cloud のリソースを利用できる時間を示しています。

このハンズオンラボでは、シミュレーションやデモ環境ではなく、実際のクラウド環境を使ってご自身でラボのアクティビティを行うことができます。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。

このラボを完了するためには、下記が必要です。

  • 標準的なインターネット ブラウザ(Chrome を推奨)
注: このラボの実行には、シークレット モードまたはシークレット ブラウジング ウィンドウを使用してください。これにより、個人アカウントと受講者アカウント間の競合を防ぎ、個人アカウントに追加料金が発生することを防ぎます。
  • ラボを完了するために十分な時間を確保してください。ラボをいったん開始すると一時停止することはできません。
注: すでに個人の Google Cloud アカウントやプロジェクトをお持ちの場合でも、このラボでは使用しないでください。アカウントへの追加料金が発生する可能性があります。

ラボを開始して Google Cloud コンソールにログインする方法

  1. [ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるポップアップでお支払い方法を選択してください。 左側の [ラボの詳細] パネルには、以下が表示されます。

    • [Google コンソールを開く] ボタン
    • 残り時間
    • このラボで使用する必要がある一時的な認証情報
    • このラボを行うために必要なその他の情報(ある場合)
  2. [Google コンソールを開く] をクリックします。 ラボでリソースが起動し、別のタブで [ログイン] ページが表示されます。

    ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。

    注: [アカウントの選択] ダイアログが表示されたら、[別のアカウントを使用] をクリックします。
  3. 必要に応じて、[ラボの詳細] パネルから [ユーザー名] をコピーして [ログイン] ダイアログに貼り付けます。[次へ] をクリックします。

  4. [ラボの詳細] パネルから [パスワード] をコピーして [ようこそ] ダイアログに貼り付けます。[次へ] をクリックします。

    重要: 認証情報は左側のパネルに表示されたものを使用してください。Google Cloud Skills Boost の認証情報は使用しないでください。 注: このラボでご自身の Google Cloud アカウントを使用すると、追加料金が発生する場合があります。
  5. その後次のように進みます。

    • 利用規約に同意してください。
    • 一時的なアカウントなので、復元オプションや 2 要素認証プロセスは設定しないでください。
    • 無料トライアルには登録しないでください。

その後このタブで Cloud Console が開きます。

注: 左上にある [ナビゲーション メニュー] をクリックすると、Google Cloud のプロダクトやサービスのリストが含まれるメニューが表示されます。 ナビゲーション メニュー アイコン

タスク 1. Vertex AI Workbench でノートブックを開く

  1. Google Cloud コンソールのナビゲーション メニューで、[Vertex AI] > [ワークベンチ] をクリックします。

  2. [ユーザー管理のノートブック] ページで、generative-ai-jupyterlab ノートブックを見つけて、[JupyterLab を開く] ボタンをクリックします。

新しいブラウザタブで JupyterLab インターフェースが開きます。

タスク 2. generative-ai フォルダを開く

  1. ノートブックの左側にある generative-ai フォルダに移動します。

  2. /gemini/getting-started フォルダに移動します。

  3. intro_gemini_curl.ipynb ファイルをクリックします。

  4. ノートブックの「Getting Started」(スタートガイド)セクションと「Import libraries」(ライブラリのインポート)セクションをすべて実行します。

    • [Project ID](プロジェクト ID)には を、[Location](場所)には を使用します。
注: 「Colab only」(Colab のみ)と記載されているノートブック セルは省略できます。

以降のセクションでは、ノートブック セルの実行を通して、Vertex AI Gemini API と cURL コマンドを使用して、Gemini Pro(gemini-pro)モデルと Gemini Pro Vision(gemini-pro-vision)モデルを操作する方法を見ていきます。

タスク 3. Gemini Pro モデルを使用する

Gemini Pro(gemini-pro)モデルは、分類、要約、抽出、作成などの自然言語タスクに合わせて調整されています。このタスクでは、Gemini Pro モデルを使用して、テキスト プロンプトからテキストを生成する方法を学習します。

  1. このタスクでは、ノートブック セルの実行を通して、Gemini Pro モデルを使用してテキスト プロンプトからテキストを生成する方法を見ていきます。
テキスト プロンプトからテキストを生成する チャット プロンプトからマルチターンの会話を生成する ノートブックの関数呼び出しセルを実行する

タスク 4. Gemini Pro Vision モデルを使用する

Gemini Pro Vision(gemini-pro-vision)は、テキスト レスポンスを取得するための、テキスト プロンプトまたはチャット プロンプトへの画像や動画の追加に対応したマルチモーダル モデルです。

注: テキストのみのプロンプトは、Gemini Pro Vision モデルでサポートされていません。代わりに、テキストのみのプロンプトには Gemini Pro モデルを使用します。
  1. このタスクでは、ノートブック セルの実行を通して、Gemini Pro Vision モデルを使ってローカル ファイルの画像、Google Cloud Storage の画像、動画ファイルからテキストを生成する方法を見ていきます。
画像ファイルからテキストを生成する 動画ファイルからテキストを生成する

お疲れさまでした

これで完了です。このラボでは、Vertex AI Gemini API と cURL コマンドを使用して Gemini Pro(gemini-pro)モデルと Gemini Pro Vision(gemini-pro-vision)モデルを操作し、テキストの生成、モデル パラメータの追加、チャット、ローカル画像からのテキストの生成、Google Cloud Storage の画像からのテキストの生成、動画ファイルからのテキストの生成を行う方法を学習しました。

次のステップと詳細情報

Google Cloud トレーニングと認定資格

Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。

マニュアルの最終更新日: 2024 年 3 月 8 日

ラボの最終テスト日: 2024 年 3 月 8 日

Copyright 2024 Google LLC All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。