arrow_back

BigQuery と Workbench インスタンスを使った探索的データ分析

ログイン 参加
700 以上のラボとコースにアクセス

BigQuery と Workbench インスタンスを使った探索的データ分析

ラボ 2時間 universal_currency_alt クレジット: 1 show_chart 中級
info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。
700 以上のラボとコースにアクセス

概要

このラボでは、クエリを実行し、各種の統計プロット手法を使ってデータを表示するために、Workbench インスタンス ノートブックを使用して BigQuery に保存されているデータセットを分析するプロセスについて学びます。この分析により、データのパターンを特定できます。

学習目標

  • Workbench インスタンス ノートブックを作成する
  • BigQuery データセットに接続する
  • Pandas DataFrame に対して統計分析を実行する
  • Python で探索的データ分析の seaborn グラフを作成する
  • BigQuery データセットから特定のフィールドを取得する SQL クエリを作成する

Vertex AI は、ML アプリケーションの構築、デプロイ、管理のための統合プラットフォームです。

Vertex AI Workbench ノートブックは、Google Cloud で ML モデルを開発およびデプロイするための柔軟でスケーラブルなソリューションです。より多くのカスタマイズ オプションが必要で、ML 環境を完全に制御する必要がある場合は、Workbench を選択してください。Workbench は企業に必要なセキュリティとコンプライアンスの機能を備えており、Vertex AI や BigQuery などの他の Google Cloud サービスと統合して、データ サイエンスと ML のワークフローを強化します。

BigQuery は、大規模なデータセットを簡単に分析、管理するための、高性能なフルマネージド型サーバーレス データ ウェアハウスです。BigQuery では、馴染みのある標準 SQL 言語を使用するため、アナリストやデータ サイエンティストは、新たな言語を学ばなくても簡単に使用できます。

Vertex AI には、Workbench と Colab Enterprise の 2 つのノートブック ソリューションがあります。

Colab

Workbench

Vertex AI Workbench は、制御性とカスタマイズ性が重視されるプロジェクトに適した選択肢です。依存関係が複雑な、複数のファイルにわたる複雑なプロジェクトに特に適しています。また、ワークステーションやノートパソコンからクラウドへの移行を行っているデータ サイエンティストにも適した選択肢です。

Vertex AI Workbench のインスタンスには、ディープ ラーニング パッケージのスイート(TensorFlow と PyTorch のフレームワークへの対応を含む)がプリインストールされています。

workbench1

Qwiklabs 環境を設定する

Qwiklabs の設定

各ラボでは、新しい Google Cloud プロジェクトとリソースセットを一定時間無料で利用できます。

  1. Qwiklabs にシークレット ウィンドウでログインします。

  2. ラボのアクセス時間(例: 1:15:00)に注意し、時間内に完了できるようにしてください。
    一時停止機能はありません。必要な場合はやり直せますが、最初からになります。

  3. 準備ができたら、[ラボを開始] をクリックします。

  4. ラボの認証情報(ユーザー名パスワード)をメモしておきます。この情報は、Google Cloud Console にログインする際に使用します。

  5. [Google Console を開く] をクリックします。

  6. [別のアカウントを使用] をクリックし、このラボの認証情報をコピーしてプロンプトに貼り付けます。
    他の認証情報を使用すると、エラーが発生したり、料金の請求が発生したりします。

  7. 利用規約に同意し、再設定用のリソースページをスキップします。

タスク 1. Workbench ノートブックを作成する

  1. Google Cloud コンソールのナビゲーション メニューナビゲーション メニュー)で [Vertex AI] を選択します。

  2. [すべての推奨 API を有効化] をクリックします。

  3. ナビゲーション メニューで [ワークベンチ] をクリックします。

    [ワークベンチ] ページの上部で、[インスタンス] ビューになっていることを確認します。

  4. [ボックスを追加する新規作成] をクリックします。

  5. インスタンスの構成:

    • 名前: lab-workbench
    • リージョン: リージョンを に設定します
    • ゾーン: ゾーンを に設定します
    • 詳細オプション(任意): 必要に応じて [詳細オプション] をクリックして、より詳細なカスタマイズを行います(マシンタイプ、ディスクサイズなど)。

Vertex AI Workbench インスタンスを作成する

  1. [作成] をクリックします。

インスタンスが作成されるまで数分かかります。作成が終了するとインスタンスの名前の横に緑色のチェックマークが付きます。

  1. インスタンスの名前の横に表示されている [JupyterLab を開く] をクリックして JupyterLab インターフェースを起動します。ブラウザで新しいタブが開きます。

デプロイされたワークベンチ インスタンス

  1. [Python 3] アイコンをクリックして、新規の Python ノートブックを起動します。

Jupyter ノートブックを開く

  1. メニューバーでファイル Untitled.ipynb を右クリックし、[ノートブック名を変更] を選択して、わかりやすい名前を付けます。

ノートブックの名前を変更する

これで環境が設定されました。これで Vertex AI Workbench ノートブックを使い始める準備ができました。

使用できるようになった Vertex ノートブック

タスク 2. Vertex AI Notebooks インスタンス内でリポジトリのクローンを作成する

GitHub リポジトリには、コースのラボファイルとソリューション ファイルの両方が含まれています。

  1. ノートブックの最初のセルに次のコードをコピーして実行し、training-data-analyst リポジトリのクローンを作成します。
!git clone https://github.com/GoogleCloudPlatform/training-data-analyst

raining-data-analyst リポジトリのクローンを作成する

  1. リポジトリのクローンが作成されたことを確認します。training-data-analyst ディレクトリをダブルクリックし、リポジトリのコンテンツが表示されることを確認します。

training-data-analyst リポジトリを確認する

  1. ノートブック インターフェースで、[training-data-analyst] > [courses] > [machine_learning] > [deepdive2] > [launching_into_ml] > [solutions] に移動して [workbench_explore_data.ipynb] を開きます。

  2. ノートブック インターフェースで、[編集] > [出力をすべて消去] をクリックします([編集] をクリックしてプルダウン メニューから [出力をすべて消去] を選択します)。

  3. [Select Kernel] ダイアログで、使用可能なカーネルのリストから [Python 3] を選択します。

  4. ノートブックの手順をよく読みます。

ノートブックの手順

お疲れさまでした

このラボでは、以下の操作について学習しました。

  • Workbench インスタンス ノートブックを作成する
  • GitHub リポジトリのクローンを作成する
  • BigQuery データセットに接続する
  • Pandas DataFrame に対して統計分析を実行する
  • Python で探索的データ分析の seaborn グラフを作成する
  • BigQuery データセットから特定のフィールドを取得する SQL クエリを作成する

ラボを終了する

ラボでの学習が完了したら、[ラボを終了] をクリックします。ラボで使用したリソースが Qwiklabs から削除され、アカウントの情報も消去されます。

ラボの評価を求めるダイアログが表示されたら、星の数を選択してコメントを入力し、[送信] をクリックします。

星の数は、それぞれ次の評価を表します。

  • 星 1 つ = 非常に不満
  • 星 2 つ = 不満
  • 星 3 つ = どちらともいえない
  • 星 4 つ = 満足
  • 星 5 つ = 非常に満足

フィードバックを送信しない場合は、ダイアログ ボックスを閉じてください。

フィードバック、ご提案、修正が必要な箇所については、[サポート] タブからお知らせください。

マニュアルの最終更新日: 2024 年 11 月 25 日

ラボの最終テスト日: 2024 年 11 月 25 日

Copyright 2020 Google LLC All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。

始める前に

  1. ラボでは、Google Cloud プロジェクトとリソースを一定の時間利用します
  2. ラボには時間制限があり、一時停止機能はありません。ラボを終了した場合は、最初からやり直す必要があります。
  3. 画面左上の [ラボを開始] をクリックして開始します

シークレット ブラウジングを使用する

  1. ラボで使用するユーザー名パスワードをコピーします
  2. プライベート モードで [コンソールを開く] をクリックします

コンソールにログインする

    ラボの認証情報を使用して
  1. ログインします。他の認証情報を使用すると、エラーが発生したり、料金が発生したりする可能性があります。
  2. 利用規約に同意し、再設定用のリソースページをスキップします
  3. ラボを終了する場合や最初からやり直す場合を除き、[ラボを終了] はクリックしないでください。クリックすると、作業内容がクリアされ、プロジェクトが削除されます

このコンテンツは現在ご利用いただけません

利用可能になりましたら、メールでお知らせいたします

ありがとうございます。

利用可能になりましたら、メールでご連絡いたします

1 回に 1 つのラボ

既存のラボをすべて終了して、このラボを開始することを確認してください

シークレット ブラウジングを使用してラボを実行する

このラボの実行には、シークレット モードまたはシークレット ブラウジング ウィンドウを使用してください。これにより、個人アカウントと受講者アカウントの競合を防ぎ、個人アカウントに追加料金が発生することを防ぎます。