arrow_back

BigQuery: Qwik Start - Console

参加 ログイン

BigQuery: Qwik Start - Console

30分 無料

GSP072

Google Cloud セルフペース ラボ

概要

適切なハードウェアとインフラストラクチャを用意することなく大規模なデータセットを保存してクエリを実行すると、多大な時間と費用がかかってしまう可能性があります。エンタープライズ データ ウェアハウスである Google BigQuery は、Google のインフラストラクチャの処理能力を活用して SQL クエリを超高速で実行し、こうした問題を解決します。ユーザーがデータを BigQuery に読み込んだら、後の処理は Google 側で行われます。他のユーザーにデータの表示やクエリを許可するなど、ビジネスニーズに基づいてプロジェクトとデータへのアクセスを制御できます。

BigQuery には、コンソールウェブ UI、またはコマンドライン ツールからアクセスするか、Java、.NET、Python などのさまざまなクライアント ライブラリを使用して BigQuery REST API を呼び出すことでアクセスできます。各種サードパーティ製ツールを使用して BigQuery と通信し、データを可視化したり、データを読み込んだりすることも可能です。

このハンズオンラボでは、一般公開テーブルにクエリを実行し、サンプルデータを BigQuery に読み込む方法を説明します。

演習内容

  • 一般公開データセットに対してクエリを実行する

  • 新しいデータセットを作成する

  • 新しいテーブルにデータを読み込む

  • カスタム テーブルにクエリを実行する

設定と要件

[ラボを開始] ボタンをクリックする前に

こちらの手順をお読みください。ラボの時間は記録されており、一時停止することはできません。[ラボを開始] をクリックするとスタートするタイマーは、Google Cloud のリソースを利用できる時間を示しています。

この Qwiklabs ハンズオンラボでは、シミュレーションやデモ環境ではなく、実際のクラウド環境を使ってご自身でラボのアクティビティを行うことができます。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。

必要なもの

このラボを完了するためには、下記が必要です。

  • 標準的なインターネット ブラウザ(Chrome を推奨)
  • ラボを完了するために十分な時間

注: すでに個人の Google Cloud アカウントやプロジェクトをお持ちの場合でも、ラボでは使用しないでください。

注: Chrome OS デバイスを使用している場合は、シークレット ウィンドウを開いてこのラボを実行してください。

ラボを開始して Google Cloud コンソールにログインする方法

  1. [ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるポップアップでお支払い方法を選択してください。 左側の [ラボの詳細] パネルには、以下が表示されます。

    • [Google コンソールを開く] ボタン
    • 残り時間
    • このラボで使用する必要がある一時的な認証情報
    • このラボを行うために必要なその他の情報(ある場合)
  2. [Google コンソールを開く] をクリックします。 ラボでリソースが起動し、別のタブで [ログイン] ページが表示されます。

    ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。

    注: [アカウントの選択] ダイアログが表示されたら、[別のアカウントを使用] をクリックします。
  3. 必要に応じて、[ラボの詳細] パネルから [ユーザー名] をコピーして [ログイン] ダイアログに貼り付けます。[次へ] をクリックします。

  4. [ラボの詳細] パネルから [パスワード] をコピーして [ようこそ] ダイアログに貼り付けます。[次へ] をクリックします。

    重要: 認証情報は左側のパネルに表示されたものを使用してください。Google Cloud Skills Boost の認証情報は使用しないでください。 注: このラボでご自身の Google Cloud アカウントを使用すると、追加料金が発生する場合があります。
  5. その後次のように進みます。

    • 利用規約に同意してください。
    • 一時的なアカウントなので、復元オプションや 2 要素認証プロセスは設定しないでください。
    • 無料トライアルには登録しないでください。

その後このタブで Cloud Console が開きます。

注: 左上にある [ナビゲーション メニュー] をクリックすると、Google Cloud のプロダクトやサービスのリストが含まれるメニューが表示されます。 ナビゲーション メニュー アイコン

Google Cloud Shell の有効化

Google Cloud Shell は、デベロッパー ツールと一緒に読み込まれる仮想マシンです。5 GB の永続ホーム ディレクトリが用意されており、Google Cloud で稼働します。Google Cloud Shell では、コマンドラインで GCP リソースにアクセスできます。

GCP Console の右上のツールバーにある [Cloud Shell をアクティブにする] ボタンをクリックします。

Cloud Shell アイコン

[続行] をクリックします。

cloudshell_continue

環境のプロビジョニングと接続には少し時間がかかります。接続すると、すでに認証されており、プロジェクトは PROJECT_ID に設定されています。例えば:

Cloud Shell 端末

gcloud は Google Cloud Platform のコマンドライン ツールです。このツールは、Cloud Shell にプリインストールされており、タブ補完がサポートされています。

次のコマンドを使用すると、有効なアカウント名を一覧表示できます。

gcloud auth list

出力:

ACTIVE: *
ACCOUNT: student-01-xxxxxxxxxxxx@qwiklabs.net
To set the active account, run:
    $ gcloud config set account `ACCOUNT`
	

次のコマンドを使用すると、プロジェクト ID を一覧表示できます。

gcloud config list project
	

出力:

[core]
project = <project_ID>
	

出力例:

[core]
project = qwiklabs-gcp-44776a13dea667a6
	

タスク 1. BigQuery を開く

BigQuery コンソールには、テーブルに対してクエリを実行するためのインターフェースが用意されており、BigQuery が提供する一般公開データセットも利用できます。実行するクエリは、BigQuery が提供する一般公開データセットのテーブルにアクセスします。標準クエリ言語を使用してデータセットを検索し、返される結果の数は 10 に制限されます。

BigQuery コンソールを開く

  1. Google Cloud コンソールで、ナビゲーション メニュー > [BigQuery] を選択します。

[Cloud コンソールの BigQuery へようこそ] メッセージ ボックスが開きます。このメッセージ ボックスには、クイックスタート ガイドとリリースノートへのリンクが表示されます。

  1. [完了] をクリックします。

BigQuery コンソールが開きます。

タスク 2. 一般公開データセットに対してクエリを実行する

  1. [クエリを新規作成] をクリックします。次のクエリをコピーして、BigQuery クエリエディタに貼り付けます。

#standardSQL SELECT weight_pounds, state, year, gestation_weeks FROM `bigquery-public-data.samples.natality` ORDER BY weight_pounds DESC LIMIT 10;

このデータサンプルには、米国の出生(出生率)に関する情報が含まれています。

クエリが有効か無効かに応じて、緑色または赤色のチェックが表示されます。クエリが有効な場合は、クエリの実行後に処理されるデータ量も示されます。

これによって、クエリの実行にかかる費用について判断できます。

  1. [実行] ボタンをクリックします。

クエリ結果は次のようになります。

クエリ結果の結果テーブル

完了したタスクをテストする

[進行状況を確認] をクリックして、実行したタスクを確認します。一般公開データセットに実行したクエリが正常に完了すると、評価スコアが表示されます。

一般公開データセットにクエリを実行する(データセット: サンプル、テーブル: 出生率) 注: BigQuery で他の一般公開データセットのスキーマを参照するには、[+ 追加] > [一般公開データセット] をクリックし、[Marketplace を検索] フィールドで「bigquery public data」を検索します。

タスク 3. 新しいデータセットを作成する

カスタム データをテーブルに読み込むには、まず BigQuery データセットを作成する必要があります。

データセットは、プロジェクト内のテーブルとビューへのアクセス制御に役立ちます。このラボではテーブルを 1 つしか使用しませんが、テーブルを格納するデータセットは必要です。

  1. [エクスプローラ] ペインで、プロジェクト ID の近くにある [アクションを表示]([アイコンを表示] アイコン)をクリックし、次に [データセットを作成] をクリックします。

[エクスプローラ] セクションで強調表示されている [データセットを作成] オプション

  1. [データセット ID] に「babynames」と設定します。

  2. 他のすべてのフィールドはデフォルト設定のままにします。[データセットを作成] をクリックします。

これでデータセットが作成されました。

[エクスプローラ] セクションで強調表示されている babynames データセット

完了したタスクをテストする

[進行状況を確認] をクリックして、実行したタスクを確認します。BigQuery データセットが正常に作成されている場合は、評価スコアが表示されます。

新しいデータセットを作成する

タスク 4. 新しいテーブルにデータを読み込む

次に、babynames データセット内にテーブルを作成し、ストレージ バケットから新しいテーブルにデータファイルを読み込みます。

ここで使用するカスタムデータ ファイルには、米国社会保障局から提供された、人気のある赤ちゃんの名前に関する約 7 MB のデータが含まれています。

  1. Cloud コンソールで、[ナビゲーション メニュー] > [BigQuery] を選択し、BigQuery コンソールに戻ります。

  2. データセットの近くにある [アクションを表示]([アイコンを表示] アイコン)をクリックして、babynames データセットに移動し、[テーブルを作成] をクリックします。

  3. [テーブルを作成] ダイアログで以下のフィールドを設定します。その他のフィールドはデフォルト値のままにします。

フィールド
テーブルの作成元 Google Cloud Storage
GCS バケットからファイルを選択 spls/gsp072/baby-names/yob2014.txt
ファイル形式 CSV
テーブル names_2014
スキーマ > テキストとして編集 スライドして、テキストボックスに name:string,gender:string,count:integer を追加
  1. [テーブルを作成] ボタンをクリックします。

BigQuery がテーブルの作成とデータの読み込みを完了すると、babynames データセットに names_2014 テーブルが表示されます。

完了したタスクをテストする

[進行状況を確認] をクリックして、実行したタスクを確認します。一般公開データセットへのデータの読み込みが正常に完了すると、評価スコアが表示されます。

テーブルにデータを読み込む

タスク 5. テーブルをプレビューする

テーブルを確認しましょう。最初の数行のデータを表示します。

  • 左側のパネルの names_2014 テーブルをクリックし、[プレビュー] をクリックします。

[プレビュー] タブページ

テーブルにクエリを実行する準備ができました。

タスク 6. カスタム データセットにクエリを実行する

カスタム データセットにクエリを実行する方法は、前に行った一般公開データセットへのクエリの実行と同じですが、一般公開テーブルではなく自分のテーブルにクエリを実行する点が異なります。

  1. BigQuery で、上部の [+](クエリを新規作成)アイコンをクリックします。

  2. 次のクエリをクエリエディタに貼り付けるか入力します。

注: テーブル名が babynames でない場合は、コードをそのテーブル名に合わせて変更してください。 #standardSQL SELECT name, count FROM `babynames.names_2014` WHERE gender = 'M' ORDER BY count DESC LIMIT 5;
  1. [実行] ボタンをクリックします。 クエリを実行すると、テーブルに読み込んだデータのうち、男の子の名前の年間ランキング(2014 年)上位 5 つが表示されます。

完了したタスクをテストする

[進行状況を確認] をクリックして、実行したタスクを確認します。カスタム データセットに実行したクエリが正常に完了すると、評価スコアが表示されます。

カスタム データセットにクエリを実行する

タスク 7. 理解度チェック

これから、このラボのコンセプトの理解を深めてもらうために正誤問題を出題します。正解を目指して頑張ってください。

お疲れさまでした

BigQuery ウェブ UI を使用して一般公開テーブルにクエリを実行し、サンプルデータを BigQuery に読み込みました。

クエストを完了する

このセルフペース ラボは、「BigQuery Basics for Data Analysts」クエストの一部です。クエストとは学習パスを構成する一連のラボのことで、完了すると成果が認められて上のようなバッジが贈られます。バッジは公開して、オンライン レジュメやソーシャル メディア アカウントにリンクできます。こちらのクエストに登録すると、すぐにクレジットを受け取ることができます。受講可能な全クエストについては、Google Cloud Skills Boost カタログをご覧ください。

次のステップと詳細情報

このラボは、Google Cloud の多くの機能を体験できる「Qwik Start」と呼ばれるラボシリーズの一部です。ラボカタログで「Qwik Start」を検索し、興味のあるラボを探してみてください。

Google Cloud Training & Certification

Google Cloud 技術を最大限に活用できるようになります。このクラスでは、必要な技術力とベスト プラクティスを習得し、継続的に学習することができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、仮想環境など、多忙なスケジュールに対応できるオプションが用意されています。認定資格を取得することで、Google Cloud の技術のスキルと知識を証明できます。

マニュアルの最終更新日: 2023 年 4 月 25 日

ラボの最終テスト日: 2023 年 4 月 25 日

Copyright 2020 Google LLC All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。