700 以上のラボとコースにアクセス

BigQuery に新しいデータセットを取り込む

ラボ 1時間 universal_currency_alt クレジット: 1 show_chart 入門

info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。

GSP411
概要
設定と要件
タスク 1. テーブルを格納するための新しいデータセットを作成する
タスク 2. CSV から新しいデータセットを取り込む
タスク 3. Cloud Storage からのデータを取り込む
タスク 4. Google スプレッドシートから新しいデータセットを取り込む
タスク 5. Google スプレッドシートにデータを保存する
タスク 6. 外部テーブルのパフォーマンスとデータ品質の考慮事項
お疲れさまでした

700 以上のラボとコースにアクセス

GSP411

Google Cloud セルフペースラボのロゴ

概要

BigQuery は、Google が低料金で提供する NoOps のフルマネージド分析データベースです。インフラストラクチャを所有して管理したり、データベース管理者を配置したりすることなく、テラバイト単位の大規模なデータでクエリを実行できます。BigQuery は SQL を採用しており、従量課金制モデルで利用できます。このような特長を活かし、有用な情報を得るためのデータ分析に専念できます。

ここでは、ecommerce データセットを使用します。このデータセットには、Google Merchandise Store に関する数百万件の Google アナリティクスレコードが含まれており、BigQuery に読み込まれています。このデータセットのコピーを使用して、フィールドや行からどのような分析情報が得られるのかを確認します。

このラボでは、数種類のデータセットを BigQuery 内のテーブルに取り込みます。

設定と要件

[ラボを開始] ボタンをクリックする前に

こちらの説明をお読みください。ラボには時間制限があり、一時停止することはできません。タイマーは、Google Cloud のリソースを利用できる時間を示しており、[ラボを開始] をクリックするとスタートします。

このハンズオンラボでは、シミュレーションやデモ環境ではなく実際のクラウド環境を使って、ラボのアクティビティを行います。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。

このラボを完了するためには、下記が必要です。

標準的なインターネットブラウザ（Chrome を推奨）

注: このラボの実行には、シークレットモード（推奨）またはシークレットブラウジングウィンドウを使用してください。これにより、個人アカウントと受講者アカウント間の競合を防ぎ、個人アカウントに追加料金が発生しないようにすることができます。

ラボを完了するための時間（開始後は一時停止できません）

注: このラボでは、受講者アカウントのみを使用してください。別の Google Cloud アカウントを使用すると、そのアカウントに料金が発生する可能性があります。

ラボを開始して Google Cloud コンソールにログインする方法

[ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるダイアログでお支払い方法を選択してください。左側の [ラボの詳細] ペインには、以下が表示されます。
- [Google Cloud コンソールを開く] ボタン
- 残り時間
- このラボで使用する必要がある一時的な認証情報
- このラボを行うために必要なその他の情報（ある場合）
[Google Cloud コンソールを開く] をクリックします（Chrome ブラウザを使用している場合は、右クリックして [シークレットウィンドウで開く] を選択します）。

ラボでリソースがスピンアップし、別のタブで [ログイン] ページが表示されます。

ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。
注: [アカウントの選択] ダイアログが表示されたら、[別のアカウントを使用] をクリックします。
必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。
{{{user_0.username | "Username"}}}
[ラボの詳細] ペインでもユーザー名を確認できます。
[次へ] をクリックします。
以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。
{{{user_0.password | "Password"}}}
[ラボの詳細] ペインでもパスワードを確認できます。
[次へ] をクリックします。
重要: ラボで提供された認証情報を使用する必要があります。Google Cloud アカウントの認証情報は使用しないでください。注: このラボでご自身の Google Cloud アカウントを使用すると、追加料金が発生する場合があります。
その後次のように進みます。
- 利用規約に同意してください。
- 一時的なアカウントなので、復元オプションや 2 要素認証プロセスは設定しないでください。
- 無料トライアルには登録しないでください。

その後、このタブで Google Cloud コンソールが開きます。

注: Google Cloud のプロダクトやサービスにアクセスするには、ナビゲーションメニューをクリックするか、[検索] フィールドにサービス名またはプロダクト名を入力します。ナビゲーションメニューアイコンと検索フィールド

BigQuery コンソールを開く

Google Cloud コンソールで、ナビゲーションメニュー > [BigQuery] を選択します。

[Cloud コンソールの BigQuery へようこそ] メッセージボックスが開きます。このメッセージボックスには、クイックスタートガイドとリリースノートへのリンクが表示されます。

[完了] をクリックします。

BigQuery コンソールが開きます。

タスク 1. テーブルを格納するための新しいデータセットを作成する

データセットを作成するには、プロジェクト ID の横にある「アクションを表示」アイコンをクリックし、[データセットを作成] を選択します。

ハイライト表示された [データセットを作成] オプション

[データセット ID] に「ecommerce」と入力します。他のフィールドはデフォルト値のままにします。
[データセットを作成] をクリックします。

プロジェクト名の下に ecommerce データセットが表示されます。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。テーブルを格納するための新しいデータセットを作成する

タスク 2. CSV から新しいデータセットを取り込む

シナリオ: あなたはマーケティングチームから、プロモーションの対象にする商品を在庫ストックレベルに基づいて決定できるようにして欲しいと頼まれました。商品レビューに基づいて、各商品の顧客感情の傾向を把握できるようにする必要もあります。

既存の e コマーストランザクションデータセットには在庫ストックレベルや商品レビューのデータは含まれていませんが、運用チームとマーケティングチームから分析用に新しいデータセットが提供されています。

次のように作業を開始します。

商品のストックレベルのデータセットを、ローカルのコンピュータにダウンロードします（通常のウィンドウでファイルを開いてダウンロードします）。
テーブルを作成するには、e コマース データセットの横にある「アクションを表示」アイコンをクリックして、[開く] を選択します。
[テーブルを作成] をクリックします。
以下のテーブルオプションを指定します。

ソース:

テーブルの作成元: アップロード
ファイルを選択: 先ほどローカルにダウンロードしたファイルを選択
ファイル形式: CSV

送信先:

テーブル名: products

他の設定はデフォルト値のままにします。

スキーマ:

スキーマの [自動検出] をオンにする

ヒント: このチェックボックスが表示されない場合は、ファイル形式が Avro ではなく CSV になっていることを確認してください。

パーティションとクラスタの設定: デフォルト設定のまま

詳細オプション:

デフォルト設定のまま

[テーブルを作成] をクリックします。

ecommerce データセットの下に products テーブルが表示されます。

products テーブルを選択し、[詳細] をクリックします。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 CSV から新しいデータセットを取り込む

[プレビュー] を選択して、すべての列が読み込まれていることを確認します（以下はその一部を取り出したものです）。

SKU	name	orderedQuantity	stockLevel	restockingLeadTime
GGOEGDHQ014899	20 oz Stainless Steel Insulated Tumbler	499	652	2
GGOEGOAB022499	Satin Black Ballpoint Pen	403	477	2
GGOEYHPB072210	Twill Cap	1429	1997	2
GGOEGEVB071799	Pocket Bluetooth Speaker	214	246	2

CSV ファイルを新しい BigQuery テーブルに読み込むことができました。

新たに読み込んだデータを SQL で探索する

次に、基本的なクエリを使用して新しい products テーブルから分析情報を得る方法を実践します。

stockLevel の値が高い商品の上位 5 つを表示するクエリを BigQuery のエディタに記述します。

#standardSQL SELECT * FROM ecommerce.products ORDER BY stockLevel DESC LIMIT 5

タスク 3. Cloud Storage からのデータを取り込む

e コマース データセットの横にある「アクションを表示」アイコンをクリックしてテーブルを作成してから、[テーブルを作成] をクリックします。
以下のテーブルオプションを指定します。

ソース:

テーブルの作成元: Google Cloud Storage
Cloud Storage バケットからファイルを選択: spls/gsp411/exports/products.csv
ファイル形式: CSV

送信先:

テーブル名: products

その他の設定はすべてデフォルトのままにします。

スキーマ:

スキーマの [自動検出] をオンにします。

詳細オプション:

デフォルト設定のまま

[テーブルを作成] をクリックします。

うまくいきましたか？いいえ

エラーメッセージが表示されたら [ジョブに移動] をクリックして、[読み込みジョブを繰り返す] ボタンをクリックします。
[テーブルの作成] フォームで [詳細オプション] をクリックし、[書き込み設定] プルダウンメニューで [テーブルを上書きする] を選択します。
次に、[テーブルを作成] をクリックします。

テーブルが正常に作成されたことを確認します。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 Cloud Storage からのデータを取り込む

タスク 4. Google スプレッドシートから新しいデータセットを取り込む

[クエリを新規作成]（）をクリックします。
次のクエリを実行します。在庫回転率と補充に要する時間に基づいて、最初に補充すべき商品が示されます。

#standardSQL SELECT *, SAFE_DIVIDE(orderedQuantity,stockLevel) AS ratio FROM ecommerce.products WHERE # 注文された商品のうち # 在庫の 80% が消費された商品を含める orderedQuantity > 0 AND SAFE_DIVIDE(orderedQuantity,stockLevel) >= .8 ORDER BY restockingLeadTime DESC

注: プロジェクト名の相対パスを指定すると（project_id.ecommerce.products の代わりに ecommerce.products と指定するなど）、BigQuery では現在のプロジェクトのパスと見なされます。

タスク 5. Google スプレッドシートにデータを保存する

シナリオ: あなたは、サプライチェーン管理チームが商品についてのメモ（サプライヤーに再注文の連絡をしたかどうかなど）を記録できるようにする必要があります。これを迅速に実現するため、Google スプレッドシートを使用することにしました。

まずそのスプレッドシートを作成します。

[クエリ結果] で、[結果を保存する] を選択し、プルダウンから [Google スプレッドシート] を選択します。
ポップアップが開き、スプレッドシートを開くためのリンクが表示されます。[開く] を選択します。
そのスプレッドシートの G 列に「comments」という名前の新しいフィールドを追加し、最初の商品の行に「new shipment on the way」と入力して Enter キーを押します。

スプレッドシート内で強調表示されたコメント列

Google スプレッドシートで、[共有] を選択し、[リンクを取得] から [リンクをコピー] をクリックします。

BigQuery のタブに戻ります。
e コマース データセットの横にある「アクションを表示」アイコンをクリックし、[テーブルを作成] をクリックします。
以下のテーブルオプションを指定します。

ソース:

テーブルの作成元: ドライブ
ドライブの URI を選択: スプレッドシートの URL を入力
ファイル形式: Google スプレッドシート

送信先:

テーブルタイプ: デフォルトのまま（外部テーブル）
テーブル名: products_comments

スキーマ:

スキーマの [自動検出] をオンにします。

詳細オプション:

[スキップするヘッダー行] ボックスに 1 を入力する
すべてのオプションをデフォルトのままにする

[テーブルを作成] をクリックします。

注: 外部リンクテーブルを作成する際にはデータは取り込まれないため、読み込みジョブはありません。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 Google スプレッドシートから新しいデータセットを取り込む

外部スプレッドシートのデータをクエリする

「クエリを新規作成」アイコンをクリックします。

以下のクエリを追加して、[実行] をクリックします。

#standardSQL SELECT * FROM ecommerce.products_comments WHERE comments IS NOT NULL

クエリが実行されるのを待ちます。今度は新しい comments フィールドが返されます。

SKU	name	orderedQuantity	stockLevel	restockingLeadTime	ratio	comments
GGOENEBB078899	Cam Indoor Security Camera - USA	2139	2615	42	0.8179732314	new shipment on the way

Google スプレッドシートのタブに戻ります。
comments フィールドにさらにコメントを入力します。
BigQuery に戻り、[実行] をクリックしてクエリをもう一度実行します。

新しいデータが結果に正しく表示されることを確認します。

Google スプレッドシートから BigQuery への外部テーブル接続が作成されました。

タスク 6. 外部テーブルのパフォーマンスとデータ品質の考慮事項

BigQuery に外部テーブルをリンクする場合（Google スプレッドシートをリンクする場合や、Cloud Storage から直接リンクする場合など）、いくつかの制限があります。特に重要なのは次の 2 つです。

クエリの実行中にソースでデータの値が変更された場合、データの整合性は保証されません。
BigQuery でデータストレージを管理する場合に得られるパフォーマンス上のメリット（クエリ実行パスの自動最適化、一部のワイルドカード関数の無効化など）は、BigQuery の外部に保存されているデータソースでは得られません。

お疲れさまでした

新しいデータセットを作成し、CSV、Cloud Storage、Google ドライブから BigQuery に新しい外部データソースを取り込むことができました。

次のステップと詳細情報

すでに Google アナリティクスアカウントをお持ちで、BigQuery で独自のデータセットをクエリするには、こちらのエクスポートガイドに沿って行ってください。

Google Cloud トレーニングと認定資格

Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベストプラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。

マニュアルの最終更新日: 2024 年 11 月 11 日

ラボの最終テスト日: 2024 年 11 月 11 日

BigQuery に新しいデータセットを取り込む

BigQuery に新しいデータセットを取り込む

GSP411

概要

設定と要件

[ラボを開始] ボタンをクリックする前に

ラボを開始して Google Cloud コンソールにログインする方法

BigQuery コンソールを開く

タスク 1. テーブルを格納するための新しいデータセットを作成する

タスク 2. CSV から新しいデータセットを取り込む

新たに読み込んだデータを SQL で探索する

タスク 3. Cloud Storage からのデータを取り込む

タスク 4. Google スプレッドシートから新しいデータセットを取り込む

タスク 5. Google スプレッドシートにデータを保存する

外部スプレッドシートのデータをクエリする

タスク 6. 外部テーブルのパフォーマンスとデータ品質の考慮事項

お疲れさまでした

次のステップと詳細情報

Google Cloud トレーニングと認定資格

始める前に

シークレット ブラウジングを使用する

コンソールにログインする

シークレット ブラウジングを使用してラボを実行する

シークレットブラウジングを使用する

シークレットブラウジングを使用してラボを実行する