GSP410

概要
BigQuery は、Google が低価格で提供する NoOps、フルマネージドの分析データベースです。BigQuery では、インフラストラクチャを所有して管理したりデータベース管理者を置いたりすることなく、テラバイト単位の大規模なデータでクエリを実行できます。また、SQL が採用されており、従量課金制というメリットもあります。このような特長を活かし、有用な情報を得るためのデータ分析に専念できます。
ここでは、ecommerce データセットを使用します。このデータセットには、Google Merchandise Store に関する数百万件の Google アナリティクス レコードが含まれており、BigQuery に読み込まれています。このデータセットのコピーを使用して、フィールドや行からどのような分析情報が得られるのかを確認します。
このラボでは、既存の ecommerce データセットから新しい永続的なレポート テーブルと論理ビューを作成する方法について学びます。
設定と要件
[ラボを開始] ボタンをクリックする前に
こちらの説明をお読みください。ラボには時間制限があり、一時停止することはできません。タイマーは、Google Cloud のリソースを利用できる時間を示しており、[ラボを開始] をクリックするとスタートします。
このハンズオンラボでは、シミュレーションやデモ環境ではなく実際のクラウド環境を使って、ラボのアクティビティを行います。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。
このラボを完了するためには、下記が必要です。
- 標準的なインターネット ブラウザ(Chrome を推奨)
注: このラボの実行には、シークレット モード(推奨)またはシークレット ブラウジング ウィンドウを使用してください。これにより、個人アカウントと受講者アカウント間の競合を防ぎ、個人アカウントに追加料金が発生しないようにすることができます。
- ラボを完了するための時間(開始後は一時停止できません)
注: このラボでは、受講者アカウントのみを使用してください。別の Google Cloud アカウントを使用すると、そのアカウントに料金が発生する可能性があります。
ラボを開始して Google Cloud コンソールにログインする方法
-
[ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるダイアログでお支払い方法を選択してください。
左側の [ラボの詳細] ペインには、以下が表示されます。
- [Google Cloud コンソールを開く] ボタン
- 残り時間
- このラボで使用する必要がある一時的な認証情報
- このラボを行うために必要なその他の情報(ある場合)
-
[Google Cloud コンソールを開く] をクリックします(Chrome ブラウザを使用している場合は、右クリックして [シークレット ウィンドウで開く] を選択します)。
ラボでリソースがスピンアップし、別のタブで [ログイン] ページが表示されます。
ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。
注: [アカウントの選択] ダイアログが表示されたら、[別のアカウントを使用] をクリックします。
-
必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。
{{{user_0.username | "Username"}}}
[ラボの詳細] ペインでもユーザー名を確認できます。
-
[次へ] をクリックします。
-
以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。
{{{user_0.password | "Password"}}}
[ラボの詳細] ペインでもパスワードを確認できます。
-
[次へ] をクリックします。
重要: ラボで提供された認証情報を使用する必要があります。Google Cloud アカウントの認証情報は使用しないでください。
注: このラボでご自身の Google Cloud アカウントを使用すると、追加料金が発生する場合があります。
-
その後次のように進みます。
- 利用規約に同意してください。
- 一時的なアカウントなので、復元オプションや 2 要素認証プロセスは設定しないでください。
- 無料トライアルには登録しないでください。
その後、このタブで Google Cloud コンソールが開きます。
注: Google Cloud のプロダクトやサービスにアクセスするには、ナビゲーション メニューをクリックするか、[検索] フィールドにサービス名またはプロダクト名を入力します。
BigQuery コンソールを開く
- Google Cloud コンソールで、ナビゲーション メニュー > [BigQuery] を選択します。
[Cloud コンソールの BigQuery へようこそ] メッセージ ボックスが開きます。このメッセージ ボックスには、クイックスタート ガイドとリリースノートへのリンクが表示されます。
- [完了] をクリックします。
BigQuery コンソールが開きます。
タスク 1. テーブルを保存するための新しいデータセットを作成する
-
BigQuery で、プロジェクト ID の横にある [アクションを表示] アイコンをクリックし、[データセットを作成] を選択します。
-
[データセット ID] に「ecommerce」と入力します。他のオプションはすべてデフォルト値のままにします([データのロケーション]、[デフォルトのテーブルの有効期限])。
-
[データセットを作成] をクリックします。
![[アクションを表示] アイコンと [データセットを作成] メニュー オプションがハイライト表示された BigQuery コンソール](https://cdn.qwiklabs.com/S1%2FczpH6SUYCwwagRULQg2OrODwAFc2akhkiG3OtKqU%3D)
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
テーブルを保存するための新しいデータセットを作成する
タスク 2. CREATE TABLE ステートメントのトラブルシューティング
あなたは、データ アナリスト チームから新しい ecommerce データセットに永続テーブルを作成するためのクエリ ステートメントを受け取りましたが、正常に機能しません。
各クエリが機能しない理由を診断して、問題を解決してください。
BigQuery で SQL を使用してテーブルを作成する際のルール
以下のテーブル作成ルールを読み、正常に機能しないクエリを修正するためのガイドとして活用してください。
- 指定した列リスト、query_statement から推定される列の、いずれかまたは両方が存在する必要がある。
- 列リストと as query_statement 句の両方が存在する場合、BigQuery は、as query_statement 句内の名前を無視し、位置をもとにして列を列リストに一致させる。
- as query_statement 句が存在し、列リストが存在しない場合、BigQuery は、列の名前と型を as query_statement 句から判断する。
- 列リスト、as query_statement 句のいずれかで列名が指定されている必要がある。
- 列名を重複させることはできない。
クエリ 1: 列、列、列
- 以下のクエリを BigQuery エディタに追加して [実行] をクリックし、エラーを診断して次の質問に答えてください。
#standardSQL
# 探索対象の 1 日分の e コマースデータをコピー
CREATE OR REPLACE TABLE ecommerce.all_sessions_raw_20170801
OPTIONS(
description="Raw data from analyst team into our dataset for 08/01/2017"
) AS
SELECT fullVisitorId, * FROM `data-to-insights.ecommerce.all_sessions_raw`
WHERE date = '20170801' #56,989 件のレコード
;
Error: CREATE TABLE has columns with duplicate name fullVisitorId at [7:2]
上のクエリはどのテーブル作成ルールに違反していますか。
クエリ 2: 列の再確認
- 以下のクエリを BigQuery エディタに追加して [実行] をクリックし、エラーを診断して次の質問に答えてください。
#standardSQL
# 探索対象の 1 日分の e コマースデータをコピー
CREATE OR REPLACE TABLE ecommerce.all_sessions_raw_20170801
#スキーマ
(
fullVisitorId STRING OPTIONS(description="Unique visitor ID"),
channelGrouping STRING OPTIONS(description="Channel e.g. Direct, Organic, Referral...")
)
OPTIONS(
description="Raw data from analyst team into our dataset for 08/01/2017"
) AS
SELECT * FROM `data-to-insights.ecommerce.all_sessions_raw`
WHERE date = '20170801' #56,989 件のレコード
;
Error: The number of columns in the column definition list does not match the number of columns produced by the query at [5:1]
上のクエリはどのテーブル作成ルールに違反していますか。
注: 新しいテーブルに対して指定するフィールドのスキーマは、クエリ ステートメントによって返される列の数に対応している必要があります。上の例では、fullVisitorId
と channelGrouping
の 2 つの列を含むスキーマが指定されていますが、クエリ ステートメントでは、返されるすべての列(*)が指定されています。
クエリ 3: 本当に有効か
- 以下のクエリを BigQuery エディタに追加して [実行] をクリックし、エラーを診断して次の質問に答えてください。
#standardSQL
# 探索対象の 1 日分の e コマースデータをコピー
CREATE OR REPLACE TABLE ecommerce.all_sessions_raw_20170801
#スキーマ
(
fullVisitorId STRING OPTIONS(description="Unique visitor ID"),
channelGrouping STRING OPTIONS(description="Channel e.g. Direct, Organic, Referral...")
)
OPTIONS(
description="Raw data from analyst team into our dataset for 08/01/2017"
) AS
SELECT fullVisitorId, city FROM `data-to-insights.ecommerce.all_sessions_raw`
WHERE date = '20170801' #56,989 件のレコード
;
Valid: This query will process 1.1 GiB when run.
ルール 2 を思い出してください。列リストと as
query_statement 句の両方が存在する場合、BigQuery は、as
query_statement 句内の名前を無視し、位置をもとにして列を列リストに一致させます。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
テーブルを作成する
クエリ 4: ゲートキーパー
- 以下のクエリを BigQuery エディタで実行し、エラーを診断して次の質問に答えてください。
#standardSQL
# 探索対象の 1 日分の e コマースデータをコピー
CREATE OR REPLACE TABLE ecommerce.all_sessions_raw_20170801
#スキーマ
(
fullVisitorId STRING NOT NULL OPTIONS(description="Unique visitor ID"),
channelGrouping STRING NOT NULL OPTIONS(description="Channel e.g. Direct, Organic, Referral..."),
totalTransactionRevenue INT64 NOT NULL OPTIONS(description="Revenue * 10^6 for the transaction")
)
OPTIONS(
description="Raw data from analyst team into our dataset for 08/01/2017"
) AS
SELECT fullVisitorId, channelGrouping, totalTransactionRevenue FROM `data-to-insights.ecommerce.all_sessions_raw`
WHERE date = '20170801' #56,989 件のレコード
;
Valid: This query will process 907.52 MiB when run.
エラーを修正してクエリを再実行し、正常に実行されることを確認します。
クエリ 5: 正常に機能
- 以下のクエリを BigQuery エディタで実行し、次の質問に答えてください。
#standardSQL
# 探索対象の 1 日分の e コマースデータをコピー
CREATE OR REPLACE TABLE ecommerce.all_sessions_raw_20170801
#スキーマ
(
fullVisitorId STRING NOT NULL OPTIONS(description="Unique visitor ID"),
channelGrouping STRING NOT NULL OPTIONS(description="Channel e.g. Direct, Organic, Referral..."),
totalTransactionRevenue INT64 OPTIONS(description="Revenue * 10^6 for the transaction")
)
OPTIONS(
description="Raw data from analyst team into our dataset for 08/01/2017"
) AS
SELECT fullVisitorId, channelGrouping, totalTransactionRevenue FROM `data-to-insights.ecommerce.all_sessions_raw`
WHERE date = '20170801' #56,989 件のレコード
;
-
ecommerce データセットのパネルを参照して、
all_sessions_raw_(1)
が存在することを確認します。
完全なテーブル名が表示されないのはなぜですか。
答え: サフィックス 20170801 のテーブルは、日付によって自動的に分割されます。別の日のテーブルを作成すると、all_sessions_raw_(N)
の N の値がその日数分だけ増加します。データテーブルを分割するさまざまな方法については、別のラボで取り扱っています。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
正常に機能
クエリ 6: 実習
目標: クエリエディタで、2017 年 8 月 1 日の収益があったトランザクションをすべて保存する新しい永続テーブルを作成します。
以下のルールを参考にしてください。
- ecommerce データセットに revenue_transactions_20170801 という名前の新しいテーブルを作成します。このテーブルがすでに存在する場合は置き換えます。
- 元データのソースに data-to-insights.ecommerce.all_sessions_raw テーブルを使用します。
- 収益フィールドを 1,000,000 で割り、INTEGER ではなく FLOAT64 として保存します。
- 収益があったトランザクションのみを最終的なテーブルに含めます(ヒント: WHERE 句を使用します)。
- 20170801 のトランザクションのみを含めます。
- 以下のフィールドを含めます。
- fullVisitorId(必須の文字列フィールドとして)
- visitId(必須の文字列フィールドとして。ヒント: 型変換が必要です)
- channelGrouping(必須の文字列フィールドとして)
- totalTransactionRevenue(FLOAT64 フィールドとして)
- 上の 4 つのフィールドの簡単な説明を追加します(スキーマを参照してください)。
-
fullVisitorId
と visitId
の値が同じレコードの重複除去を忘れないようにしてください(ヒント: DISTINCT を使用します)。
- BigQuery で上記に対する解答を記述し、下記の正解例と比較します。
正解例:
#standardSQL
# 探索対象の 1 日分の e コマースデータをコピー
CREATE OR REPLACE TABLE ecommerce.revenue_transactions_20170801
#スキーマ
(
fullVisitorId STRING NOT NULL OPTIONS(description="Unique visitor ID"),
visitId STRING NOT NULL OPTIONS(description="ID of the session, not unique across all users"),
channelGrouping STRING NOT NULL OPTIONS(description="Channel e.g. Direct, Organic, Referral..."),
totalTransactionRevenue FLOAT64 NOT NULL OPTIONS(description="Revenue for the transaction")
)
OPTIONS(
description="Revenue transactions for 08/01/2017"
) AS
SELECT DISTINCT
fullVisitorId,
CAST(visitId AS STRING) AS visitId,
channelGrouping,
totalTransactionRevenue / 1000000 AS totalTransactionRevenue
FROM `data-to-insights.ecommerce.all_sessions_raw`
WHERE date = '20170801'
AND totalTransactionRevenue IS NOT NULL #XX 件のトランザクション
;
-
クエリが正常に実行されたら、ecommerce データセットに revenue_transactions_20170801 という名前の新しいテーブルがあることを確認して、そのテーブルを選択します。
-
スキーマが以下の例のようになっていることを確認します。フィールドのタイプ、モード、説明(任意)に注目します。
![スキーマの詳細(フィールド名、タイプ、モード、説明)が一覧表示された [スキーマ] タブページ](https://cdn.qwiklabs.com/2Gu%2BV5WL0Wd4n8nk30MpPIn4xwDoy1UePQ2WM5lJ3mA%3D)
上流のソースデータの更新に対処する
データが古くならないようにするには
レポート テーブルのデータが古くならないようにするには次の 2 つの方法があります。
- 新しいレコードを挿入するクエリを再実行して永続テーブルを定期的に更新する。これを行うには、BigQuery でクエリをスケジュールするか、Cloud Dataprep または Cloud Dataflow のワークフローを使用します。
- 論理ビューを使用して、ビューが選択されるたびに保存したクエリを再実行する。
以降では、論理ビューの作成方法について学びます。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
テーブルを作成する
タスク 3. ビューを作成する
ビューとは保存されたクエリのことで、ビューが呼び出されるたびにそれらのクエリが実行されます。BigQuery のビューは論理ビューであり、実体化されたビューではありません。つまり、ビューの構成要素として保存されるのはクエリのみで、基になるデータは保存されません。
トランザクションを新しい順に 100 件表示する
- 以下のクエリをコピーして貼り付け、BigQuery で実行します。
#standardSQL
SELECT DISTINCT
date,
fullVisitorId,
CAST(visitId AS STRING) AS visitId,
channelGrouping,
totalTransactionRevenue / 1000000 AS totalTransactionRevenue
FROM `data-to-insights.ecommerce.all_sessions_raw`
WHERE totalTransactionRevenue IS NOT NULL
ORDER BY date DESC # 最新のトランザクション
LIMIT 100
;
- 結果に目を通してフィルタします。2,000 ドルを超えている最も新しいトランザクションはどれですか。
答え:
date
|
fullVisitorId
|
visitId
|
channelGrouping
|
totalTransactionRevenue
|
20170801
|
9947542428111966715
|
1501608078
|
Referral
|
2934.61
|
この ecommerce 一般公開データセットに新しいレコードが追加された場合、最も新しいトランザクションも更新されることになります。
- 時間を節約し、整理や共同作業をしやすくするために、よく使うレポートクエリをビューとして保存できます。以下に例を示します。
#standardSQL
CREATE OR REPLACE VIEW ecommerce.vw_latest_transactions
AS
SELECT DISTINCT
date,
fullVisitorId,
CAST(visitId AS STRING) AS visitId,
channelGrouping,
totalTransactionRevenue / 1000000 AS totalTransactionRevenue
FROM `data-to-insights.ecommerce.all_sessions_raw`
WHERE totalTransactionRevenue IS NOT NULL
ORDER BY date DESC # 最新のトランザクション
LIMIT 100
;
注: SELECT の対象がテーブルなのかビューなのかが、名前を見ただけではわかりにくいことがよくあります。そのため、ビュー名の先頭に vw_
を付けたり、末尾に _vw
や _view
を付けたりするのが慣例になっています。
OPTIONS を使用してビューに説明とラベルを付けることもできます。
- 以下のクエリをコピーして貼り付け、BigQuery で実行します。
#standardSQL
CREATE OR REPLACE VIEW ecommerce.vw_latest_transactions
OPTIONS(
description="latest 100 ecommerce transactions",
labels=[('report_type','operational')]
)
AS
SELECT DISTINCT
date,
fullVisitorId,
CAST(visitId AS STRING) AS visitId,
channelGrouping,
totalTransactionRevenue / 1000000 AS totalTransactionRevenue
FROM `data-to-insights.ecommerce.all_sessions_raw`
WHERE totalTransactionRevenue IS NOT NULL
ORDER BY date DESC # 最新のトランザクション
LIMIT 100
;
-
ecommerce データセットで、新たに作成された vw_latest_transactions
テーブルを見つけて選択します。
-
[詳細] タブを選択します。
-
ビューに割り当てた [説明] と [ラベル] が BigQuery の UI に正しく表示されていることを確認します。
[詳細] ページでは、ビューを定義しているクエリを表示することもできます。自分またはチームが作成したビューのロジックを把握するのに便利です。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
ビューを作成する
- では、以下のクエリを実行して新しいビューを作成してみましょう。
#standardSQL
# 最新の 50 件のトランザクション
CREATE VIEW ecommerce.vw_latest_transactions # CREATE
OPTIONS(
description="latest 50 ecommerce transactions",
labels=[('report_type','operational')]
)
AS
SELECT DISTINCT
date,
fullVisitorId,
CAST(visitId AS STRING) AS visitId,
channelGrouping,
totalTransactionRevenue / 1000000 AS totalTransactionRevenue
FROM `data-to-insights.ecommerce.all_sessions_raw`
WHERE totalTransactionRevenue IS NOT NULL
ORDER BY date DESC # 最新のトランザクション
LIMIT 50
;
Error: Already Exists: Table project-name:ecommerce.vw_latest_transactions
このビューがすでに作成されている場合、おそらくエラーが発生します。なぜでしょうか。
答え: ビュー作成ステートメントが更新され、CREATE OR REPLACE ではなく単に CREATE となっているため、テーブルやビューがすでに存在する場合はそれらを上書きできません。第 3 の選択肢である CREATE VIEW IF NOT EXISTS を使用すると、テーブルやビューが存在しない場合にのみ作成され、存在する場合はエラーなしでスキップされます。
ビューの作成: 実習
シナリオ: あなたは不正防止を担当するチームから、注文金額が 1,000 以上のトランザクションを新しい順に 10 件表示するレポートを作成して、それらを手動で確認できるようにして欲しいと依頼されました。
タスク: 収益が 1,000 以上である 2017 年 1 月 1 日以降のトランザクションを、新しい順に 10 件返す新しいビューを作成します。
以下のルールを参考にしてください。
-
ecommerce データセットに「vw_large_transactions」という名前の新しいビューを作成します。このビューがすでに存在する場合は置き換えます。
-
そのビューに「large transactions for review」という説明を割り当てます。
-
そのビューに「[("org_unit", "loss_prevention")]」というラベルを割り当てます。
-
元データのソースに data-to-insights.ecommerce.all_sessions_raw
テーブルを使用します。
-
収益フィールドを 1,000,000 で割ります。
-
収益が 1,000 以上のトランザクションのみを含めます。
-
トランザクションを新しい順に並べて 20170101 以降のトランザクションのみを含めます。
-
currencyCode = 'USD' のトランザクションのみを含めます。
-
以下のフィールドを返します。
- date
- fullVisitorId
- visitId
- channelGrouping
- totalTransactionRevenue AS revenue
- currencyCode
- v2ProductName
-
レコードの重複除去を忘れないようにしてください(ヒント: DISTINCT を使用します)。
-
解答:
/*
BigQuery で上記に対する解答を記述し、下記の正解例と比較します
*/
正解例:
#standardSQL
CREATE OR REPLACE VIEW ecommerce.vw_large_transactions
OPTIONS(
description="large transactions for review",
labels=[('org_unit','loss_prevention')]
)
AS
SELECT DISTINCT
date,
fullVisitorId,
visitId,
channelGrouping,
totalTransactionRevenue / 1000000 AS revenue,
currencyCode
#v2ProductName
FROM `data-to-insights.ecommerce.all_sessions_raw`
WHERE
(totalTransactionRevenue / 1000000) > 1000
AND currencyCode = 'USD'
ORDER BY date DESC # 最新のトランザクション
LIMIT 10
;
フィールド名のエイリアスをフィルタとして使用することはできないため、WHERE 句で除算を繰り返す必要があります。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
最新 10 件のトランザクションを返す新しいビューを作成する
追加の実習
シナリオ: 作成したクエリは不正防止担当チームに喜ばれ、疑わしい注文を見つけるために日々活用されています。そこで今度は、各注文に含まれる商品のサンプルをクエリの結果に含めるように依頼されました。
BigQuery の文字列集計関数 STRING_AGG と v2ProductName
フィールドを使用して前のクエリを変更し、各注文に含まれる商品の名前をアルファベット順に 10 件返します。
正解例:
#standardSQL
CREATE OR REPLACE VIEW ecommerce.vw_large_transactions
OPTIONS(
description="large transactions for review",
labels=[('org_unit','loss_prevention')]
)
AS
SELECT DISTINCT
date,
fullVisitorId,
visitId,
channelGrouping,
totalTransactionRevenue / 1000000 AS totalTransactionRevenue,
currencyCode,
STRING_AGG(DISTINCT v2ProductName ORDER BY v2ProductName LIMIT 10) AS products_ordered
FROM `data-to-insights.ecommerce.all_sessions_raw`
WHERE
(totalTransactionRevenue / 1000000) > 1000
AND currencyCode = 'USD'
GROUP BY 1,2,3,4,5,6
ORDER BY date DESC # 最新のトランザクション
LIMIT 10
ここでは 2 つの要素が追加されています。1 つは、各注文の商品を集計するための STRING_AGG() です。もう 1 つは、集計を実行するために必要な、その他のフィールドの GROUP BY です。
ビューで SESSION_USER() を使用してデータアクセスを制限する
シナリオ: データチームのリーダーから、前述のビューによって返されるデータを表示できる組織内の人物を制限できるようにして欲しいと依頼されました。注文情報は特に機密性が高いため、必要なユーザー以外には共有されないようにする必要があります。
タスク: 先に作成したビューを変更して、セッション ドメインが qwiklabs.net のログイン ユーザーのみが基になるビューのデータを表示できるようにします(注: 特定のユーザー グループの許可リストは、アクセスに関する別のラボで作成します。ここでは、セッション ユーザーのドメインに基づいてユーザーを選別します)。
- 自分のセッションのログイン情報を表示するには、SESSION_USER() を使用する以下のクエリを実行します。
#standardSQL
SELECT
SESSION_USER() AS viewer_ldap;
xxxx@qwiklabs.net と表示されます。
- 以下のクエリを変更して、
qwiklabs.net
ドメインのユーザーにのみビューの結果の表示を許可するフィルタを追加します。
#standardSQL
SELECT DISTINCT
SESSION_USER() AS viewer_ldap,
REGEXP_EXTRACT(SESSION_USER(), r'@(.+)') AS domain,
date,
fullVisitorId,
visitId,
channelGrouping,
totalTransactionRevenue / 1000000 AS totalTransactionRevenue,
currencyCode,
STRING_AGG(DISTINCT v2ProductName ORDER BY v2ProductName LIMIT 10) AS products_ordered
FROM `data-to-insights.ecommerce.all_sessions_raw`
WHERE
(totalTransactionRevenue / 1000000) > 1000
AND currencyCode = 'USD'
# ここにフィルタを追加
GROUP BY 1,2,3,4,5,6,7,8
ORDER BY date DESC # 最新のトランザクション
LIMIT 10
正解例:
#standardSQL
SELECT DISTINCT
SESSION_USER() AS viewer_ldap,
REGEXP_EXTRACT(SESSION_USER(), r'@(.+)') AS domain,
date,
fullVisitorId,
visitId,
channelGrouping,
totalTransactionRevenue / 1000000 AS totalTransactionRevenue,
currencyCode,
STRING_AGG(DISTINCT v2ProductName ORDER BY v2ProductName LIMIT 10) AS products_ordered
FROM `data-to-insights.ecommerce.all_sessions_raw`
WHERE
(totalTransactionRevenue / 1000000) > 1000
AND currencyCode = 'USD'
AND REGEXP_EXTRACT(SESSION_USER(), r'@(.+)') IN ('qwiklabs.net')
GROUP BY 1,2,3,4,5,6,7,8
ORDER BY date DESC # 最新のトランザクション
LIMIT 10
- 上のクエリを実行して、返されたレコードが表示されることを確認します。
REGEXP_EXTRACT(SESSION_USER(), r'@(.+)') IN ('')
の IN フィルタからすべてのドメインを削除してクエリをもう一度実行し、返されたレコードが 1 つも表示されないことを確認します。
-
vw_large_transactions ビューを再作成して、上の新しいクエリで置き換えます。さらに、OPTIONS のパラメータに
expiration_timestamp
を追加して、ビュー全体の有効期限を今から 90 日に設定します。
expiration_timestamp=TIMESTAMP_ADD(CURRENT_TIMESTAMP(), INTERVAL 90 DAY).
正解例:
#standardSQL
CREATE OR REPLACE VIEW ecommerce.vw_large_transactions
OPTIONS(
description="large transactions for review",
labels=[('org_unit','loss_prevention')],
expiration_timestamp=TIMESTAMP_ADD(CURRENT_TIMESTAMP(), INTERVAL 90 DAY)
)
AS
#standardSQL
SELECT DISTINCT
SESSION_USER() AS viewer_ldap,
REGEXP_EXTRACT(SESSION_USER(), r'@(.+)') AS domain,
date,
fullVisitorId,
visitId,
channelGrouping,
totalTransactionRevenue / 1000000 AS totalTransactionRevenue,
currencyCode,
STRING_AGG(DISTINCT v2ProductName ORDER BY v2ProductName LIMIT 10) AS products_ordered
FROM `data-to-insights.ecommerce.all_sessions_raw`
WHERE
(totalTransactionRevenue / 1000000) > 1000
AND currencyCode = 'USD'
AND REGEXP_EXTRACT(SESSION_USER(), r'@(.+)') IN ('qwiklabs.net')
GROUP BY 1,2,3,4,5,6,7,8
ORDER BY date DESC # 最新のトランザクション
LIMIT 10;
注: expiration_timestamp オプションは永続テーブルにも適用できます。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
ビューで session_user を含むクエリを実行してデータアクセスを制限する
- 以下の SELECT ステートメントを使用して、ビューで返されるデータを(現在のドメイン アクセス権で)表示できること、ビューの詳細に有効期限のタイムスタンプが表示されることを確認します。
#standardSQL
SELECT * FROM ecommerce.vw_large_transactions;
お疲れさまでした
ここでは、BigQuery で SQL DDL(データ定義言語)を使用してテーブルとアクセス制御ビューを作成しました。
次のステップと詳細情報
すでに Google アナリティクス アカウントをお持ちで、BigQuery で独自のデータセットに対してクエリを実行されたい場合は、こちらのエクスポート ガイドに沿って行ってください。
マニュアルの最終更新日: 2024 年 12 月 24 日
ラボの最終テスト日: 2024 年 12 月 24 日
Copyright 2025 Google LLC. All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。