700 以上のラボとコースにアクセス

Data Catalog を使用して、複数プロジェクトでデータセットメタデータを探索する

ラボ 1時間 30分 universal_currency_alt クレジット: 1 show_chart 入門

info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。

GSP789
概要
設定と要件
シナリオ: ニューヨーク市に拠点を置く運輸会社の最高経営責任者
パート 1: オーナーロールで既存データ環境を探索する
タスク 1. オーナーロールで new_york_mv_collisions データセットを表示してクエリを実行できることを確認する
タスク 2. オーナーロールでシェアサイクル情報データセットを表示してクエリを実行できることを確認する
パート 2: アクセス制限があるユーザーで既存データ環境を探索する
タスク 3. データアナリストユーザーでログインしてプロジェクトアクセス制限を確認する
タスク 4. 非公開データセットに直接クエリを実行する
パート 3: Data Catalog を使用して、複数プロジェクトにあるデータセットにタグを付ける
タスク 5. BigQuery データセットから Data Catalog タグテンプレートを作成する
タスク 6. 新しい Data Catalog テンプレートを作成する
お疲れさまでした

700 以上のラボとコースにアクセス

Data Catalog は非推奨となり、2026 年 1 月 30 日に廃止されます。このラボは、引き続き必要に応じて実行することができます。

Data Catalog のユーザー、ワークロード、コンテンツを Dataplex Catalog に移行する手順については、「Data Catalog から Dataplex Catalog への移行」（https://cloud.google.com/dataplex/docs/transition-to-dataplex-catalog）をご覧ください。

GSP789

Google Cloud セルフペースラボのロゴ

概要

Data Catalog は、Dataplex 内のスケーラブルなフルマネージド型メタデータ管理サービスです。

データアセットの管理は、適切なツールがないと、時間と費用がかかる可能性があります。Data Catalog は、組織がデータアセットを検索、整理、説明できる、一元化された場所を提供します。

Data Catalog を使用する

Data Catalog では、主に 2 つの操作を行います。

アクセス可能なデータアセットを検索する
メタデータでアセットにタグ付けする

学習内容

このラボでは、次の方法について学びます。

2 つのプロジェクト、2 つのデータセット、2 つのユーザーアカウントを備えた、企業のシミュレーション環境でデータを探索する
UI で BigQuery テーブルを手動で移動する
後でタグ付けする機密データの列を把握するためにクエリを実行する
Data Catalog を使って、既存のデータセットを複数プロジェクトから検索する
Data Catalog のタグテンプレートを使って、リッチメタデータでアセットにタグ付けする

メリット

組織内の複数プロジェクトでデータアセットを表示する
再利用可能なタグテンプレートを作成し、チームのためにリッチデータの説明を追加する
PII（個人を特定できる情報）が含まれるデータセットを素早くハイライト表示する
メタデータのアクセス制御は、ログインしたユーザーに基づいて継承される（別の Data Catalog ACL は不要）

前提条件

最重要: ラボを開始する前に個人または企業の Gmail アカウントからログアウトするか、このラボをシークレットモードで実行してください。これにより、ラボの受講中にログインによる混乱を避けることができます。

設定と要件

まだ開始していない場合は、[ラボを開始] をクリックします。
ヒント: ラボ環境で 2 つの Google Cloud プロジェクト、2 つの事前入力データセット、2 つのユーザーアカウントが自動生成されるまで 3～5 分かかります。ラボのリソースの準備が完了していなくても、説明を読み進めて構いません（以下のシナリオを読み終えるまで、ログインはしません）。
ラボで [Open Bike Console] をクリックするか、ブラウザの新しいウィンドウをシークレットモードで開いて、Cloud コンソールに移動します。提供されているアカウントでまだログインせずに、シナリオを読み進めてください。どのアカウントを使用するかは、後で説明します。

重要な注意事項: ラボは開始すると一時停止できません。ラボを途中で終了してしまうと、実行中の受講者のプロジェクトはすべて削除されます。

シナリオ: ニューヨーク市に拠点を置く運輸会社の最高経営責任者

あなたはニューヨーク市で事業を展開する運輸会社の社長です。会社には、ニューヨーク市内の移動情報（自転車と自動車）について収集したデータセットにクエリを実行するデータ分析チームがいます。

課題

データセットの一部には機密情報が含まれるため、アクセスを制御する必要があります。
アクセス可能なデータセットが多いので、その中から適切なデータセットを探すことは非常に難しいとチームメンバーから苦情がきています。
最近の規制要件を遵守するために、PII（個人を特定できる情報）が含まれるデータセットを簡単にフラグできる方法が必要です。

組織のデータセット

ニューヨーク市のシェアサイクルの移動情報
ニューヨーク市の自動車衝突情報

各データエンジニアリングチームは、データへのアクセスと請求を管理しやすくするために、独自に用意した Google Cloud プロジェクト内でデータセットをそれぞれ保有しています。個々のチームにとっては良い方法ですが、分析チームにとってはデータセットを見つけることが困難になります。

アナリストロールの種類

状況をさらに複雑にしている要因として、社内の BI チームにはレベルの異なるデータアナリストが存在しています。

データアナリスト - 必要最低限の権限
オーナー - フルアクセスの権限を持つ管理者

自動生成された内容を確認する

カタログ化する複数のプロジェクトとデータセットを使って実際の企業環境に近い状況をシミュレーションするために、エンジニアリングチームから既存のリソースへのアクセス権を付与されています（ラボではリソースがプリロードされるため、リソースの作成は不要です）。

複数のプロジェクトとユーザーへのリンク。

上の図が示すように、以下の項目にアクセスするためのログイン情報がチームから提供されています。

2 つのプロジェクト
2 つのユーザーアカウント

アクセス制限に関する次の注意点を追加しました。

オーナーには、すべてのプロジェクトとデータセットに対する完全アクセス権がある
データアナリストには、ニューヨーク市の自動車衝突情報データセット（機密データ）を表示したりクエリを実行したりするアクセス権はない

パート 1: オーナーロールで既存データ環境を探索する

すでに説明したとおり、データエンジニアリングチームから 3 つのプロジェクトが提供されていて、各プロジェクトにはニューヨーク市の異なるデータセットが含まれます。オーナーロールですべてのデータセットを表示し、クエリを実行できることを確認します。

このラボ用に提供されている、オーナー（完全アクセス権を持つ管理者）のメールアドレスとパスワード（いずれも自動生成）を使ってログインします。
利用規約が表示されたら同意します。

ニューヨーク市の自動車衝突プロジェクトを検索する

ページの上部にあるプロジェクト名のプルダウンをクリックし、[プロジェクトを選択] をクリックします。

ハイライト表示されたプロジェクトプルダウン

NYC Motor Vehicle Collisions Project 用の Qwiklabs のプロジェクト名（自動生成）を参照して、[プロジェクトを選択] ポップアップでその文字列値を見つけます。

ハイライト表示された NYC Motor Vehicle Collisions Project のリンク。

[組織なし] リスト内のハイライト表示された文字列値。

Data Catalog API を有効にする

ナビゲーションメニュー > [ソリューション] > [すべてのプロダクト] を使用して、[Data Catalog] が表示されるまで下にスクロールします。
名前にカーソルを合わせて、固定アイコンをクリックします。これにより、[Data Catalog] がナビゲーションメニューの先頭に移動します。
[Data Catalog] をクリックします。ポップアップが表示されたら、[閉じる] をクリックします。
API が有効になっていることを確認します（API を有効にするためのプロンプトが表示されない場合は、API はすでに有効なので何もする必要はありません）。

最初に BigQuery のデータセットを手動で検索して、クエリを実行します。その後、このラボに戻って Data Catalog を使用します。

BigQuery に移動して固定する

ナビゲーションメニューで、[BigQuery] が表示されるまで下にスクロールします。
名前にカーソルを合わせて、固定アイコンをクリックします。
[BigQuery] をクリックし、[完了] をクリックします。

タスク 1. オーナーロールで new_york_mv_collisions データセットを表示してクエリを実行できることを確認する

オーナーロールで new_york_mv_collisions データセットを表示できることを確認します。

BigQuery の [エクスプローラ] でプロジェクト名をクリックして、閲覧可能なデータセットの表示に切り替えます。
new_york_mv_collisions データセットが表示されることを確認します。
new_york_mv_collisions データセットをクリックして、データセット内のテーブルを開きます。
nypd_mv_collisions テーブルをクリックして、スキーマ内の項目を確認します。

スキーマは、下の図のように表示されます。

nypd_mv_collisions テーブルスキーマのフィールドを表示する [スキーマ] タブページ

次の質問に回答してください。

このテーブルには電話番号やメールアドレスのような個人を特定できる情報はありませんが、チーム以外にこのデータセットを共有する場合には注意が必要です。

このラボの後半では、制限付きデータセットへのアクセス方法と、組織で使えるように Data Catalog を使ってデータセットとテーブルにリッチメタデータで事前にタグ付けする方法を重点的に説明します。

注: この NYPD 衝突情報データセットは、元となる BigQuery 公開データセット（毎日更新）からプロジェクトに自動的に読み込まれています。データセットを収集する方法の詳細とクエリ例については、リンクをクリックしてください。

オーナーロールで自動車衝突情報データセットに対するクエリを実行できることを確認する

完全アクセス権を持つオーナーとしてログインしたので、プロジェクトとデータセットの両方を表示してアクセスできることを確認しましょう。以下のクエリを実行できることを確認します。

以下のクエリをコピーして BigQuery のクエリエディタに貼り付け、[実行] をクリックします。

ニューヨーク市の自動車事故発生の要因上位 10 項目を調べる

SELECT contributing_factor_vehicle_1 AS collision_factor, COUNT(*) AS num_collisions FROM `new_york_mv_collisions.nypd_mv_collisions` WHERE contributing_factor_vehicle_1 != "Unspecified" AND contributing_factor_vehicle_1 != "" GROUP BY collision_factor ORDER BY num_collisions DESC LIMIT 10;

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。ニューヨーク市の自動車衝突データに対してクエリを実行する

タスク 2. オーナーロールでシェアサイクル情報データセットを表示してクエリを実行できることを確認する

ページの上部にある [プロジェクトを選択] をクリックします。
[すべて] タブをクリックします。
自動生成された正しいプロジェクト ID を参照して、シェアサイクル情報データセットを見つけます。

ニューヨーク市のシェアサイクルプロジェクト ID

サンプルの qwiklabs-gcp-project がハイライト表示されたプロジェクトのリスト

プロジェクト ID をクリックします。

注: 保存されていない作業に関するプロンプトが表示されたら [終了] をクリックします。

BigQuery UI で、プロジェクト ID > [new_york_citibike] > [citibike_trips] テーブルを開きます。

スキーマ、詳細、プレビューが表示されたら、次の質問に回答します。

シェアサイクルで最もよく使用されるルートは何ですか（男女別）？

NYC Citi Bike 公開データセットは、シェアサイクルサービスを利用した人の個々の移動情報（貸出場所と返却場所）とその他の項目を記録しています。

以下のクエリをクエリエディタに追加して [実行] をクリックし、最もよく使用されている男女別ルートを表示します。データセットに示された値は、不明、男性、女性の 3 つだけですが、これらの値がシェアサイクルサービス利用者のすべての性別を表しているわけではありません。

WITH unknown AS ( SELECT gender, CONCAT(start_station_name, " to ", end_station_name) AS route, COUNT(*) AS num_trips FROM `new_york_citibike.citibike_trips` WHERE gender = 'unknown' GROUP BY gender, start_station_name, end_station_name ORDER BY num_trips DESC LIMIT 5 ) , female AS ( SELECT gender, CONCAT(start_station_name, " to ", end_station_name) AS route, COUNT(*) AS num_trips FROM `new_york_citibike.citibike_trips` WHERE gender = 'female' GROUP BY gender, start_station_name, end_station_name ORDER BY num_trips DESC LIMIT 5 ) , male AS ( SELECT gender, CONCAT(start_station_name, " to ", end_station_name) AS route, COUNT(*) AS num_trips FROM `bigquery-public-data.new_york_citibike.citibike_trips` WHERE gender = 'male' GROUP BY gender, start_station_name, end_station_name ORDER BY num_trips DESC LIMIT 5 ) SELECT * FROM unknown UNION ALL SELECT * FROM female UNION ALL SELECT * FROM male;

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。最もよく使用されているルートについて性別によるクエリを実行する

次は、機密データが含まれるデータセットとテーブルにタグ付けする方法を確認します。

内容のまとめ

これまで、2 つのデータセットをそれぞれ見てきました（ニューヨーク市の自動車衝突情報とシェアサイクルの移動情報）。
各データセットは、それぞれ別のプロジェクトに保存されています。
オーナーロール（現在ログインしているロール）には、各データセットを表示してクエリを実行できる権限があります。

パート 2: アクセス制限があるユーザーで既存データ環境を探索する

これまでのラボでは、データエンジニアリングチームから提供された、最高権限のオーナー アカウントとしてログインしてきました。

ここで、データアナリスト ユーザーのアクセスを以下のように制限することを、エンジニアリングチームに依頼しました。

データアナリストが表示できるデータセット:

ニューヨーク市のシェアサイクル情報

データアナリストが表示できないデータセット:

ニューヨーク市の自動車衝突情報

オーナーアカウントからログアウトする

プロフィールアイコンをクリックします。
ログアウトします。

タスク 3. データアナリストユーザーでログインしてプロジェクトアクセス制限を確認する

[別のアカウントを使用] をクリックします。
Data Analyst User のメールと共有パスワードで、Google Cloud にもう一度ログインします。
[プロジェクトを選択] の下に、自動生成された Qwiklabs のプロジェクトが 2 つではなく、1 つしか表示されないことを確認します。
アクセスできる Qwiklabs プロジェクトを選択します。
BigQuery に移動します。

タスク 4. 非公開データセットに直接クエリを実行する

BigQuery では、プロジェクトが [エクスプローラ] セクションに固定または表示されていない場合でも、アクセス権があればクエリを実行できます。プロジェクト ID を使い、データアナリストユーザーとしてニューヨーク市の自動車衝突情報データセットに対して直接クエリを実行してみます。

以前のセクションのように以下のクエリを追加し、プロジェクト ID のプレフィックスを NYC Motor Vehicle Collisions Project のプロジェクト ID に置き換えます。

SELECT contributing_factor_vehicle_1 AS collision_factor, COUNT(*) AS num_collisions FROM `qwiklabs-gcp-[ここを置き換え].new_york_mv_collisions.nypd_mv_collisions` WHERE contributing_factor_vehicle_1 != "Unspecified" AND contributing_factor_vehicle_1 != "" GROUP BY collision_factor ORDER BY num_collisions DESC LIMIT 10;

アクセス拒否のエラーメッセージの受信でデータアナリストのアクセスレベルを検証します。

プロジェクト、データセット、クエリへのアクセスに関して、オーナーロール（幅広い権限）とデータアナリスト（最も制限の厳しい権限）のそれぞれに付与されている異なる権限とアクセス権について確認しました。

次は、Data Catalog の検索機能を使用して、表示されていないデータセットを検索できるかどうかを確認します。BigQuery でブロックされていても、データアナリストはデータセットを検索できるでしょうか。

パート 3: Data Catalog を使用して、複数プロジェクトにあるデータセットにタグを付ける

データセットと、異なるロールに付与されるアクセスレベルについて理解したところで、次に、同じサンプルシナリオを使って先ほど説明した課題に対処します。

課題:

データセットの一部には機密情報が含まれるため、アクセスを制御する必要があります。
アクセス可能なデータセットが多いので、その中から適切なデータセットを探すことは非常に難しいとチームメンバーから苦情がきています。

最近の規制要件を遵守するため、PII（個人を特定できる情報）が含まれるデータセットを簡単にフラグできる方法が必要です。Data Catalog サービスでこれらの課題に対処して、このタスクを完了してください。

ナビゲーションメニューを開き、[Data Catalog] をクリックします。

注: 保存されていない作業に関するプロンプトが表示されたら [終了] をクリックします。

注: API を有効にするよう求めるメッセージが画面に表示されたら、オーナーロールでもう一度ログインして API を有効化する必要があります（このラボの最初に行ったステップです）。

Data Catalog ホームページの [システム] で、「BigQuery」でフィルタします。

注: 「qwiklabs-resources」プロジェクトの行も表示される場合がありますが、無視してかまいません。このプロジェクトは、共有アセットをすべてのラボに提供します。

Data Catalog の検索バーに「qwiklabs-gcp」と入力し、外部の Qwiklabs リソースを除外します。
データアナリストに表示される画面が次のようになっていることを確認します。

Data Catalog のホームページ

どのプロジェクトにログインしているかにかかわらず、Data Catalog はユーザーのロールでアクセスできるすべての BigQuery データセットを検索結果として表示します。

new_york_mv_collisions は存在しますが（オーナーとして、このデータセットに対してクエリを実行しました）、データアナリストユーザーとしてログインしているときは、Data Catalog に表示されません。

なぜでしょう。次は、Data Catalog レベルで行われるアクセス制御のしくみについて詳しく見ていきます。

Data Catalog によるメタデータの検索

Google Cloud リソースを検索、検出、表示する前に、Data Catalog はユーザーの IAM ロールを確認して、BigQuery、Pub/Sub などのソースシステムでリソースにアクセスするためのメタデータ読み取り権限が付与されていることを確かめます。

例: Data Catalog は、BigQuery テーブルのメタデータを表示する前に、bigquery.tables.get 権限が含まれるロールがユーザーに付与されていることを確認します。

タスク 5. BigQuery データセットから Data Catalog タグテンプレートを作成する

テーブル名が new_york_citibike となっている項目をクリックします。これは、閲覧が許可されているシェアサイクル情報データセットのサブタスクです。

[Dataplex] ページと [詳細] タブページに表示される BigQuery データセットの詳細

Data Catalog では、BigQuery テーブルに対して次の項目にタグ付けできます。

データセット自体
テーブル
個別の列

[タグを付ける] ボタンをクリックしてみます。
以下のようなエラーが表示されることを確認します。

エラーメッセージ: このエントリにタグを付ける権限がありません。必要な権限: bigquery.datasets.updateTag

ダイアログで [詳細] にカーソルを合わせると、利用できない理由が表示されます。

Data Catalog では、データアナリストロールでメタデータを検索することはできても、新しいタグを付けることはできないことがわかります。

ここからは、Data Catalog のタグ付け権限とタグテンプレートの仕組みについて見ていきます。

Data Catalog のテンプレート、タグ、権限

Data Catalog タグテンプレートを使うと、データアセットに関する一般的なメタデータを単一の場所で作成および管理できます。タグはデータアセットに添付されているため、Data Catalog システムで検出できます。この機能により、データアセットについてコンテキストメタデータを利用するアプリケーションをさらに構築することもできます。

タグテンプレートの例

Data Catalog タグテンプレートの例

タグテンプレートの作成者

ユーザーがタグテンプレートを作成するには、該当するリソースへの編集権限（このラボでは BigQuery）と datacatalog.tagTemplateUser（テンプレートがすでに作成済みの場合）が少なくとも必要です。詳細については、Data Catalog IAM ガイドをご覧ください。

新しいタグテンプレートを作成する必要がある場合は、少なくとも datacatalog.tagTemplateCreator または roles/datacatalog.tagTemplateOwner のロールが必要です。後者の場合、既存テンプレートと追加の管理者権限の削除が許可されます。

Data Catalog の事前定義 Cloud IAM ロールのうち、以下は最も一般的なものです。

roles/datacatalog.tagTemplateViewer
roles/datacatalog.tagTemplateUser
roles/datacatalog.tagTemplateCreator
roles/datacatalog.tagTemplateOwner
ロールの完全なリストについては、Data Catalog のロールをご覧ください。

タスク 6. 新しい Data Catalog テンプレートを作成する

roles/datacatalog.tagTemplateOwner 権限が付与されたオーナーロールとしてログインします。
以前使用したニューヨーク市のシェアサイクルプロジェクトを選択します。

注: 権限エラーが表示される場合は、正しい認証情報で再ログインしてください。おそらく間違ったオーナーを選択しています。

Data Catalog に移動します。
新しいタグテンプレートを作成するには、[タグテンプレート] > [タグテンプレートを作成] をクリックします。
新しいテンプレートの基本情報を入力します。名前として「New York Datasets」と入力します。
[ロケーション] として [] を選択します。

[テンプレートの作成] ダイアログ

[フィールドを追加] をクリックします。
新しいフィールドに「Contains PII」という名前を付け、[このフィールドを必須にする] をオンにします。次に、[ブール値] を選択してから、[完了] をクリックします。
[フィールドを追加] をクリックします。
フィールドに「PII Type」という名前を付け、タイプとして [列挙] を選択してから、次の値を追加します。この作業が終わったら、[完了] をクリックします。

値 1: なし
値 2: 生年月日
値 3: 性別
値 4: 位置情報

[フィールドを追加] をクリックします。
フィールドに「Data Owner Team」という名前を付け、[このフィールドを必須にする] をオンにします。タイプとして [列挙] を選択して次の値を追加します。この作業が終わったら [完了] をクリックします。

値 1: マーケティング
値 2: データサイエンス
値 3: セールス
値 4: エンジニアリング

[作成] をクリックします。

データセットレベルでタグを適用する

[このテンプレートを使用していないエントリを検索] をクリックします。
new_york_mv_collisions データセットをクリックします。
データセット名の下にタグが 1 つも表示されていないことを確認したら、[タグを付ける] をクリックします。
先ほど作成したテンプレートを選択し、[OK] をクリックします。
プルダウンメニューを使用してテンプレートフィールドに以下の値を入力し、[保存] をクリックします。

Contains PII: True
PII Type: 位置情報
Data Owner Team: エンジニアリング

データセットレベルでタグを表示します。

テーブルと列のレベルでタグを適用する

アセットにさらに細かくタグ付けをするには、テーブルと列のレベルでタグを適用できます。

先ほど検索したアセットに戻って、[nypd_mv_collisions] テーブルをクリックします。
[タグを付ける] をクリックし、[スキーマと列のタグ] の以下の項目を設定します。

テーブル: nypd_mv_collisions
列: location
タグテンプレート: New York Datasets
タグの値:
- Contains PII: True
- PII Type: 位置情報
- Data Owner Team: エンジニアリング

[保存] をクリックします。
位置情報の PII として項目をタグ付けし、テンプレート名をクリックするとタグが表示されることを確認します。

nypd_mv_collisions Data Catalog タグテンプレートの [スキーマと列のタグ] タブページ

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 Data Catalog タグテンプレートの作成

タグとタグキーでデータセットを検索する

タグ付けが完了したので、先ほど追加したタグを使ってカタログを検索できます。

tag:qwiklabs-[現在のプロジェクト].new_york_datasets.contains_pii をコピーして検索バーに貼り付け、プロジェクト ID プレフィックスを現在の Qwiklabs プロジェクト ID に変更します。

Data Catalog 検索ページ

ご使用のカタログ全体ですばやく検索する方法についてその他の例を参照するには、Data Catalog でデータアセットを検索して表示するをご覧ください。

お疲れさまでした

以下の作業を行いながら Data Catalog について詳しく学びました。

2 つのプロジェクト、2 つのデータセット、2 つのユーザーアカウントを備えた、企業のシミュレーション環境でデータを探索
後でタグ付けする予定の機密データの列を把握するためにクエリを実行
Data Catalog を使って、プロジェクトの既存データセットを検索
Data Catalog のタグテンプレートを使って、リッチメタデータでアセットにタグ付け

次のステップと詳細情報

Data Catalog のドキュメントページ
Data Catalog Fundamentals コースの他のラボをご覧ください。

Google Cloud トレーニングと認定資格

Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベストプラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。

マニュアルの最終更新日: 2024 年 4 月 30 日

ラボの最終テスト日: 2024 年 4 月 30 日

Data Catalog を使用して、複数プロジェクトでデータセット メタデータを探索する

Data Catalog を使用して、複数プロジェクトでデータセット メタデータを探索する

GSP789

概要

Data Catalog を使用する

学習内容

メリット

前提条件

設定と要件

シナリオ: ニューヨーク市に拠点を置く運輸会社の最高経営責任者

組織のデータセット

アナリスト ロールの種類

自動生成された内容を確認する

パート 1: オーナーロールで既存データ環境を探索する

ニューヨーク市の自動車衝突プロジェクトを検索する

Data Catalog API を有効にする

BigQuery に移動して固定する

タスク 1. オーナーロールで new_york_mv_collisions データセットを表示してクエリを実行できることを確認する

オーナーロールで自動車衝突情報データセットに対するクエリを実行できることを確認する

タスク 2. オーナーロールでシェアサイクル情報データセットを表示してクエリを実行できることを確認する

シェアサイクルで最もよく使用されるルートは何ですか（男女別）？

内容のまとめ

パート 2: アクセス制限があるユーザーで既存データ環境を探索する

オーナー アカウントからログアウトする

タスク 3. データ アナリスト ユーザーでログインしてプロジェクト アクセス制限を確認する

タスク 4. 非公開データセットに直接クエリを実行する

パート 3: Data Catalog を使用して、複数プロジェクトにあるデータセットにタグを付ける

Data Catalog によるメタデータの検索

タスク 5. BigQuery データセットから Data Catalog タグ テンプレートを作成する

Data Catalog のテンプレート、タグ、権限

タグ テンプレートの例

タグ テンプレートの作成者

タスク 6. 新しい Data Catalog テンプレートを作成する

データセット レベルでタグを適用する

テーブルと列のレベルでタグを適用する

タグとタグキーでデータセットを検索する

お疲れさまでした

次のステップと詳細情報

Google Cloud トレーニングと認定資格

始める前に

シークレット ブラウジングを使用する

コンソールにログインする

シークレット ブラウジングを使用してラボを実行する

Data Catalog を使用して、複数プロジェクトでデータセットメタデータを探索する

Data Catalog を使用して、複数プロジェクトでデータセットメタデータを探索する

アナリストロールの種類

オーナーアカウントからログアウトする

タスク 3. データアナリストユーザーでログインしてプロジェクトアクセス制限を確認する

タスク 5. BigQuery データセットから Data Catalog タグテンプレートを作成する

タグテンプレートの例

タグテンプレートの作成者

データセットレベルでタグを適用する

シークレットブラウジングを使用する

シークレットブラウジングを使用してラボを実行する