
始める前に
- ラボでは、Google Cloud プロジェクトとリソースを一定の時間利用します
- ラボには時間制限があり、一時停止機能はありません。ラボを終了した場合は、最初からやり直す必要があります。
- 画面左上の [ラボを開始] をクリックして開始します
Create a Dataplex Lake
/ 25
Add a zone to the lake
/ 25
Attach an asset to the zone
/ 25
Delete asset,zones and lakes
/ 25
Dataplex は、組織がデータレイク、データ ウェアハウス、データマートに分散したデータを一元的に検出、管理、モニタリング、統制し、大規模に分析できるように支援するインテリジェントなデータ ファブリックです。具体的には、Dataplex を使用してデータメッシュ アーキテクチャを構築できます。データメッシュ アーキテクチャとは、ドメインデータ所有者間でデータ所有権を分散する組織的および技術的なアプローチです。
Dataplex は、データの移動や複製を必要としない方法でデータを管理します。新しいデータアセットが追加されると、Dataplex は構造化データと非構造化データの両方のメタデータを収集し、すべてのメタデータをセキュリティが確保され、統合された metastore に自動的に登録します。その後、データおよびメタデータは Data Catalog や BigQuery などの Google Cloud サービスを通じて評価できます。
このラボでは、コマンドラインを使用して Dataplex でレイク、ゾーン、アセットを作成および削除することで、独自のデータメッシュの構築を開始する方法を学習します。
こちらの説明をお読みください。ラボには時間制限があり、一時停止することはできません。タイマーは、Google Cloud のリソースを利用できる時間を示しており、[ラボを開始] をクリックするとスタートします。
このハンズオンラボでは、シミュレーションやデモ環境ではなく実際のクラウド環境を使って、ラボのアクティビティを行います。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。
このラボを完了するためには、下記が必要です。
[ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるダイアログでお支払い方法を選択してください。 左側の [ラボの詳細] ペインには、以下が表示されます。
[Google Cloud コンソールを開く] をクリックします(Chrome ブラウザを使用している場合は、右クリックして [シークレット ウィンドウで開く] を選択します)。
ラボでリソースがスピンアップし、別のタブで [ログイン] ページが表示されます。
ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。
必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。
[ラボの詳細] ペインでもユーザー名を確認できます。
[次へ] をクリックします。
以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。
[ラボの詳細] ペインでもパスワードを確認できます。
[次へ] をクリックします。
その後次のように進みます。
その後、このタブで Google Cloud コンソールが開きます。
Cloud Shell は、開発ツールと一緒に読み込まれる仮想マシンです。5 GB の永続ホーム ディレクトリが用意されており、Google Cloud で稼働します。Cloud Shell を使用すると、コマンドラインで Google Cloud リソースにアクセスできます。
Google Cloud コンソールの上部にある「Cloud Shell をアクティブにする」アイコン をクリックします。
ウィンドウで次の操作を行います。
接続した時点で認証が完了しており、プロジェクトに各自の Project_ID、
gcloud
は Google Cloud のコマンドライン ツールです。このツールは、Cloud Shell にプリインストールされており、タブ補完がサポートされています。
出力:
出力:
gcloud
ドキュメントの全文については、gcloud CLI の概要ガイドをご覧ください。
Dataplex において、レイクは特定のデータ領域やビジネス ユニットを表す、最上位の組織ドメインです。たとえば、組織内の部門やデータドメインごとにレイクを作成できるため、特定のユーザー グループに対してデータを整理して提供できます。
このタスクでは、コマンドラインを使用してレイクを作成し、データメッシュの構築を開始します。
レイクが作成されるまで 3 分ほどかかる場合があります。
ステータス コード: 403. Permission 'dataplex.lakes.create' denied
というエラーが表示された場合は、数分待ってからもう一度試してください。前の「設定」セクションで Dataplex API を有効にしてから権限が付与されるまでに時間がかかる場合があります。
最終的な出力は次のようになります。
レイクを作成すると、ゾーンをレイクに追加できるようになります。ゾーンはレイク内のサブドメインです。ゾーンを使用するとデータをより細かく分類できます。たとえば、ステージ、使用状況、制限ごとにデータを分類できます。
ゾーンには次の 2 種類があります。
このタスクでは、コマンドラインを使用して、BigQuery データセットを操作するためのキュレート済みデータ用ゾーンを作成します。
ゾーンが作成されるまで 2 分ほどかかる場合があります。
最終的な出力は次のようになります。
Cloud Storage バケットまたは BigQuery データセットに保存されたデータは、アセットとして Dataplex レイク内のゾーンにアタッチできます。
このタスクでは、コマンドラインを使用して BigQuery データセットを作成し、そのデータセットを前に作成したゾーンにアタッチします。
このデータセットはテーブルやデータを含んでいませんが、すぐにゾーンにアタッチできます。そして、新しく作成したテーブルや読み込んだデータは自動的にこのゾーンに統合されます。
最終的な出力は次のようになります。
アセットが作成されるまで 2 分ほどかかる場合があります。
最終的な出力は次のようになります。
レイクを削除するには、まずアセットを切断してからゾーンを削除する必要があります。
このタスクでは、コマンドラインを使用して、ゾーンからアセットを切断し、次にゾーンを削除して、最後にレイクを削除します。
確認するメッセージが表示されたら、「Y
」と入力します。
このアクションにより、BigQuery データセット内の基盤となるデータが削除されます。これは、Dataplex のレイクを使用して、BigQuery データセットをアクセス不可または検出不可にするだけです。
最終的な出力は次のようになります。
確認するメッセージが表示されたら、「Y
」と入力します。
最終的な出力は次のようになります。
確認するメッセージが表示されたら、「Y
」と入力します。
最終的な出力は次のようになります。
コマンドラインを使用して、Dataplex でレイク、ゾーン、アセットを作成および削除しました。
Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。
マニュアルの最終更新日: 2025 年 4 月 23 日
ラボの最終テスト日: 2025 年 4 月 23 日
Copyright 2025 Google LLC. All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。
このコンテンツは現在ご利用いただけません
利用可能になりましたら、メールでお知らせいたします
ありがとうございます。
利用可能になりましたら、メールでご連絡いたします
1 回に 1 つのラボ
既存のラボをすべて終了して、このラボを開始することを確認してください