arrow_back

標記 Dataplex 資產

登录 加入
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

標記 Dataplex 資產

Lab 45 分钟 universal_currency_alt 1 积分 show_chart 入门级
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP1145

Google Cloud 自修研究室標誌

總覽

Dataplex 是智慧型資料架構,可讓機構集中探索、控管、監控及管理資料湖泊、資料倉儲和資料市集裡的資料,以便大規模分析數據。

Data Catalog 是 Dataplex 中可擴充的全代管中繼資料管理服務,能用於標記資料資產,以及搜尋您有權存取的資產。您可以運用標記,附加自訂中繼資料欄位到特定資料資產 (例如將某些資產標記為私密/機密或受保護的資料),輕鬆識別及擷取內容。此外,還能建立可重複使用的標記範本,快速指派相同標記給不同資料資產。

本研究室將說明如何透過 Dataplex 中的 Data Catalog,建立標記範本、將範本套用至 Dataplex 資產,並使用標記搜尋資產。

學習目標

  • 啟用 Dataplex API 和 Data Catalog API
  • 在 Dataplex 中建立湖泊、可用區和資產
  • 建立標記範本
  • 將標記範本套用至 Dataplex 資產
  • 使用標記搜尋資產

設定和需求

點選「Start Lab」按鈕前的須知事項

請詳閱以下操作說明。研究室活動會計時,而且中途無法暫停。點選「Start Lab」 後就會開始計時,讓您瞭解有多少時間可以使用 Google Cloud 資源。

您將在真正的雲端環境中完成實作研究室活動,而不是在模擬或示範環境。為達此目的,我們會提供新的暫時憑證,讓您用來在研究室活動期間登入及存取 Google Cloud。

如要完成這個研究室活動,請先確認:

  • 您可以使用標準的網際網路瀏覽器 (Chrome 瀏覽器為佳)。
注意:請使用無痕模式或私密瀏覽視窗執行此研究室。這可以防止個人帳戶和學生帳戶之間的衝突,避免個人帳戶產生額外費用。
  • 是時候完成研究室活動了!別忘了,活動一開始將無法暫停。
注意:如果您擁有個人 Google Cloud 帳戶或專案,請勿用於本研究室,以免產生額外費用。

如何開始研究室及登入 Google Cloud 控制台

  1. 按一下「Start Lab」(開始研究室) 按鈕。如果研究室會產生費用,畫面中會出現選擇付款方式的彈出式視窗。左側的「Lab Details」(研究室詳細資料) 面板會顯示下列項目:

    • 「Open Google Console」(開啟 Google 控制台) 按鈕
    • 剩餘時間
    • 必須在這個研究室中使用的暫時憑證
    • 完成這個研究室所需的其他資訊 (如有)
  2. 按一下「Open Google Console」(開啟 Google 控制台)。接著,研究室會啟動相關資源並開啟另一個分頁,當中會顯示「Sign in」(登入) 頁面。

    提示:您可以在不同的視窗中並排開啟分頁。

    注意事項:如果頁面中顯示了「Choose an account」(選擇帳戶) 對話方塊,請按一下「Use Another Account」(使用其他帳戶)
  3. 如有必要,請複製「Lab Details」(研究室詳細資料) 面板中的使用者名稱,然後貼到「Sign in」(登入) 對話方塊。按一下「Next」(下一步)

  4. 複製「Lab Details」(研究室詳細資料) 面板中的密碼,然後貼到「Welcome」(歡迎使用) 對話方塊。按一下「Next」(下一步)

    重要注意事項:請務必使用左側面板中的憑證,而非 Google Cloud 技能重點加強的憑證。 注意事項:如果使用自己的 Google Cloud 帳戶來進行這個研究室,可能會產生額外費用。
  5. 按過後續的所有頁面:

    • 接受條款及細則。
    • 由於這是臨時帳戶,請勿新增救援選項或雙重驗證機制。
    • 請勿申請免費試用。

Cloud 控制台稍後會在這個分頁中開啟。

注意事項:按一下畫面左上方的導覽選單,即可在選單中查看 Google Cloud 產品與服務的清單。「導覽選單」圖示

啟用 Dataplex API 和 Data Catalog API

  1. 在 Google Cloud 控制台頂端的搜尋列中,輸入 Cloud Dataplex API

  2. 點選「Marketplace」下方的「Cloud Dataplex API」搜尋結果。

  3. 按一下「啟用」

  4. 重複步驟 1 至 3,找出並啟用 Google Cloud Data Catalog API

工作 1:建立湖泊、可用區和資產

在這項工作中,您將建立新的 Dataplex 湖泊來儲存消費者訂單資訊、在湖泊中新增收錄的可用區,然後附加預先建立的 BigQuery 資料集,做為可用區中的新資產。

建立湖泊

  1. 在 Google Cloud 控制台,按一下「導覽選單」圖示 導覽選單,依序前往「數據分析」>「Dataplex」

如果出現「歡迎使用新版 Dataplex 服務」提示,請點選「關閉」

  1. 在「管理湖泊」下方,點選「管理」

  2. 按一下「建立湖泊」

  3. 輸入必要資訊來建立新湖泊:

屬性
顯示名稱 Orders Lake
ID 保留預設值。
區域

保留其他預設值。

  1. 點選「建立」

湖泊會在 3 分鐘內建立完成。

在湖泊中新增可用區

  1. 在「管理」分頁中,點選湖泊名稱。

  2. 點選「新增可用區」

  3. 輸入必要資訊來建立新的可用區:

屬性
顯示名稱 Customer Curated Zone
ID 保留預設值。
類型 收錄的可用區
資料位置 區域性

保留其他預設值。

舉例來說,「探索功能設定」下方的「啟用中繼資料探索功能」選項預設為啟用,可讓已獲授權的使用者探索可用區中的資料。

  1. 點選「建立」

可用區會在 2 分鐘內建立完成。

可用區狀態變成「運作中」後,您就能執行下一項工作。

將資產附加至可用區

  1. 在「可用區」分頁中,點選可用區名稱。

  2. 在「資產」分頁中,按一下「新增資產」

  3. 點選「新增資產」

  4. 輸入必要資訊來附加新資產:

屬性
類型 BigQuery 資料集
顯示名稱 Customer Details Dataset
ID 保留預設值。
資料集 .customers

保留其他預設值。

  1. 按一下「完成」

  2. 點選「繼續」

  3. 在「探索功能設定」下方,選取「繼承」來繼承可用區層級的探索功能設定,然後按一下「繼續」

  4. 點選「提交」

在 Dataplex 中建立湖泊、可用區和資產

工作 2:建立標記範本

您需要先建立一或多個標記範本,才能開始標記資料。標記範本可以是公開或私人範本。當您建立新的標記範本時,預設的建議選項為建立公開範本。如果使用者具有資料資產的必要查看權限,即可檢視與該資產相關聯的所有公開標記。這有助於簡化探索內容的搜尋作業,同時一併遵循基礎資料已採用的資料存取權控管機制。

在這項工作中,您將建立公開標記範本,將 BigQuery 資料表的資料欄標記為受保護狀態。如果使用者有權存取基礎 BigQuery 資料表的資料欄,就能透過公開標記範本,查看資料欄套用的標記。

  1. 在左選單中,點選「管理目錄」下方的「標記範本」

  2. 按一下「建立標記範本」

  3. 輸入必要資訊來定義標記範本:

屬性
範本顯示名稱 Protected Data Template
範本 ID 保留預設值。
位置
瀏覽權限 公開
  1. 按一下「新增欄位」,並輸入必要資訊,在範本中新增欄位:
屬性
欄位顯示名稱 Protected Data Flag
欄位 ID 保留預設值。
類型 列舉
  1. 在「列舉值」下方的「值 1」欄位中輸入 YES

  2. 點選「新增值」,並在「值 2」欄位中輸入 NO

  3. 按一下「完成」

  4. 點選「建立」

建立標記範本

工作 3:將標記範本套用至 Dataplex 資產

建立標記範本後,即可使用範本,將標記套用到您有權存取的所需資料資產 (數量不限)。

在這項工作中,您會將先前建立的標記範本,套用到 BigQuery 資料表中要標記為受保護資料狀態的特定資料欄。

  1. 在左選單中,點選「探索」下方的「搜尋」

  2. 在「篩選器」下方的「系統」部分,勾選「Dataplex」核取方塊。

  3. 按一下 customer_details 資料表。

如果找不到 customer_details 資料表,請先稍等幾分鐘再重新整理頁面,讓系統更新 Dataplex 資產清單。

  1. 按一下「附加標記」

  2. 在「選擇要加上標記的內容」下方選單中,勾選下列資料欄的核取方塊:

    • zip
    • state
    • last_name
    • country
    • email
    • latitude
    • first_name
    • city
    • longitude
  3. 按一下「確定」

  4. 在「選擇標記範本」下方選單中,選取「Protected Data Template」

  5. 在「Protected Data Flag」下方選單中,選取「YES」

  6. 按一下「儲存」

將標記範本套用至 Dataplex 資產

工作 4:使用標記搜尋資產

標記資料資產後,即可使用 Dataplex 中的 Data Catalog,搜尋這些資產。

在這項工作中,您將搜尋已套用 Protected Data 標記範本的資產。

  1. 在左選單中,點選「探索」下方的「搜尋」

  2. 在「篩選器」下方的「標記」部分,勾選「Protected Data Template」核取方塊。

  3. 按一下 customer_details 資料表。

  4. 點選「結構定義與資料欄標記」分頁標籤,查看指定資料欄的 Protected Data 標記。

恭喜!

您已透過 Dataplex 中的 Data Catalog,建立標記範本、將範本套用至 Dataplex 資產,並使用標記搜尋資產。

Google Cloud 教育訓練與認證

協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。

使用手冊上次更新日期:2023 年 9 月 20 日

研究室上次測試日期:2023 年 9 月 20 日

Copyright 2024 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。