arrow_back

创建切面并将其添加到 Dataplex 资产

登录 加入
访问 700 多个实验和课程

创建切面并将其添加到 Dataplex 资产

实验 45 分钟 universal_currency_alt 1 个积分 show_chart 入门级
info 此实验可能会提供 AI 工具来支持您学习。
访问 700 多个实验和课程

GSP1145

Google Cloud 自学实验的徽标

概述

Dataplex 是一种智能数据结构脉络,使组织能够跨数据湖、数据仓库和数据集市集中发现、管理、监控和治理其数据,从而实现大规模分析。

Dataplex Universal Catalog 是 Dataplex 中的一项全托管式可扩缩元数据管理服务。借助 Dataplex Universal Catalog,您可以创建切面类型,并将这些切面添加到数据资产。利用切面,您可以捕获条目中的元数据。向条目(或资产)添加切面有助于为每个需要使用资产的人员提供有意义的上下文。您可以使用切面来存储业务元数据(例如数据分类)和技术元数据(例如架构)。

利用切面,您可以向资产添加自定义元数据,以便轻松识别和检索资产。例如,通过向某些资产添加相应的切面,可以表明其中包含受保护的数据或敏感数据。您还可以创建可重用的切面类型,以便快速将相同的切面添加到不同的数据资产。

在本实验中,您将学习如何使用 Dataplex Universal Catalog 创建切面类型,将切面添加到 Dataplex 资产,然后使用切面搜索资产。

学习内容

在本实验中,您将学习如何执行以下任务:

  • 启用 Dataplex API。
  • 在 Dataplex 中创建数据湖、区域和资产。
  • 创建切面类型。
  • 为资产添加一个切面。
  • 使用切面搜索资产。

设置和要求

点击“开始实验”按钮前的注意事项

请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。

此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。为此,我们会向您提供新的临时凭据,您可以在该实验的规定时间内通过此凭据登录和访问 Google Cloud。

为完成此实验,您需要:

  • 能够使用标准的互联网浏览器(建议使用 Chrome 浏览器)。
注意:请使用无痕模式(推荐)或无痕浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。
  • 完成实验的时间 - 请注意,实验开始后无法暂停。
注意:请仅使用学生账号完成本实验。如果您使用其他 Google Cloud 账号,则可能会向该账号收取费用。

如何开始实验并登录 Google Cloud 控制台

  1. 点击开始实验按钮。如果该实验需要付费,系统会打开一个对话框供您选择支付方式。左侧是“实验详细信息”窗格,其中包含以下各项:

    • “打开 Google Cloud 控制台”按钮
    • 剩余时间
    • 进行该实验时必须使用的临时凭据
    • 帮助您逐步完成本实验所需的其他信息(如果需要)
  2. 点击打开 Google Cloud 控制台(如果您使用的是 Chrome 浏览器,请右键点击并选择在无痕式窗口中打开链接)。

    该实验会启动资源并打开另一个标签页,显示“登录”页面。

    提示:将这些标签页安排在不同的窗口中,并排显示。

    注意:如果您看见选择账号对话框,请点击使用其他账号
  3. 如有必要,请复制下方的用户名,然后将其粘贴到登录对话框中。

    {{{user_0.username | "<用户名>"}}}

    您也可以在“实验详细信息”窗格中找到“用户名”。

  4. 点击下一步

  5. 复制下面的密码,然后将其粘贴到欢迎对话框中。

    {{{user_0.password | "<密码>"}}}

    您也可以在“实验详细信息”窗格中找到“密码”。

  6. 点击下一步

    重要提示:您必须使用实验提供的凭据。请勿使用您的 Google Cloud 账号凭据。 注意:在本实验中使用您自己的 Google Cloud 账号可能会产生额外费用。
  7. 继续在后续页面中点击以完成相应操作:

    • 接受条款及条件。
    • 由于这是临时账号,请勿添加账号恢复选项或双重验证。
    • 请勿注册免费试用。

片刻之后,系统会在此标签页中打开 Google Cloud 控制台。

注意:如需访问 Google Cloud 产品和服务,请点击导航菜单,或在搜索字段中输入服务或产品的名称。 “导航菜单”图标和“搜索”字段

启用 Dataplex API

  1. 在 Google Cloud 控制台标题栏的搜索字段中输入 Cloud Dataplex API,然后点击搜索结果中的 Cloud Dataplex API

  2. 如果需要,请点击启用,以启用 Cloud Dataplex API。

任务 1. 创建数据湖、区域和资产

在本任务中,您需要新建一个 Dataplex 数据湖来存储客户订单信息,向该数据湖添加精选区域,然后将预先创建的 BigQuery 数据集作为新资产附加到该区域中。

创建数据湖

  1. 在 Google Cloud 控制台的标题栏中,输入 Dataplex Universal Catalog,然后从搜索结果中点击归类为“产品”或“页面”的 Dataplex Universal Catalog

  2. 在左侧窗格中,点击管理数据湖下的管理

  3. 点击创建数据湖

  4. 按如下说明设置下方的属性,将其余属性保留默认值。

属性
显示名称 Orders Lake
区域
  1. 向下滚动,然后点击创建

创建数据湖可能需要几分钟时间。

数据湖的状态变为有效后,您就可以接着执行下一部分。

向数据湖中添加区域

  1. 数据湖列表中,点击 Orders Lake

  2. 点击添加区域

  3. 按如下说明设置下方的属性,以创建新区域。将所有其他属性都保留默认值。

属性
显示名称 Customer Curated Zone
类型 精选区域
数据位置 区域级
  1. 点击创建

创建区域可能需要几分钟时间。

区域的状态变为有效后,您就可以接着执行下一部分。

将资产附加到区域

  1. 区域实例列表中,点击 Customer Curated Zone

  2. 点击添加资产

  3. 点击添加资产

  4. 按如下说明设置下方的属性,将其余属性保留默认值:

属性
类型 BigQuery 数据集
显示名称 Customer Details Dataset
数据集 .customers
  1. 点击继续

  2. 发现设置中,选择继承以继承区域级别的发现设置,然后点击继续

  3. 点击提交

在 Dataplex 中创建数据湖、区域和资产

任务 2. 创建切面类型

切面类型是可重复使用的切面模板。每个切面都是某种切面类型的一个实例。如需向资产添加切面,您需要先创建一个或多个切面类型。

在此任务中,您需要创建一个切面类型,以便为 BigQuery 表中的列添加受保护状态标签。对于公开的切面类型,有权访问 BigQuery 表的用户可以看到应用到这些列的切面。

  1. 在左侧窗格中的管理元数据下,点击 Catalog

  2. 点击创建切面类型

  3. 输入所需信息以定义切面类型:

属性
显示名称 Protected Data Aspect
位置
  1. 模板部分,点击添加字段,然后输入所需信息,以便为切面类型添加新字段:
属性
字段显示名称 Protected Data Flag
类型 枚举
  1. 选中为必填项复选框。

  2. 点击添加枚举值

  3. 对于,输入 Yes

  4. 点击完成

  5. 点击添加枚举值

  6. 对于,输入 No

  7. 点击完成

  8. 点击保存

注意:可能需要过几分钟时间,切面类型才会创建完毕,这时进度检查功能才会返回成功消息。 创建切面类型

任务 3. 为资产添加切面

创建一种切面类型后,您可以将切面添加到任意数量的数据资产。

在此任务中,您需要将“Protected Data”切面添加到 BigQuery 表中需要标为受保护状态的数据列。

向条目添加切面

  1. 在左侧菜单中的发现下,点击搜索

  2. 搜索栏中,确保选择 Dataplex Universal Catalog

  3. 对于使用自然语言的查询,请将开关切换到开启状态。

  4. 过滤条件 > 系统中,选中 BigQuery 复选框。

  5. 对于在您的所有项目和组织中查找数据字段,输入 customer_details,然后点击搜索结果中的 customer_details

如果您没有看到 customer_details 表,请确保在右上角选择了 Dataplex Universal Platform 作为搜索平台。
  1. 向下滚动到标记和切面部分。在可选的标记和切面旁边,点击添加

  2. 过滤条件字段中输入 protected data aspect,然后点击结果中的 Protected Data Aspect

  3. 对于 Protected Data Flag,选择 YES

  4. 点击保存

向条目的列添加切面

  1. 点击架构标签页。

  2. 选中以下列所对应的复选框:

    • zip
    • state
    • last_name
    • country
    • email
    • latitude
    • first_name
    • city
    • longitude
  3. 点击添加标记或切面

  4. 点击 Protected Data Aspect

  5. 对于 Protected Data Flag,选择 YES

  6. 点击保存

注意:系统可能需要几分钟时间才能将切面类型添加到资产,然后进度检查功能才会返回成功消息。 为资产添加切面

任务 4. 使用切面搜索资产

将切面添加到资产(例如表中的列)后,您可以使用 Dataplex Universal Catalog 中的切面名称搜索该资产。

在此任务中,您需要搜索已应用 Protected Data 切面的资产。

  1. 在左侧菜单中的发现下,点击搜索

  2. 搜索栏中,确保选择 Dataplex Universal Catalog

  3. 过滤条件 > 切面中,选中 Protected Data Aspect 复选框。

  4. 点击 customer_details 表。

  5. 点击架构标签页,以查看指定列的“Protected Data”切面。

恭喜!

您使用 Dataplex Universal Catalog 创建了一种切面类型,将该切面添加到了 Dataplex 资产,然后使用该切面搜索了资产。

Google Cloud 培训和认证

…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。

上次更新手册的时间:2025 年 8 月 27 日

上次测试实验的时间:2025 年 8 月 27 日

版权所有 2025 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。

准备工作

  1. 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
  2. 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
  3. 在屏幕左上角,点击开始实验即可开始

使用无痕浏览模式

  1. 复制系统为实验提供的用户名密码
  2. 在无痕浏览模式下,点击打开控制台

登录控制台

  1. 使用您的实验凭证登录。使用其他凭证可能会导致错误或产生费用。
  2. 接受条款,并跳过恢复资源页面
  3. 除非您已完成此实验或想要重新开始,否则请勿点击结束实验,因为点击后系统会清除您的工作并移除该项目

此内容目前不可用

一旦可用,我们会通过电子邮件告知您

太好了!

一旦可用,我们会通过电子邮件告知您

一次一个实验

确认结束所有现有实验并开始此实验

使用无痕浏览模式运行实验

请使用无痕模式或无痕式浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。