
准备工作
- 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
- 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
- 在屏幕左上角,点击开始实验即可开始
Create a lake
/ 20
Add zone to your lake
/ 20
Attach an asset to a zone
/ 40
Delete assets, zones, and lakes
/ 20
Dataplex Universal Catalog 是一种智能数据结构脉络,使组织能够跨数据湖、数据仓库和数据集市,集中发现、管理、监控和治理其数据,从而实现大规模分析。具体而言,您可以使用 Dataplex Universal Catalog 构建数据网格架构。这是一种组织和技术方法,用于在网域数据所有者之间分散数据所有权。
借助 Dataplex Universal Catalog,您可以在无需移动或复制数据的情况下对其进行管理。当您添加新的数据资产时,Dataplex Universal Catalog 会收集结构化和非结构化数据的元数据,并自动将所有元数据注册到安全和统一的 metastore 中。然后,您就可以通过 Data Catalog 和 BigQuery 等 Google Cloud 服务来评估数据和元数据。
在本实验中,您将学习如何使用 Google Cloud 控制台在 Dataplex Universal Catalog 中创建和移除数据湖、区域和资产,以着手构建您自己的数据网格。
请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。
此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。为此,我们会向您提供新的临时凭据,您可以在该实验的规定时间内通过此凭据登录和访问 Google Cloud。
为完成此实验,您需要:
点击开始实验按钮。如果该实验需要付费,系统会打开一个对话框供您选择支付方式。左侧是“实验详细信息”窗格,其中包含以下各项:
点击打开 Google Cloud 控制台(如果您使用的是 Chrome 浏览器,请右键点击并选择在无痕式窗口中打开链接)。
该实验会启动资源并打开另一个标签页,显示“登录”页面。
提示:将这些标签页安排在不同的窗口中,并排显示。
如有必要,请复制下方的用户名,然后将其粘贴到登录对话框中。
您也可以在“实验详细信息”窗格中找到“用户名”。
点击下一步。
复制下面的密码,然后将其粘贴到欢迎对话框中。
您也可以在“实验详细信息”窗格中找到“密码”。
点击下一步。
继续在后续页面中点击以完成相应操作:
片刻之后,系统会在此标签页中打开 Google Cloud 控制台。
在 Google Cloud 控制台顶部的搜索栏中,输入 Cloud Dataplex API。
点击 Marketplace 下面的 Cloud Dataplex API 搜索结果。
点击启用。
在 Dataplex Universal Catalog 中,数据湖是级别最高的组织网域,代表特定数据区域或业务单元。例如,您可以为组织中的每个部门或数据网域创建一个数据湖,以便为特定的用户群组整理和提供数据。
在此任务中,您将创建一个数据湖,以着手构建数据网格。
如果系统提示欢迎体验新版 Dataplex Universal Catalog
,请点击关闭。
点击管理数据湖下的管理。
点击 +创建数据湖。
输入所需信息以新建数据湖:
属性 | 值 |
---|---|
显示名称 | sensors |
ID | 保留默认值。 |
区域 (Region) |
保留其他默认值。
数据湖创建过程最长可能需要 3 分钟。
点击“检查我的进度”,验证已完成以下目标:
数据湖创建完成后,就可以向其添加区域了。区域是数据湖的子网域,可用于对数据进一步分类。例如,您可以按阶段、使用或限制情况对数据进行分类。
区域有两种类型:
在此任务中,您将创建一个原始区域,用于存储 Cloud Storage 存储桶中的文件。
在管理标签页上,点击数据湖的名称。
点击 +添加区域。
输入所需信息以新建区域:
属性 | 值 |
---|---|
显示名称 | temperature raw data |
ID | 保留默认值。 |
类型 | 原始区域 |
数据位置 | 区域级 (Regional) |
保留其他默认值。
例如,默认情况下,发现设置下的启用元数据发现选项处于选中状态,允许获得授权的用户发现区域中的数据。
区域创建过程最长可能需要 2 分钟。
点击“检查我的进度”,验证已完成以下目标:
Cloud Storage 存储桶或 BigQuery 数据集中存储的数据可以作为资产附加到 Dataplex Universal Catalog 数据湖内的区域中。
在此任务中,您将附加一个在 Google Cloud 控制台中创建的 Cloud Storage 存储桶。
在区域标签页上,点击区域的名称。
在资产标签页上,点击 +添加资产。
点击 +添加资产。
输入所需信息以附加新资产:
属性 | 值 |
---|---|
类型 | 存储桶 |
显示名称 | measurements |
ID | 保留默认值。 |
保留其他默认值。
您无需离开 Dataplex Universal Catalog 就可以附加现有 Cloud Storage 存储桶或新建存储桶。在接下来的步骤中,您将新建一个 Cloud Storage 存储桶并将其附加到区域中。
点击 +新建存储桶 ()。
将项目 ID 作为存储桶名称 (
对于位置类型,选择资源区域,然后选择
保留其他默认值。
如果出现系统将禁止公开访问
的提示,点击确认。
点击选择,选中您刚刚创建的存储桶,然后点击继续。
对于发现设置,选择继承以继承区域级别的发现设置,然后点击继续。
点击提交。
点击“检查我的进度”,验证已完成以下目标:
如要删除数据湖,必须先分离资产,然后再删除区域。
在此任务中,您将从区域中分离资产,然后删除区域,最后再删除数据湖。
在左侧菜单中,点击管理标签页,然后点击数据湖的名称。
在区域标签页上,点击区域的名称。
在资产标签页上,选中资产名称左侧的复选框。
点击删除资产。
点击删除进行确认。
此操作将删除 Cloud Storage 存储桶中的基础数据。您无法再使用 Dataplex Universal Catalog 中的数据湖来访问或发现该 Cloud Storage 存储桶。
在左侧菜单中,点击管理标签页,然后点击数据湖的名称。
在区域标签页上,选中区域名称左侧的复选框。
点击删除区域。
点击删除进行确认。
在左侧菜单中,点击管理标签页,然后点击数据湖的名称。
点击页面顶部的删除。
在文本框中输入 delete 以确认删除。
点击删除数据湖以确认删除。
点击“检查我的进度”,验证已完成以下目标:
您已使用 Google Cloud 控制台在 Dataplex Universal Catalog 中创建和删除数据湖、区域和资产。
…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。
上次更新手册的时间:2025 年 6 月 4 日
上次测试实验的时间:2025 年 6 月 4 日
版权所有 2025 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。
此内容目前不可用
一旦可用,我们会通过电子邮件告知您
太好了!
一旦可用,我们会通过电子邮件告知您
一次一个实验
确认结束所有现有实验并开始此实验