arrow_back

使用数据画布以可视化图表的形式呈现数据并设计查询

登录 加入
访问 700 多个实验和课程

使用数据画布以可视化图表的形式呈现数据并设计查询

实验 1 小时 30 分钟 universal_currency_alt 1 个积分 show_chart 入门级
info 此实验可能会提供 AI 工具来支持您学习。
访问 700 多个实验和课程

GSP1259

Google Cloud 自学实验的徽标

概览

假设您是一名数据分析师,已在 Data Beans 工作了一年。您已经成功独立完成了许多项目,并且由于公司的发展,您还承担了指导新数据分析师的责任。团队已在使用 Gemini in BigQuery 来生成 SQL 代码,同时还在使用数据洞见和表探索器功能。团队发现这些功能很有用,对于新数据集而言更是如此。然而,团队需要一个更好的协作工具,以便以可视化图表的形式呈现数据,并创建更为复杂的新查询来联接表。

您听说数据画布是 Google Cloud BigQuery 中的一个直观界面,可以简化数据探索和分析过程。它让用户可以通过点击操作的方式与数据互动,而无需进行复杂的 SQL 查询。您还可以通过共享画布与他人协作。数据画布似乎是能够满足团队需求的解决方案,在了解相关信息后,您想要开始使用数据画布,但不清楚该如何操作。

目标

在本实验中,您将学习如何使用数据画布执行以下操作:

  • 联接 menu、orders 和 order_item 表。
  • 计算每种菜单单品在 2024 年的总收入。
  • 创建一个条形图,显示总收入排在前 10 位的单品。
  • 找出收入相同的两种菜单单品。
  • 与其他人协作。

最后,本实验还留出了一些时间来让您回答实验日志中的问题,以便您回顾在本实验中学到的内容,思考如何将数据画布应用于您的数据、应用场景和工作流。

设置和要求

点击“开始实验”按钮前的注意事项

请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。

此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。为此,我们会向您提供新的临时凭据,您可以在该实验的规定时间内通过此凭据登录和访问 Google Cloud。

为完成此实验,您需要:

  • 能够使用标准的互联网浏览器(建议使用 Chrome 浏览器)。
注意:请使用无痕模式(推荐)或无痕浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。
  • 完成实验的时间 - 请注意,实验开始后无法暂停。
注意:请仅使用学生账号完成本实验。如果您使用其他 Google Cloud 账号,则可能会向该账号收取费用。

如何开始实验并登录 Google Cloud 控制台

  1. 点击开始实验按钮。如果该实验需要付费,系统会打开一个对话框供您选择支付方式。左侧是“实验详细信息”窗格,其中包含以下各项:

    • “打开 Google Cloud 控制台”按钮
    • 剩余时间
    • 进行该实验时必须使用的临时凭据
    • 帮助您逐步完成本实验所需的其他信息(如果需要)
  2. 点击打开 Google Cloud 控制台(如果您使用的是 Chrome 浏览器,请右键点击并选择在无痕式窗口中打开链接)。

    该实验会启动资源并打开另一个标签页,显示“登录”页面。

    提示:将这些标签页安排在不同的窗口中,并排显示。

    注意:如果您看见选择账号对话框,请点击使用其他账号
  3. 如有必要,请复制下方的用户名,然后将其粘贴到登录对话框中。

    {{{user_0.username | "<用户名>"}}}

    您也可以在“实验详细信息”窗格中找到“用户名”。

  4. 点击下一步

  5. 复制下面的密码,然后将其粘贴到欢迎对话框中。

    {{{user_0.password | "<密码>"}}}

    您也可以在“实验详细信息”窗格中找到“密码”。

  6. 点击下一步

    重要提示:您必须使用实验提供的凭据。请勿使用您的 Google Cloud 账号凭据。 注意:在本实验中使用您自己的 Google Cloud 账号可能会产生额外费用。
  7. 继续在后续页面中点击以完成相应操作:

    • 接受条款及条件。
    • 由于这是临时账号,请勿添加账号恢复选项或双重验证。
    • 请勿注册免费试用。

片刻之后,系统会在此标签页中打开 Google Cloud 控制台。

注意:如需访问 Google Cloud 产品和服务,请点击导航菜单,或在搜索字段中输入服务或产品的名称。 “导航菜单”图标和“搜索”字段

任务 1. 联接 menu、orders 和 order_item 表

在此任务中,您将使用数据画布查找 menu、orders 和 order_item 表并将它们联接起来,以便从中提取数据洞见。

查找 menu、orders 和 order_item 表

  1. 在 Google Cloud 控制台中,点击导航菜单下的 BigQuery

  2. 在“欢迎”对话框中点击完成

  3. 点击 数据画布,为您的项目创建一个新的数据画布。

  4. 选择 区域。

  5. 点击选择。此时会显示“未命名的画布”标签页。请留意如何使用自然语言提示来查找表,以及如何访问近期使用的表、近期查询和已保存的查询。您将使用自然语言提示来搜索 coffee_on_wheels 数据集,以查找 menu 和 order_item 表。

  6. 输入 coffee on wheels

  7. 点击 发送搜索查询。系统会显示 coffee_on_wheels 数据集的表。您应该会看到 4 个表:“location”“menu”“orders”和“order_item”。

注意:点击**提交搜索查询**按钮后,请等待系统显示预期数量的表。如果系统未显示您要使用的表,请从左侧窗格打开 coffee_on_wheels 数据集。针对 menuordersorder_item 表,请点击三点状图标,并依次选择查询位置:> 当前数据画布。然后,从其中任一表中点击“联接”,然后选择剩下的两个表。您可以在下一子任务的步骤 3 中使用 Join these data sources 提示继续操作。

联接 menu、orders 和 order_item 表

您已经找到了相应的表,现在可以联接这些表。

  1. 选择 menuordersorder_item 表。请注意,此时会显示“联接”按钮。

  2. 点击联接。您会看到数据画布以直观的方式联接了这三个表,并创建了一个新的分支节点。不过,联接还没有完成。请注意,系统会自动创建一个下面这样的查询,您可以选择运行或保存该查询:

    SELECT * FROM `{{{project_0.project_id|set at lab start}}}.coffee_on_wheels.menu` AS t1, `{{{project_0.project_id|set at lab start}}}.coffee_on_wheels.orders` AS t2, `{{{project_0.project_id|set at lab start}}}.coffee_on_wheels.order_item` AS t3 LIMIT 10;

    不要使用该查询,因为它只会从表中选择单品并列出其中的 10 个。请使用附带的提示。其内容为:

    Join these data sources
  3. 点击 发送输入。您会看到系统生成了一个与下方内容类似的新查询:

    # prompt: Join these data sources SELECT menu.menu_id, menu.company_id, menu.item_name, menu.item_price, menu.item_description, menu.item_size, order_item.order_item_id, order_item.order_id, order_item.quantity, order_item.item_price, order_item.item_total, orders.location_id, orders.customer_id, orders.order_datetime, orders.order_completion_datetime FROM `{{{project_0.project_id|set at lab start}}}.coffee_on_wheels.menu` AS menu INNER JOIN `{{{project_0.project_id|set at lab start}}}.coffee_on_wheels.order_item` AS order_item ON menu.menu_id = order_item.menu_id INNER JOIN `{{{project_0.project_id|set at lab start}}}.coffee_on_wheels.orders` AS orders ON order_item.order_id = orders.order_id;
  4. 点击运行

  5. 查看结果,确认这些表已联接。您会看到每种菜单单品的关键字段都已列出,包括 item_name、item_price、order_datetime 和 item_total。在下一个任务中,您将使用这个新表中的这些字段计算每种单品在 2024 年的总收入。

点击检查我的进度以验证是否完成了以下目标: 联接 menu、orders 和 order_item 表。

任务 2. 计算每种菜单单品在 2024 年的总收入。

在此任务中,您将使用可生成 SQL 查询的 Gemini 提示,基于联接后的表来计算每种菜单单品在 2024 年的总收入。

在联接查询的结果下方,您可以看到可用于在数据画布中创建另一个节点的选项,包括“查询这些结果”“可视化”和“联接”。

  • 查询这些结果:可用于基于生成的联接表创建查询。
  • 可视化:可用于基于联接表中的数据创建图表。
  • 联接:可用于将该表与另一个表联接。
  1. 点击查询这些结果。数据画布中会生成一个新的节点。请注意,您可以输入提示,也可以手动编写新的 SQL 代码。

  2. 输入以下提示:

    From the joined table, only consider orders from 2024. Calculate the total revenue for each menu item. In the results, display the menu_id, the item name, the item size, and the total revenue (rounded as only two decimal places). Order results with total revenue in descending order.
  3. 点击 发送输入。您会看到系统生成了一个与下方内容类似的新查询:

    # prompt: From the joined table, only consider orders from 2024. Calculate the total revenue for each menu item. In the results, display the menu_id, the item name, the item size, and the total revenue (rounded as only two decimal places). Order results with total revenue in descending order. SELECT t1.menu_id, t1.item_name, t1.item_size, ROUND(SUM(t1.item_total), 2) AS total_revenue FROM `SQL` AS t1 WHERE EXTRACT(YEAR FROM t1.order_datetime) = 2024 GROUP BY 1, 2, 3 ORDER BY total_revenue DESC;
  4. 点击运行

  5. 查看结果。请注意,查询结果中包含 menu_iditem_nameitem_sizetotal_revenue 字段。

思考与总结

  1. 哪项单品的收入排名第二?所报告的 item_size 是什么?

点击检查我的进度以验证是否完成了以下目标: 计算每种菜单单品在 2024 年的总收入

任务 3. 创建一个条形图,显示总收入排在前 10 位的单品

在此任务中,您将使用总收入计算结果创建一个条形图,以显示总收入排在前 10 位的单品。

确定总收入排在前 10 位的单品

  1. 点击查询这些结果。数据画布中会生成一个新的节点。

  2. 输入以下提示:

    Identify the top 10 items by total revenue and include the menu_id, item_nam, item_size, and total_revenue fields.
  3. 点击 发送输入。您会看到系统生成了一个与下方内容类似的新查询:

    SELECT t1.menu_id, t1.item_name, t1.item_size, t1.total_revenue FROM `SQL` AS t1 ORDER BY t1.total_revenue DESC LIMIT 10;
  4. 点击运行

  5. 查看结果。请注意,现在仅显示了总收入排在前 10 位的单品。

创建条形图

  1. 点击可视化

  2. 选择创建条形图。数据画布中会生成一个新的节点。请注意观察系统是如何通过“创建条形图”提示自动创建图表的,该图表会显示查询结果中包含的所有菜单单品及其总收入。

    这很有帮助,但请注意这些单品并不是按照总收入从高到低的顺序排列的。图表中也没有考虑单品的杯型。您可以对此进行修正。

  3. 将现有提示替换为以下提示:

    Create a vertical bar chart displaying total revenue. Include the item name on the x-axis and the total revenue on the y-axis in the results. Start with the location with the highest revenue. Stack the results by item size.
  4. 点击 发送输入。请注意排在前 10 位的单品现在是如何按顺序显示的,以及单品杯型是如何在总收入中使用不同的颜色呈现的。

查看图表摘要

现在已创建图表,您还可以获取摘要。要查看图表摘要,请执行以下操作:

  1. 在图表底部,点击生成摘要。系统会生成一个与下方内容类似的图表摘要:
  • “Coffee-infused Avocado Toast”成为了收入最高的单品,其收入达到了 675.48 美元。
  • 大多数菜单单品(10 个中的 5 个)只有一个杯型,属于“不适用”杯型类别。
  • 没有杯型选项的单品对总收入的贡献很大。
  • 对于有杯型选项的单品(“Brewhaha Bonanza”和“Java Journey”),“大杯”更受欢迎。

思考与总结

  1. 将该条形图与任务 2 中所生成查询结果中的原始数据进行比较。

    为什么在该图表中,总收入最高的单品是 Brewhaha Bonanza,而不是 Coffee-infused Avocado Toast?

点击检查我的进度以验证是否完成了以下目标: 创建一个条形图,显示总收入排在前 10 位的单品

任务 4. 找出收入相同的两种菜单单品

在此任务中,您将根据在先前任务中计算的总收入,找出收入相同的两种菜单单品。

  1. 返回计算总收入的节点。

  2. 移动光标,使其悬停在节点的底部中心。您会看到“创建另一个节点”选项。

  3. 点击查询这些结果。数据画布中会生成一个新的节点。

  4. 输入以下提示:

    Find two items with the same total revenue. Within the results, display the item names, item size, and total revenue. Limit your response to only two items.
  5. 点击 发送输入。您会看到系统生成了一个与下方内容类似的新查询:

    # prompt: Find two items with the same total revenue. Within the results, display the item names, item size, and total revenue. Limit your response to only two items. SELECT t1.item_name, t1.item_size, t1.total_revenue FROM `SQL 1` AS t1 WHERE t1.total_revenue IN( SELECT t2.total_revenue FROM `SQL 1` AS t2 GROUP BY 1 HAVING COUNT(t2.total_revenue) > 1 ) LIMIT 2;
  6. 点击运行

思考与总结

查看结果。请注意,系统显示了两项结果,每项结果都包含单品名称、杯型和总收入。

  1. 系统显示了哪两种单品?

  2. 单品杯型是什么?

  3. 二者的收入是否相同?

  4. 思考一下,基于您的数据和应用场景,您会如何使用数据画布来以可视化图表的形式呈现数据并设计查询?

点击检查我的进度以验证是否完成了以下目标: 找出收入相同的两种菜单单品。

任务 5. 与其他人协作

在此任务中,您将扮演两个不同的用户,一个是数据画布的所有者,另一个是您想与之共享数据画布的用户。首先,您需要查看在本实验环境中分配给所有者和另一个用户的角色。然后,您将保存并共享刚刚创建的数据画布。您还可以将数据画布导出到笔记本。最后,您将以另一个用户的身份访问该数据画布。

使用和共享数据画布所需的角色

  1. 在 Google Cloud 控制台中,点击导航菜单下的 IAM 和管理。您将看到主账号及分配的角色的列表。

  2. 找到主账号。

    注意:这是所有者主账号,也是您在本实验中到目前为止一直使用的用户身份。

    在 IAM 中,可以看到该用户具有以下角色:

    • BigQuery Admin
    • Gemini for Google Cloud User
    • Owner
    • Service Usage Viewer
    • Viewer
  3. 找到主账号。

    注意:这是您使用的另一个主账号,用来测试数据画布共享功能。

    在 IAM 中,可以看到该用户具有以下角色:

    • BigQuery Data Editor
    • BigQuery Studio User
    • Gemini for Google Cloud User
    • Code Editor
    • Viewer

如需了解详情,请参阅使用数据画布所需的角色

保存和共享数据画布(作为所有者)

  1. 返回到 BigQuery 中的数据画布。

  2. 找到画布顶端的“保存”按钮。点击向下箭头。您会看到两个选项,分别是“保存”和“另存为”。

  3. 点击另存为。系统会显示“保存”对话框。

  4. 输入名称总收入相同的两种单品

  5. 保留默认区域,因为这是您启动实验时系统分配给您的。

  6. 点击保存。您会发现,数据画布现已保存,并显示在“探索器”面板的“共享的数据画布”部分。

将数据画布导出到笔记本(作为所有者)

借助 BigQuery 数据画布,您可以将查询导出为笔记本。

  1. 在数据画布中,点击导出为笔记本

  2. 在“保存笔记本”窗格中,输入笔记本的名称 (data_canvas_export) 和要将其保存到的区域 ()。

  3. 点击保存。笔记本已成功创建。

  4. 要查看创建的笔记本,请展开“探索器”面板的笔记本部分。

  5. 点击 data_canvas_export 笔记本。

注意:鉴于所有者和另一个用户的当前权限,只有所有者可以进行导出。换句话说,您需要提供适当的权限才能启用导出功能。

访问数据画布(作为另一位用户)

现在您需要以另一位用户的身份访问数据画布。

  1. 在该实验指南中,右键点击打开 Google Cloud 控制台

  2. 选择在无痕式窗口中打开链接

  3. 使用“用户名 2”的用户名和密码。按照与本实验开始时相同的方式访问 Google Cloud 控制台。

  4. 在 Google Cloud 控制台中,点击导航菜单下的 BigQuery

  5. 在“欢迎”对话框中点击完成

  6. 探索器面板中,展开项目。您会在列表底部看到 coffee_on_wheels 数据集。

  7. 展开数据画布

  8. 展开共享的数据画布。您会看到系统列出了总收入相同的两种单品数据画布。

  9. 点击总收入相同的两种单品数据画布。系统即会显示该数据画布。

在这里,另一位用户可以查看数据画布,了解您为此业务问题设计的工作流。如果需要,对方甚至可以根据所拥有的权限修改画布,以排查问题或根据需要完善画布。

思考与总结

  1. 思考一下,基于您的数据和应用场景,您会如何使用数据画布与团队进行协作?

  2. 对于团队创建的数据画布,如何管理用户的访问权限?

点击检查我的进度以验证是否完成了以下目标: 将数据画布导出到笔记本。

恭喜!

您已成功使用数据画布从 coffee_on_wheels 数据集中查找并联接表。您还成功计算了数据集中每种菜单单品的总收入,并直接在数据画布中使用条形图将其直观呈现出来。然后,您借助此计算结果,成功找出了收入相同的两种单品。最后,您在数据画布中使用 IAM 角色成功在项目中保存了数据画布,并与他人共享。

请思考您在本实验中学到的内容,并与团队中的其他人分享,以确定如何使用数据画布相互协作。

后续步骤/了解详情

Google Cloud 培训和认证

…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。

本手册的最后更新时间:2024 年 10 月 9 日

本实验的最后测试时间:2024 年 10 月 9 日

版权所有 2025 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。

准备工作

  1. 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
  2. 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
  3. 在屏幕左上角,点击开始实验即可开始

使用无痕浏览模式

  1. 复制系统为实验提供的用户名密码
  2. 在无痕浏览模式下,点击打开控制台

登录控制台

  1. 使用您的实验凭证登录。使用其他凭证可能会导致错误或产生费用。
  2. 接受条款,并跳过恢复资源页面
  3. 除非您已完成此实验或想要重新开始,否则请勿点击结束实验,因为点击后系统会清除您的工作并移除该项目

此内容目前不可用

一旦可用,我们会通过电子邮件告知您

太好了!

一旦可用,我们会通过电子邮件告知您

一次一个实验

确认结束所有现有实验并开始此实验

使用无痕浏览模式运行实验

请使用无痕模式或无痕式浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。