arrow_back

Практичне заняття підвищеного рівня складності "Створення сітки даних за допомогою Dataplex"

Get access to 700+ labs and courses

Практичне заняття підвищеного рівня складності "Створення сітки даних за допомогою Dataplex"

Lab 1 година 30 годин universal_currency_alt 1 кредит show_chart Початковий
info This lab may incorporate AI tools to support your learning.
Get access to 700+ labs and courses

GSP514

Логотип Google Cloud Self-Paced Labs

Огляд

Практична робота підвищеного рівня складності передбачає сценарій і кілька завдань. Покрокових інструкцій немає. Натомість ви маєте застосувати навички, які здобули під час практичних робіт курсу, і самостійно з’ясувати, як виконувати завдання. Автоматична система оцінювання (показана на цій сторінці) згенерує відгук щодо того, чи правильно виконано завдання.

Під час практичної роботи підвищеного рівня складності ви не вивчаєте нові поняття Google Cloud, а розвиваєте опановані навички (наприклад, змінюєте значення за умовчанням і переглядаєте повідомлення про помилки для їх виправлення).

Щоб набрати 100%, слід правильно виконати всі завдання за визначений період часу.

Це практичне заняття рекомендоване для слухачів, які зареєструвалися на кваліфікаційний курс Створення сітки даних за допомогою Dataplex. Готові почати?

Налаштування й вимоги

Перш ніж натиснути кнопку Start Lab (Почати практичну роботу)

Ознайомтеся з наведеними нижче вказівками. На виконання практичного заняття відводиться обмежений час, і його не можна призупинити. Щойно ви натиснете Почати заняття, з’явиться таймер, який показуватиме, скільки часу для роботи з ресурсами Google Cloud у вас залишилося.

Ви зможете виконати практичне заняття в дійсному робочому хмарному середовищі (не в симуляції або демонстраційному середовищі). Для цього на час практичного заняття вам надаються тимчасові облікові дані для реєстрації і входу в Google Cloud.

Для цього практичного заняття потрібно мати:

  • стандартний вебпереглядач, наприклад Chrome (рекомендовано);
Примітка. Виконуйте практичне заняття в анонімному вікні вебпереглядача (рекомендовано). Так ви уникнете додаткової плати, що може стягуватися з вашого особистого облікового запису внаслідок його помилкового використання замість облікового запису для навчання.
  • достатню кількість часу, оскільки почавши практичне заняття, ви не зможете призупинити його.
Примітка. Для виконання цього практичного заняття використовуйте лише обліковий запис для навчання, оскільки з іншого облікового запису Google Cloud може стягуватися плата.

Сценарій

Ви починаєте працювати на посаді молодшого розробника даних і вже допомагали команді розробників створювати й налаштовувати об’єкти Dataplex.

Очікується, що ви вже маєте знання й навички для виконання таких завдань.

Ваше завдання

Вам потрібно допомогти нещодавно зібраній команді розробників скласти нову сітку даних за допомогою Dataplex, а саме створити озеро даних із кількома зонами й об’єктами. Вам також знадобиться створити типи аспектів і додати їх до об’єктів у новому озері даних, а також оцінити якість інформації, яку вони містять. Для цього буде необхідно виконати наведені нижче завдання.

  • Створіть озеро даних Dataplex із двома зонами й двома об’єктами.
  • Створіть тип аспекту для захищених даних і додайте аспект у зону.
  • Призначте роль IAM у Dataplex іншому користувачу.
  • Створіть і завантажте файл зі специфікацією якості даних у Cloud Storage.
  • Налаштуйте й запустіть завдання з перевірки якості даних у Dataplex.

Слід дотримуватися описаних нижче стандартів.

  • Усі необхідні для роботи API, зокрема Dataplex, Data Catalog і Dataproc, має бути ввімкнено.
  • Створювати всі ресурси в регіоні , якщо немає інших вказівок.

Нижче детально описано кожне завдання. Бажаємо успіху!

Завдання 1. Створіть озеро даних Dataplex із двома зонами й двома об’єктами

Примітка. Для всіх завдань цього практичного заняття підвищеного рівня складності створюйте ресурси в регіоні , якщо немає інших вказівок.

Сегмент Cloud Storage і набір даних BigQuery, які необхідні для виконання кроку 2 цього завдання, було створено попередньо.

  1. Створіть озеро даних Dataplex під назвою Sales Lake із двома регіональними зонами:
  • необробленою зоною з даними клієнтів Raw Customer Zone;
  • спеціально підібраною зоною з даними клієнтів Curated Customer Zone.
  1. Додайте по одному попередньо створеному об’єкту в кожну зону.
  • У необроблену зону додайте сегмент Cloud Storage під назвою -customer-online-sessions як новий об’єкт взаємодій із клієнтами Customer Engagements.
  • У спеціально підібрану зону додайте набір даних BigQuery під назвою .customer_orders як новий об’єкт замовлень клієнтів Customer Orders.

Підказка щодо створення озера даних Dataplex.

Щоб підтвердити виконання завдання, натисніть Підтвердити виконання. Створіть озеро даних Dataplex із двома зонами й двома об’єктами.

Завдання 2. Створіть тип аспекту й додайте аспект у зону

  1. Створіть тип аспекту під назвою Protected Customer Data Aspect із двома полями з наборами значень.
  • Перше поле для позначки необроблених даних Raw Data Flag із двома значеннями Yes і No.
  • Друге поле для позначки захищеної контактної інформації Protected Contact Information Flag із двома значеннями Yes і No.
  1. Додайте цей аспект у зону Raw Customer Zone, призначивши обом позначкам значення Yes.

Підказка щодо створення й застосування типів аспектів.

Щоб підтвердити виконання завдання, натисніть Підтвердити виконання. Створіть тип аспекту й додайте аспект у зону.

Завдання 3. Призначте роль IAM у Dataplex іншому користувачу

  • За принципом мінімальних повноважень призначте Користувачу 2 () роль IAM у Dataplex, яка дасть йому змогу завантажувати нові файли Cloud Storage в об’єкт Dataplex під назвою Customer Engagements.

Підказка щодо призначення ролей IAM у Dataplex.

Щоб підтвердити виконання завдання, натисніть Підтвердити виконання. Призначте роль IAM у Dataplex іншому користувачу.

Завдання 4. Створіть і завантажте файл зі специфікацією якості даних у Cloud Storage

Сегмент Cloud Storage, необхідний для виконання кроку 2 цього завдання, було створено попередньо.

  1. Створіть файл зі специфікацією якості даних під назвою dq-customer-orders.yaml із наведеними нижче параметрами.
  • Правило NOT NULL застосовано (з пороговим значенням 100%) до стовпця user_id в таблиці customer_orders.ordered_items.
  • Правило NOT NULL застосовано (з пороговим значенням 100%) до стовпця order_id в таблиці customer_orders.ordered_items.
  • Цільова таблиця BigQuery для результатів: .orders_dq_dataset.results.
  1. Завантажте цей файл у сегмент Cloud Storage під назвою -dq-config.

Підказка щодо створення файлів зі специфікацією якості даних.

Щоб підтвердити виконання завдання, натисніть Підтвердити виконання. Створіть і завантажте файл зі специфікацією якості даних.

Завдання 5. Налаштуйте й запустіть завдання з автоматичної перевірки якості даних у Dataplex

Набір даних BigQuery, необхідний для виконання кроку 1 цього завдання, було створено попередньо.

  1. Налаштуйте завдання з перевірки якості даних за допомогою файлу dq-customer-orders.yaml із наведеними нижче параметрами.
Властивість Значення
Data Quality Job Name (Назва завдання з перевірки якості даних) customer-orders-data-quality-job
Source Data (Вихідні дані) .customer_orders.ordered_items
User service account (Сервісний обліковий запис користувача) Compute Engine default service account (Сервісний обліковий запис Compute Engine за умовчанням)
  1. Указавши потрібну інформацію, одразу запустіть завдання з перевірки якості даних.
Виконання завдання може зайняти кілька хвилин. Можливо, вам доведеться оновити сторінку, щоб побачити відповідне сповіщення.

Підказка щодо визначення й виконання завдань із перевірки якості даних.

Щоб підтвердити виконання завдання, натисніть Підтвердити виконання. Налаштуйте й запустіть завдання з перевірки якості даних у Dataplex.

Вітаємо!

Ви побудували сітку даних: створили озеро даних Dataplex із кількома зонами й об’єктами, створили типи аспектів, додали аспекти до об’єктів і оцінили якість даних.

Значок за створення сітки даних за допомогою Dataplex

Отримайте наступний значок

Це практичне заняття можна виконувати у власному темпі, і воно входить до кваліфікаційного курсу Створення сітки даних за допомогою Dataplex. Пройшовши квест, ви отримаєте значок як відзнаку за досягнення. Додайте значок у своє резюме й на сторінки в соціальних мережах. Розкажіть про свої досягнення за допомогою хештегу #GoogleCloudBadge.

Цей кваліфікаційний курс входить до плану навчання Google Cloud для розробників даних. Якщо ви вже виконали інші кваліфікаційні курси в цьому плані навчання, у каталозі є інші доступні квести.

Навчання й сертифікація Google Cloud

…допомагають ефективно використовувати технології Google Cloud. Наші курси передбачають опанування технічних навичок, а також ознайомлення з рекомендаціями, що допоможуть вам швидко зорієнтуватися й вивчити матеріал. Ми пропонуємо курси різних рівнів – від базового до високого. Ви можете вибрати формат навчання (за запитом, онлайн або офлайн) відповідно до власного розкладу. Пройшовши сертифікацію, ви перевірите й підтвердите свої навички та досвід роботи з технологіями Google Cloud.

Посібник востаннє оновлено 4 вересня 2025 року

Практичне заняття востаннє протестовано 4 вересня 2025 року

© Google LLC 2025. Усі права захищено. Назва та логотип Google є торговельними марками Google LLC. Усі інші назви компаній і продуктів можуть бути торговельними марками відповідних компаній, з якими вони пов’язані.

Before you begin

  1. Labs create a Google Cloud project and resources for a fixed time
  2. Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
  3. On the top left of your screen, click Start lab to begin

Use private browsing

  1. Copy the provided Username and Password for the lab
  2. Click Open console in private mode

Sign in to the Console

  1. Sign in using your lab credentials. Using other credentials might cause errors or incur charges.
  2. Accept the terms, and skip the recovery resource page
  3. Don't click End lab unless you've finished the lab or want to restart it, as it will clear your work and remove the project

This content is not currently available

We will notify you via email when it becomes available

Great!

We will contact you via email if it becomes available

One lab at a time

Confirm to end all existing labs and start this one

Use private browsing to run the lab

Use an Incognito or private browser window to run this lab. This prevents any conflicts between your personal account and the Student account, which may cause extra charges incurred to your personal account.