arrow_back

Позначення тегами об’єктів Dataplex

Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Позначення тегами об’єктів Dataplex

Lab 45 годин universal_currency_alt 1 кредит show_chart Початковий
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP1145

Логотип Google Cloud Self-Paced Labs

Огляд

Dataplex — це інтелектуальна структура даних, завдяки якій організації можуть централізовано шукати, контролювати й відстежувати дані в озерах, сховищах і вітринах із метою аналізу у великих масштабах.

Data Catalog – це повністю керований масштабований сервіс обробки метаданих у Dataplex, який можна використовувати для позначення тегами об’єктів даних і пошуку об’єктів, до яких ви маєте доступ. Теги дають змогу додавати власні поля метаданих до певних об’єктів даних для полегшення їх ідентифікації і пошуку (наприклад, позначення певних об’єктів, які містять захищені або чутливі дані). Ви також можете створювати шаблони тегів для багаторазового використання, щоб швидко призначати однакові теги різним об’єктам даних.

У цій практичній роботі ви дізнаєтесь, як за допомогою Data Catalog у Dataplex створити шаблон тегу, застосувати його до об’єктів Dataplex, а потім використовувати тег для пошуку об’єктів.

Завдання

  • Увімкнути Dataplex і Data Catalog API
  • Створити озеро, зону й об’єкт Dataplex
  • Створити шаблон тегу
  • Застосувати шаблон тегу до об’єктів Dataplex
  • Шукати об’єкти за тегами

Налаштування й вимоги

Перш ніж натиснути кнопку Start Lab (Почати практичну роботу)

Ознайомтеся з наведеними нижче вказівками. На виконання практичної роботи відводиться обмежений час, і її не можна призупинити. Щойно ви натиснете Start Lab (Почати практичну роботу), з’явиться таймер, який показуватиме, скільки часу для роботи з ресурсами Google Cloud у вас залишилося.

Ви зможете виконати практичну роботу в дійсному робочому хмарному середовищі (не в симуляції або демонстраційному середовищі). Для цього на час виконання практичної роботи вам надаються тимчасові облікові дані для реєстрації і входу в Google Cloud.

Щоб виконати цю практичну роботу, потрібно мати:

  • стандартний веб-переглядач, наприклад Chrome (рекомендовано)
Примітка. Виконуйте практичну роботу в режимі анонімного перегляду. Так ви уникнете додаткової плати, що може стягуватися з вашого особистого облікового запису внаслідок його конфліктів з обліковим записом для навчання.
  • достатню кількість часу, оскільки почавши практичну роботу, ви не зможете призупинити її
Примітка. Якщо ви маєте особистий обліковий запис або проект Google Cloud, не використовуйте їх для доступу до цієї практичної роботи. Так ви уникнете додаткових стягнень з вашого облікового запису.

Як почати виконувати практичну роботу й увійти в Google Cloud Console

  1. Натисніть кнопку Start Lab (Почати практичну роботу). Якщо за практичну роботу необхідно заплатити, відкриється спливаюче вікно, де ви зможете обрати спосіб оплати. Ліворуч розміщено панель Lab Details (Відомості про практичну роботу) з такими даними:

    • кнопка Open Google Console (Відкрити Google Console);
    • час до закінчення;
    • тимчасові облікові дані, які потрібно використовувати для доступу до цієї практичної роботи;
    • інша необхідна для виконання цієї практичної роботи інформація.
  2. Натисніть Open Google Console (Відкрити Google Console). Завантажаться необхідні ресурси. Потім відкриється нова вкладка зі сторінкою Sign in (Вхід).

    Порада. Упорядковуйте вкладки в окремих вікнах, розміщуючи їх поруч.

    Примітка. Якщо з’явиться вікно Choose an account (Виберіть обліковий запис), натисніть Use Another Account (Увійти в інший обліковий запис).
  3. За потреби скопіюйте Username (Ім’я користувача) з панелі Lab Details (Відомості про практичну роботу) і вставте його у вікні Sign in (Вхід). Натисніть Next (Далі).

  4. Скопіюйте Password (Пароль) з панелі Lab Details (Відомості про практичну роботу) і вставте його у вікні Welcome (Привітання). Натисніть Next (Далі).

    Важливо. Обов’язково використовуйте облікові дані з панелі ліворуч. Не використовуйте облікові дані Google Cloud Skills Boost. Примітка. Якщо ввійти у власний обліковий запис Google Cloud, може стягуватися додаткова плата.
  5. Виконайте наведені нижче дії.

    • Прийміть Умови використання.
    • Не додавайте способи відновлення та двохетапну перевірку (оскільки це тимчасовий обліковий запис).
    • Не реєструйте безкоштовні пробні версії.

Через кілька секунд Cloud Console відкриється в новій вкладці.

Примітка. Ви можете переглянути меню зі списком продуктів і сервісів Google Cloud, натиснувши меню навігації вгорі ліворуч. Значок меню навігації

Увімкніть Dataplex і Data Catalog API

  1. У рядку пошуку вгорі Google Cloud Console введіть Cloud Dataplex API.

  2. Виберіть серед результатів у розділі Marketplace Cloud Dataplex API.

  3. Натисніть Enable (Увімкнути).

  4. Повторіть кроки 1–3 для Google Cloud Data Catalog API.

Завдання 1. Створіть озеро, зону й об’єкт

У цьому завданні ви створите нове озеро даних Dataplex для зберігання інформації про замовлення клієнтів, додасте до озера спеціально підібрану зону, а потім долучите до неї попередньо створений набір даних BigQuery як новий об’єкт.

Створіть озеро даних

  1. У меню навігації (Меню навігації) Google Cloud Console натисніть Analytics (Аналітика) > Dataplex.

Якщо з’явиться запит Welcome to the new Dataplex experience (Вітаємо в новому інтерфейсі Dataplex), натисніть Close (Закрити).

  1. У розділі Manage lakes (Керувати озерами даних) натисніть Manage (Керувати).

  2. Виберіть Create lake (Створити озеро даних).

  3. Введіть необхідну інформацію.

Властивість Значення
Відображувана назва Orders Lake (Озеро даних замовлень)
Ідентифікатор Залиште значення за умовчанням.
Регіон

Залиште інші значення за умовчанням.

  1. Натисніть Create (Створити).

Озеро даних буде створено протягом 3 хвилин.

Додайте зону в озеро даних

  1. Натисніть назву потрібного озера на вкладці Manage (Керувати).

  2. Виберіть Add zone (Додати зону).

  3. Введіть необхідну інформацію.

Властивість Значення
Відображувана назва Customer Curated Zone (Спеціально підібрана зона для клієнта)
Ідентифікатор Залиште значення за умовчанням.
Тип Спеціально підібрана зона
Місцезнаходження даних Регіональне

Залиште інші значення за умовчанням.

Наприклад, за умовчанням буде ввімкнено параметр Enable metadata discovery (Увімкнути пошук метаданих) у розділі Discovery settings (Налаштування пошуку), який дає авторизованим користувачам змогу знаходити дані в зоні.

  1. Натисніть Create (Створити).

Зону буде створено протягом 2 хвилин.

Коли статус зони зміниться на Active (Активна), ви можете переходити до наступного завдання.

Додайте об’єкт у зону

  1. Натисніть назву потрібної зони на вкладці Zones (Зони).

  2. Виберіть Add assets (Додати об’єкти) на вкладці Assets (Об’єкти).

  3. Натисніть Add an asset (Додати об’єкт).

  4. Введіть необхідну інформацію.

Властивість Значення
Тип Набір даних BigQuery
Відображувана назва Customer Details Dataset (Набір даних з інформацією про клієнта)
Ідентифікатор Залиште значення за умовчанням.
Набір даних .customers

Залиште інші значення за умовчанням.

  1. Натисніть Done (Готово).

  2. Натисніть Continue (Продовжити).

  3. У розділі Discovery settings (Налаштування пошуку) виберіть параметр Inherit (Успадкувати), щоб об’єкт успадкував налаштування пошуку на рівні зони, а потім натисніть Continue (Продовжити).

  4. Натисніть Submit (Надіслати).

Створіть озеро, зону й об’єкт Dataplex

Завдання 2. Створіть шаблон тегу

Щоб почати позначати дані тегами, спочатку потрібно створити принаймні один шаблон тегу. Шаблон тегу може бути загальнодоступним або приватним. Коли ви створюєте новий шаблон тегу, за умовчанням рекомендується створити загальнодоступний варіант. Користувачі, які мають необхідні дозволи для об’єкта даних, можуть переглядати всі загальнодоступні теги, пов’язані з ним. Завдяки цьому забезпечується простий пошук за категоріями, а також контроль доступу на основі критеріїв, застосованих до базових даних.

У цьому завданні ви створите загальнодоступний шаблон тегу для позначення стовпців таблиці BigQuery із захищеним статусом. За допомогою загальнодоступного шаблону тегів користувачі, які мають доступ до базових стовпців таблиці BigQuery, зможуть бачити теги, застосовані до цих стовпців.

  1. У меню ліворуч у розділі Manage catalog (Керувати каталогом) натисніть Tag templates (Шаблони тегів).

  2. Натисніть Create tag template (Створити шаблон тегу).

  3. Введіть необхідну інформацію, щоб визначити шаблон тегу.

Властивість Значення
Відображувана назва шаблона Protected Data Template (Шаблон захищених даних)
Ідентифікатор шаблону Залиште значення за умовчанням.
Місцезнаходження
Видимість Для всіх
  1. Натисніть Add field (Додати поле) і введіть необхідну інформацію, щоб додати нове поле в шаблон.
Властивість Значення
Відображувана назва поля Protected Data Flag (Позначка захищених даних)
Ідентифікатор поля Залиште значення за умовчанням.
Тип Пронумеровані
  1. Виберіть Enumerated values (Пронумеровані значення) > Values 1 (Значення 1) і введіть YES.

  2. Натисніть Add value (Додати значення) і для параметра Values 2 (Значення 2) введіть NO.

  3. Натисніть Done (Готово).

  4. Натисніть Create (Створити).

Створіть шаблон тегу

Завдання 3. Застосуйте шаблон тегу до об’єктів Dataplex

Створивши шаблон тегу, ви можете за його допомогою додавати теги будь-якій кількості потрібних об’єктів даних, до яких у вас є доступ.

У цьому завданні ви застосуєте раніше створений шаблон тегів до певних стовпців у таблиці BigQuery, яким потрібно надати статус захищених даних.

  1. У меню ліворуч у розділі Discover (Огляд) натисніть Search (Пошук).

  2. У розділі Filters (Фільтри) > Systems (Системи) поставте прапорець для параметра Dataplex.

  3. Натисніть таблицю customer_details.

Якщо таблиці customer_details немає, зачекайте кілька хвилин, а потім оновіть сторінку, щоб завантажити новий список об’єктів Dataplex.

  1. Натисніть Attach tags (Додати теги).

  2. У розділі Choose what to tag (Виберіть, що потрібно позначити тегом) поставте прапорці для таких стовпців:

    • zip (поштовий індекс)
    • state (штат)
    • last_name (прізвище)
    • country (країна)
    • email (електронна пошта)
    • latitude (широта)
    • first_name (ім’я)
    • city (місто)
    • longitude (довгота)
  3. Натисніть OK.

  4. У розділі Choose the tag templates (Виберіть шаблони тегів) натисніть Protected data template (Шаблон захищених даних).

  5. Для параметра Protected data flag (Позначка захищених даних) виберіть YES (ТАК).

  6. Натисніть Зберегти.

Застосуйте шаблон тегу до об’єктів Dataplex

Завдання 4. Шукайте об’єкти за допомогою тегів

Позначивши тегами об’єкти даних, ви можете шукати їх за допомогою Data Catalog у Dataplex.

У цьому завданні ви шукатимете об’єкти, які було позначено тегами за допомогою шаблону тегу "Захищені дані".

  1. У меню ліворуч у розділі Discover (Огляд) натисніть Search (Пошук).

  2. У розділі Filters (Фільтри) > Tags (Теги) поставте прапорець для параметра Protected data template (Шаблон захищених даних).

  3. Натисніть таблицю customer_details.

  4. Перейдіть на вкладку Schema and column tags (Схема й теги стовпців), щоб переглянути теги захищених даних у вказаних стовпцях.

Вітаємо!

За допомогою Data Catalog у Dataplex ви створили шаблон тегу, застосували його до об’єктів Dataplex, а потім скористалися тегом для пошуку об’єктів.

Навчання й сертифікація Google Cloud

…допомагають ефективно використовувати технології Google Cloud. Наші курси передбачають опанування технічних навичок, а також ознайомлення з рекомендаціями, що допоможуть вам швидко зорієнтуватися й вивчити матеріал. Ми пропонуємо курси різних рівнів – від базового до високого. Ви можете вибрати формат навчання (за запитом, онлайн або офлайн) відповідно до власного розкладу. Пройшовши сертифікацію, ви перевірите й підтвердите свої навички та досвід роботи з технологіями Google Cloud.

Посібник востаннє оновлено 20 вересня 2023 року

Практичну роботу востаннє протестовано 20 вересня 2023 року

© Google LLC 2024. Усі права захищено. Назва та логотип Google є торговельними марками Google LLC. Усі інші назви компаній і продуктів можуть бути торговельними марками відповідних компаній, з якими вони пов’язані.