GSP514

Opis
W Challenge Lab (module-wyzwaniu) otrzymasz scenariusz i zestaw zadań. Zamiast instrukcji krok po kroku użyjesz umiejętności zdobytych w poszczególnych modułach szkolenia, rozwiązując zadania samodzielnie. Automatyczny system oceniania (widoczny na tej stronie) poinformuje Cię, czy zadanie zostało wykonane poprawnie.
W Challenge Lab nie będziemy uczyć Cię nowych pojęć związanych z Google Cloud. Musisz za to poszerzyć nabyte umiejętności, takie jak zmiana domyślnych wartości oraz czytanie i analizowanie komunikatów o błędach, po to, by naprawiać popełnione przez siebie błędy.
Aby zdobyć 100% punktów, musisz ukończyć wszystkie zadania w określonym czasie.
Ten moduł przeznaczony jest dla użytkowników, którzy zapisali się na szkolenie Tworzenie siatki danych przy użyciu Dataplex, które pozwala zdobyć odznakę umiejętności. Podejmujesz się wyzwania?
Konfiguracja i wymagania
Zanim klikniesz przycisk Rozpocznij moduł
Zapoznaj się z tymi instrukcjami. Moduły mają limit czasowy i nie można ich zatrzymać. Gdy klikniesz Rozpocznij moduł, na liczniku wyświetli się informacja o tym, na jak długo udostępniamy Ci zasoby Google Cloud.
W tym praktycznym module możesz spróbować swoich sił w wykonywaniu opisywanych działań w prawdziwym środowisku chmury, a nie w jego symulacji lub wersji demonstracyjnej. Otrzymasz nowe, tymczasowe dane logowania, dzięki którym zalogujesz się i uzyskasz dostęp do Google Cloud na czas trwania modułu.
Do ukończenia modułu potrzebne będą:
- Dostęp do standardowej przeglądarki internetowej (zalecamy korzystanie z przeglądarki Chrome).
Uwaga: uruchom ten moduł w oknie incognito (zalecane) lub przeglądania prywatnego. Dzięki temu unikniesz konfliktu między swoim kontem osobistym a kontem do nauki, co mogłoby spowodować naliczanie dodatkowych opłat na koncie osobistym.
- Odpowiednia ilość czasu na ukończenie modułu – pamiętaj, że gdy rozpoczniesz, nie możesz go wstrzymać.
Uwaga: w tym module używaj tylko konta do nauki. Jeśli użyjesz innego konta Google Cloud, mogą na nim zostać naliczone opłaty.
Scenariusz
Zaczynasz pracę jako młodszy inżynier danych. Do tej pory Twoje zadania polegały na pomaganiu zespołom w tworzeniu zasobów Dataplex i zarządzaniu nimi.
Zakładamy, że dysponujesz umiejętnościami oraz wiedzą potrzebnymi do wykonania tych zadań.
Twoje wyzwanie
Do Twoich zadań należy pomoc nowemu zespołowi programistów w utworzeniu nowej siatki danych przy użyciu Dataplex. Precyzując, musisz utworzyć jezioro danych Dataplex z różnymi strefami i zasobami. Musisz także utworzyć typy aspektów i dodać aspekty do zasobów w nowym jeziorze oraz ocenić jakość danych. Poproszono Cię więc o:
- utworzenie jeziora danych Dataplex z 2 strefami i 2 zasobami;
- utworzenie typu aspektu dla danych chronionych i dodanie aspektu do strefy;
- przypisanie roli uprawnień Dataplex innemu użytkownikowi;
- utworzenie pliku specyfikacji jakości danych i przesłanie go do Cloud Storage;
- zdefiniowanie i uruchomienie zadania dotyczącego jakości danych w Dataplex.
Musisz uwzględnić te założenia:
- Potrzebne interfejsy API (takie jak Dataplex, Data Catalog i Dataproc) muszą być włączone.
- Wszystkie zasoby muszą zostać utworzone w regionie , chyba że instrukcje będą inne.
Każde zadanie zostało szczegółowo opisane poniżej. Powodzenia!
Zadanie 1. Utwórz jezioro danych Dataplex z 2 strefami i 2 zasobami
Uwaga: podczas wykonywania wszystkich zadań w tym module należy utworzyć zasoby w regionie , chyba że instrukcje będą inne.
Zasobnik Cloud Storage oraz zbiór danych BigQuery potrzebne do wykonania kroku 2 zostały już utworzone w tym module.
- Utwórz jezioro danych Dataplex o nazwie Sales Lake z 2 strefami regionalnymi:
- strefą nieprzetworzoną o nazwie Raw Customer Zone,
- strefą z wybranymi danymi o nazwie Curated Customer Zone.
- Do każdej strefy dołącz 1 gotowy zasób:
- Do strefy nieprzetworzonej dołącz zasobnik Cloud Storage o nazwie -customer-online-sessions jako nowy zasób z nazwą Customer Engagements.
- Do strefy z wybranymi danymi dołącz zbiór danych BigQuery o nazwie .customer_orders jako nowy zasób z nazwą Customer Orders.
Pomocna wskazówka dotycząca tworzenia jeziora danych Dataplex:
Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło.
Utworzenie jeziora danych Dataplex z 2 strefami i 2 zasobami
Zadanie 2. Utwórz typ aspektu i dodaj aspekt do strefy
- Utwórz typ aspektu o nazwie Protected Customer Data Aspect z 2 polami wyliczanymi:
- pierwszym z nazwą Raw Data Flag i 2 wartościami: Yes oraz No;
- drugim z nazwą Protected Contact Information Flag i 2 wartościami: Yes oraz No.
- Dodaj ten aspekt do Raw Customer Zone, używając wartości Yes dla obu flag.
Pomocna wskazówka dotycząca tworzenia i stosowania typów aspektów:
Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło.
Utworzenie typu aspektu i dodanie aspektu do strefy
Zadanie 3. Przypisz rolę uprawnień Dataplex innemu użytkownikowi
- Kierując się zasadą jak najmniejszych uprawnień, przypisz rolę uprawnień IAM użytkownikowi nr 2 (), dzięki czemu będzie on mógł przesyłać nowe pliki Cloud Storage do zasobu Dataplex o nazwie Customer Engagements.
Pomocna wskazówka dotycząca przypisywania ról uprawnień Dataplex:
Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło.
Przypisanie roli uprawnień Dataplex innemu użytkownikowi
Zadanie 4. Utwórz plik specyfikacji jakości danych i prześlij go do Cloud Storage
Zasobnik Cloud Storage potrzebny do wykonania kroku 2 został już utworzony w tym module.
- Utwórz plik specyfikacji jakości danych z nazwą dq-customer-orders.yaml i następującymi ustawieniami:
- reguła NOT NULL jest stosowana (z progiem 100%) do kolumny user_id w tabeli customer_orders.ordered_items;
- reguła NOT NULL jest stosowana (z progiem 100%) do kolumny order_id w tabeli customer_orders.ordered_items;
- Tabela docelowa wyników w BigQuery: .orders_dq_dataset.results.
- Prześlij plik do zasobnika Cloud Storage o nazwie -dq-config.
Pomocna wskazówka dotycząca tworzenia plików specyfikacji jakości danych:
Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło.
Utworzenie i przesłanie pliku specyfikacji jakości danych
Zadanie 5. Definiowanie i uruchamianie automatycznego zadania dotyczącego jakości danych w Dataplex
Zbiór danych BigQuery potrzebny do wykonania kroku 1 został już utworzony w tym module.
- Zdefiniuj zadanie dotyczące jakości danych przy pomocy pliku dq-customer-orders.yaml z następującymi właściwościami:
Właściwość |
Wartość |
Nazwa zadania dotyczącego jakości danych |
Zadanie dotyczące jakości danych o zamówieniach klientów |
Dane źródłowe |
.customer_orders.ordered_items |
Konto usługi użytkownika |
Domyślne konto usługi Compute Engine |
- Uruchom zadanie dotyczące jakości danych od razu.
Wykonanie zadania może zająć kilka minut. Aby sprawdzić, czy zadanie zostało wykonane, być może musisz odświeżyć stronę.
Pomocna wskazówka dotycząca definiowania i uruchamiania zadań dotyczących jakości danych:
Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło.
Zdefiniowanie i uruchomienie zadania dotyczącego jakości danych w Dataplex
Gratulacje!
Udało Ci się zbudować siatkę danych przez utworzenie jeziora danych Dataplex z różnymi strefami i zasobami, utworzenie typów aspektów i dodanie aspektów do zasobów oraz ocenienie jakości danych.

Zdobądź kolejną odznakę umiejętności
Ten moduł do samodzielnego ukończenia jest częścią kursu Tworzenie siatki danych przy użyciu Dataplex, które pozwala zdobyć odznakę umiejętności. Za ukończenie kursu otrzymujesz widoczną powyżej odznakę – stanowi ona potwierdzenie Twojego osiągnięcia. Pochwal się nią w swoim CV i mediach społecznościowych, oznaczając swoje osiągnięcie hashtagiem #GoogleCloudBadge.
Ta odznaka umiejętności jest częścią ścieżki szkoleniowej Inżynier danych w Google Cloud. Jeśli udało Ci się już ukończyć pozostałe kursy z odznakami umiejętności dostępne w tej ścieżce szkoleniowej, przejrzyj katalog, w którym czekają na Ciebie inne takie kursy.
Szkolenia i certyfikaty Google Cloud
…pomogą Ci wykorzystać wszystkie możliwości technologii Google Cloud. Nasze zajęcia obejmują umiejętności techniczne oraz sprawdzone metody, które ułatwią Ci szybką naukę i umożliwią jej kontynuację. Oferujemy szkolenia na poziomach od podstawowego po zaawansowany prowadzone w trybach wirtualnym, na żądanie i na żywo, dzięki czemu możesz dopasować program szkoleń do swojego napiętego harmonogramu. Certyfikaty umożliwią udokumentowanie i potwierdzenie Twoich umiejętności oraz doświadczenia w zakresie technologii Google Cloud.
Ostatnia aktualizacja instrukcji: 4 września 2025 r.
Ostatni test modułu: 4 września 2025 r.
Copyright 2025 Google LLC. Wszelkie prawa zastrzeżone. Google i logo Google są znakami towarowymi Google LLC. Wszelkie inne nazwy firm i produktów mogą być znakami towarowymi odpowiednich podmiotów, z którymi są powiązane.