
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
За умовами цього практичного завдання ви є власником автопарку в Нью-Йорку й хочете відстежувати ефективність свого бізнесу в реальному часі. Ви створите конвеєр потокової обробки даних, щоб збирати інформацію про дохід автопарку, кількість пасажирів, статус поїздок тощо, а потім візуалізувати отримані результати на інформаційній панелі керування.
Виконуючи це практичне завдання, ви навчитеся:
Для кожного практичного заняття ви безкоштовно отримуєте новий проект Google Cloud і набір ресурсів на визначений період часу.
Натисніть кнопку Почати заняття. Якщо за практичне заняття необхідно заплатити, відкриється спливаюче вікно, де ви зможете обрати спосіб оплати. Ліворуч розміщено панель Відомості про практичне заняття з такими компонентами:
Натисніть Відкрити консоль Google або натисніть правою кнопкою миші й виберіть Відкрити анонімне вікно, якщо ви використовуєте вебпереглядач Chrome.
Завантажаться необхідні ресурси. Потім відкриється нова вкладка зі сторінкою Вхід.
Порада. Упорядковуйте вкладки в окремих вікнах, розміщуючи їх поруч.
За потреби скопіюйте значення в полі Username (Ім’я користувача) нижче й вставте його у вікні Вхід.
Поле Username (Ім’я користувача) також можна знайти на панелі Відомості про практичне заняття.
Натисніть Next (Далі).
Скопіюйте значення в полі Password (Пароль) нижче й вставте його у вікні Welcome (Привітання).
Поле Password (Пароль) також можна знайти на панелі Відомості про практичне заняття.
Натисніть Next (Далі).
Що від вас очікується
Через кілька секунд Google Cloud Console відкриється в новій вкладці.
Google Cloud Shell – це віртуальна машина з попередньо завантаженими інструментами для розробників. Вона містить головний каталог обсягом 5 ГБ постійної пам’яті й працює в середовищі Google Cloud.
Google Cloud Shell надає доступ до ресурсів Google Cloud через командний рядок.
У консолі Cloud Console на панелі інструментів угорі праворуч натисніть кнопку Open Cloud Shell (Відкрити Cloud Shell).
Натисніть Continue (Продовжити).
Налаштування та підключення до середовища триватиме кілька секунд. Щойно ви підключитеся, вас буде автентифіковано, а проект отримає ваш PROJECT_ID (ІДЕНТИФІКАТОР ПРОЕКТУ). Наприклад:
gcloud – це інструмент командного рядка для Google Cloud. Він входить у пакет Cloud Shell і підтримує функцію автозавершення клавішею TAB.
Вихідні дані:
Приклад вихідних даних:
Вихідні дані:
Приклад вихідних даних:
У цьому завданні ви створюєте набір даних taxirides
. Це можна зробити за допомогою Google Cloud Shell або Google Cloud Console.
На цьому практичному занятті ви використовуватимете відкритий набір даних від Комісії водіїв таксі й лімузинів Нью-Йорка (NYC Taxi & Limousine Commission). Щоб імітувати періодичне оновлення інформації про водіїв таксі, застосовуватиметься невеликий файл даних зі значеннями, розділеними комами.
BigQuery – це безсерверне сховище даних. Таблиці в BigQuery впорядковуються за наборами даних. На цьому практичному занятті дані про водіїв таксі надходитимуть з окремого файлу через Dataflow і зберігатимуться в BigQuery. Завдяки цій конфігурації всі нові файли даних, які розміщуються у вихідний сегмент Cloud Storage, автоматично опрацьовуватимуться для завантаження.
Щоб створити набір даних BigQuery, виберіть один із наведених нижче способів.
taxirides
.taxirides.realtime
(порожню схему, у яку ви пізніше передаватимете дані):У меню навігації () Google Cloud Console натисніть BigQuery.
Якщо з’явиться вікно привітання, натисніть Done (Готово).
Натисніть View actions (Переглянути дії) () біля ідентифікатора проекту, а потім – Create dataset (Створити набір даних).
У полі Dataset ID (Ідентифікатор набору даних) введіть taxirides.
У полі Data location (Місцезнаходження даних) виберіть:
Потім натисніть Create Dataset (Створити набір даних).
На панелі Explorer (Провідник) натисніть Expand node (Розгорнути вузол) (), щоб відобразити новий набір даних taxirides.
Натисніть View actions (Переглянути дії) () біля набору даних taxirides і виберіть Open (Відкрити).
Натисніть Create Table (Створити таблицю).
У полі Table (Таблиця) введіть realtime.
У розділі схеми натисніть Edit as text (Редагувати як текст) і вставте наведений нижче код.
У розділі Partition and cluster settings (Розділення й кластеризація) виберіть timestamp.
Натисніть Create Table (Створити таблицю).
У цьому завданні ви маєте перенести обов’язкові файли у свій проект.
З Cloud Storage можна зберігати будь-які обсяги даних і завантажувати їх коли завгодно в будь-якому куточку світу. Cloud Storage може мати різне призначення, зокрема обслуговування контенту вебсайтів, зберігання даних для архівування й аварійного відновлення, а також надання кінцевим користувачам великих об’єктів даних через функцію прямого завантаження.
Сегмент Cloud Storage було створено для вас на етапі запуску практичного завдання.
У цьому завданні вам потрібно налаштувати конвеєр потокової обробки даних, щоб зчитувати дані файлів із сегмента Cloud Storage і записувати дані в BigQuery.
Dataflow – це безсерверний інструмент аналізу даних.
У меню навігації () Cloud Console натисніть View all Products (Переглянути всі продукти) > Analytics (Аналітика) > Dataflow.
На верхній панелі меню натисніть Create Job From Template (Створити завдання на основі шаблону).
У полі Job name (Назва завдання) завдання Dataflow введіть streaming-taxi-pipeline.
У полі Regional endpoint (Регіональна кінцева точка) виберіть:
Натисніть Required Parameters (Необхідні параметри).
У полі Temporary location (Тимчасове розташування) для записування тимчасових файлів вставте або введіть:
У полі Max workers (Макс. кількість робочих вузлів) введіть 2.
У полі Number of workers (Кількість робочих вузлів) введіть 1.
Зніміть прапорець Use default machine type (Використовувати тип машини за умовчанням).
У розділі General purpose (Загальна ціль) виберіть наведені нижче налаштування.
Серія: E2
Тип машини: e2-medium (з 2 віртуальними центральними процесорами й 4 ГБ пам’яті)
Потокове передавання почалося. Тепер можна переглянути візуальне представлення конвеєра даних. До початку передачі даних у BigQuery може минути від 3 до 5 хвилин.
У цьому завданні ви аналізуєте дані в процесі потокового передавання.
У меню навігації () Cloud Console натисніть BigQuery.
Якщо з’явиться вікно привітання, натисніть Done (Готово).
У редакторі запитів введіть наведену нижче команду й натисніть Run (Виконати).
Ваш результат має виглядати приблизно так:
У цьому завданні ви обчислюєте зведені дані потоку для звітів.
У редакторі запитів очистьте поточний запит.
Скопіюйте й вставте наведений нижче запит і натисніть Run (Виконати).
У результаті ви отримаєте основні показники щодо висадки з таксі у хвилинах.
Натисніть Save (Зберегти) > Save query (Зберегти запит).
У полі Name (Назва) вікна Save query (Зберегти запит) введіть My Saved Query (Мій збережений запит).
Переконайтеся, що регіон у полі Region (Регіон) відповідає регіону Qwiklabs Lab.
Натисніть Зберегти.
На цьому етапі вам потрібно зупинити завдання Dataflow, щоб вивільнити ресурси для свого проекту.
У меню навігації () Cloud Console натисніть View all Products (Переглянути всі продукти) > Analytics (Аналітика) > Dataflow.
Натисніть streaming-taxi-pipeline або назву нового завдання.
Натисніть Stop (Зупинити) і виберіть Cancel (Скасувати) > Stop Job (Зупинити завдання).
У цьому завданні ви створюєте інформаційну панель, яка працює в реальному часі, щоб візуалізувати дані.
У меню навігації () Cloud Console натисніть BigQuery.
На панелі Explorer (Провідник) розгорніть меню з ідентифікатором проекту.
Розгорніть меню Queries (Запити) і натисніть My Saved Query (Мій збережений запит).
Запит завантажиться в редакторі.
Натисніть Run (Виконати).
У розділі Query Results (Результати запиту) натисніть Open in (Відкрити в) > Looker Studio.
Відкриється Looker Studio. Натисніть Get started (Почати).
У вікні Looker Studio натисніть гістограму.
()
З’явиться панель діаграми.
Натисніть Add a chart (Додати діаграму) і виберіть Combo chart (Комбінована діаграма).
На панелі Setup (Налаштування) у розділі Data Range Dimension (Параметр діапазону дат) наведіть курсор на опцію minute (Date) і натисніть X, щоб вилучити її.
На панелі Data (Дані) натисніть параметр dashboard_sort і перетягніть його: Setup (Налаштування) > Data Range Dimension (Параметр діапазону дат) > Add dimension (Додати параметр).
У розділі Setup (Налаштування) > Dimension (Параметр) натисніть minute і виберіть dashboard_sort.
У розділі Setup (Налаштування) > Metric (Показник) натисніть dashboard_sort і виберіть total_rides.
У розділі Setup (Налаштування) > Metric (Показник) натисніть Record Count (Підрахунок записів) і виберіть total_passengers.
У розділі Setup (Налаштування) > Metric (Показник) натисніть Add metric (Додати показник) і виберіть total_revenue.
У розділі Setup (Налаштування) > Sort (Сортування) натисніть total_rides і виберіть dashboard_sort.
У розділі Setup (Налаштування) > Sort (Сортування) натисніть Ascending (У порядку зростання).
Ваша діаграма має виглядати приблизно так:
Завершивши налаштування інформаційної панелі, натисніть Save and share (Зберегти й поділитися), щоб зберегти це джерело даних.
Якщо з’явиться запит завершити створення облікового запису, введіть відомості про вашу країну й компанію, прийміть Умови використання й натисніть Continue (Продовжити).
Якщо з’явиться запит щодо типу оновлень, які ви б хотіли отримувати, укажіть no (ні) для всіх пропозицій, а потім натисніть Continue (Продовжити).
Якщо з’явиться вікно Review data access before saving (Перевірка інформації про доступ до даних перед збереженням), натисніть Acknowledge and save (Підтвердити й зберегти).
Якщо з’явиться запит вибрати обліковий запис, виберіть свій обліковий запис студента.
Інформаційна панель завжди міститиме дані про останні транзакції. Щоб перевірити, натисніть More options (Інші опції) (), а потім – Refresh data (Оновити дані).
У цьому завданні ви створюєте часову діаграму.
Натисніть це посилання Looker Studio, щоб відкрити Looker Studio в новій вкладці вебпереглядача.
У розділі Start with a Template (Використати шаблон) на сторінці Reports (Звіти) натисніть шаблон [+] Blank Report (Пустий звіт).
Відкриється новий пустий звіт із вікном Add data to report (Додайте дані у звіт).
У списку Google Connectors (Конектори Google) виберіть BigQuery.
Натисніть Custom Query (Спеціальний запит) і виберіть ідентифікатор свого проекту. Запит відображатиметься в такому форматі: qwiklabs-gcp-xxxxxxx.
У полі Enter Custom Query (Введіть власний запит) вставте наведену нижче команду.
Натисніть Add (Додати) > Add To Report (Додати у звіт).
З’явиться новий звіт без назви. Зміни відобразяться на екрані протягом хвилини.
На панелі Data (Дані) натисніть Add a Field (Додати поле) > Add calculated field (Додати обчислюване поле).
У лівому куті натисніть All Fields (Усі поля).
Змініть тип поля timestamp (позначка часу) на такий: Date & Time (Дата й час) > Date Hour Minute (YYYYMMDDhhmm) (Дата, години й хвилини).
У вікні, що з’явиться, натисніть Continue (Продовжити), а потім – Done (Готово).
У меню вгорі натисніть Add a chart (Додати діаграму).
Виберіть Time series chart (Часова діаграма).
Розмістіть діаграму в нижньому лівому куті на порожньому місці.
У розділі Setup (Налаштування) > Dimension (Параметр) натисніть timestamp (Date) і виберіть timestamp.
У розділі Setup (Налаштування) > Dimension (Параметр) натисніть timestamp і виберіть calendar.
У полі Data Type (Тип даних) виберіть Date & Time (Дата й час) > Date Hour Minute (Дата, години й хвилини).
Закрийте вікно, натиснувши за його межами. Назву вказувати не потрібно.
У розділі Setup (Налаштування) > Metric (Показник) натисніть Record Count (Підрахунок записів) і виберіть meter_reading.
Під час цього практичного завдання ви використовували Dataflow, щоб передати дані через конвеєр у BigQuery.
Закінчивши виконувати завдання, натисніть кнопку End Lab (Завершити завдання). Google Cloud Skills Boost вилучить використані ресурси й очистить обліковий запис.
Ви зможете оцінити, наскільки вам сподобалося виконувати завдання на платформі. Виберіть потрібну кількість зірочок, введіть коментар і натисніть Submit (Надіслати).
Кількість зірочок відповідає певній оцінці:
Якщо ви не хочете надсилати відгук, просто закрийте діалогове вікно.
Залишайте свої відгуки, пропозиції або коментарі на вкладці Support (Підтримка).
© Google LLC 2024. Усі права захищено. Назва й логотип Google є торговельними марками Google LLC. Усі інші назви компаній і продуктів можуть бути торговельними марками відповідних компаній, з якими вони пов’язані.
This content is not currently available
We will notify you via email when it becomes available
Great!
We will contact you via email if it becomes available
One lab at a time
Confirm to end all existing labs and start this one