Get access to 700+ labs and courses

Vertex AI: прогноз кредитного ризику за допомогою інструментів AutoML

Lab 1 година universal_currency_alt 5 кредитів show_chart Початковий

info This lab may incorporate AI tools to support your learning.

Огляд
Налаштування
Знайомство з Vertex AI
Завдання 1. Підготуйте тренувальні дані
Завдання 2. Навчіть свою модель
Завдання 3. Оцініть ефективність моделі (лише для демонстрації)
Завдання 4. Розгорніть модель (лише для демонстрації)
Завдання 5. Отримайте прогнози
Вітаємо!
Завершіть завдання

Get access to 700+ labs and courses

Огляд

Під час цього практичного заняття ви використовуватимете Vertex AI для тренування й обслуговування моделі машинного навчання, щоб спрогнозувати кредитний ризик на основі табличного набору даних.

Цілі

Ви навчитеся виконувати такі дії:

завантажувати набір даних у Vertex AI;
тренувати модель машинного навчання за допомогою інструментів AutoML;
оцінювати ефективність моделі;
розгортати модель у кінцевій точці;
отримувати прогнози.

Налаштування

Перш ніж натиснути кнопку "Почати заняття"

Примітка. Ознайомтеся з наведеними нижче вказівками.

На виконання практичного заняття відводиться обмежений час, і його не можна призупинити. Щойно ви натиснете Почати заняття, з’явиться таймер, який показуватиме, скільки часу для роботи з ресурсами Google Cloud у вас залишилося.

Платформа Qwiklabs дає змогу виконувати це практичне заняття в дійсному робочому хмарному середовищі (не в симуляції чи демонстраційному середовищі). Для цього на час практичного заняття вам надаються тимчасові облікові дані для реєстрації і входу в Google Cloud.

Обов’язкові умови

Для цього практичного заняття потрібно мати:

стандартний вебпереглядач, наприклад Chrome (рекомендовано);
достатню кількість часу.

Примітка. Якщо ви маєте обліковий запис або проєкт Google Cloud, не використовуйте їх для доступу до цього практичного заняття.

Примітка. Якщо ви використовуєте Pixelbook, відкрийте практичне заняття в новому анонімному вікні.

Як почати виконувати завдання й увійти в Console

Натисніть кнопку Start Lab (Почати практичну роботу). Якщо за практичну роботу необхідно заплатити, відкриється спливаюче вікно, де ви зможете обрати спосіб оплати. На панелі ліворуч ви побачите тимчасові облікові дані, які потрібно використовувати для доступу до цієї практичної роботи.
Скопіюйте ім’я користувача, а потім натисніть Open Google Console (Відкрити Google Console). Завантажаться необхідні ресурси. Потім відкриється нова вкладка зі сторінкою Choose an account (Виберіть обліковий запис).
Примітка. Відкривайте вкладки в окремих вікнах, розміщуючи їх поруч.
На сторінці Choose an account (Виберіть обліковий запис) натисніть Use Another Account (Інший обліковий запис). Відкриється сторінка входу в обліковий запис.
Вставте ім’я користувача, скопійоване з панелі Connection Details (Відомості про підключення). Потім скопіюйте й вставте пароль.

Примітка. Обов’язково використовуйте облікові дані з панелі Connection Details (Відомості про підключення). Не використовуйте облікові дані Google Cloud Skills Boost. Якщо у вас є власний обліковий запис Google Cloud, не використовуйте його для доступу до цієї практичної роботи (інакше з вас може бути стягнуто плату).

Виконайте наведені нижче дії.

Прийміть Умови використання.
Не додавайте способи відновлення й двохетапну перевірку (оскільки це тимчасовий обліковий запис).
Не реєструйте безкоштовні пробні версії.

Через кілька секунд Cloud Console відкриється в новій вкладці.

Примітка. Ви можете переглянути меню зі списком продуктів і сервісів Google Cloud, натиснувши меню навігації вгорі ліворуч. Меню Cloud Console

Знайомство з Vertex AI

У цьому практичному занятті використовується Vertex AI – уніфікована платформа штучного інтелекту в Google Cloud, на якій можна тренувати й розгортати модель машинного навчання. З Vertex AI можна створити модель машинного навчання на одній платформі двома способами: за допомогою інструментів AutoML без кодування й шляхом Спеціального навчання на основі коду через Vertex Workbench. Під час цього практичного заняття ви використовуватимете інструменти AutoML.

Ви розробите модель машинного навчання, щоб визначити, чи виплатить певний клієнт кредит.

Завдання 1. Підготуйте тренувальні дані

Спочатку на інформаційній панелі Vertex AI відображаються основні етапи тренування й розгортання моделі машинного навчання: підготовка тренувальних даних, навчання моделі й отримання прогнозів. Пізніше на ній показуватимуться ваші останні дії, зокрема нещодавні набори даних, моделі, прогнози, кінцеві точки й екземпляри блокнотів.

Створіть набір даних

У консолі Google Cloud у меню навігації натисніть Vertex AI > Datasets (Vertex AI > Набори даних).
Натисніть Create dataset (Створити набір даних).
Назвіть набір даних LoanRisk.
Для типу даних і цілі натисніть Tabular (Таблиця) та виберіть Regression/classification (Регресія/класифікація).
Натисніть Create (Створити).

Завантажте дані

Нижче наведено три способи імпортувати дані у Vertex AI:

завантажити файли CSV з вашого комп’ютера;
вибрати файли CSV з Cloud Storage;
вибрати таблицю або інші дані з BigQuery.

Набір даних уже завантажено в Cloud Storage для зручності.

Для джерела даних укажіть Select CSV files from Cloud Storage (Вибрати файли CSV з Cloud Storage).
У полі Import file path (Шлях до файлу імпорту) введіть цю команду:

spls/cbl455/loan_risk.csv

Натисніть Continue (Продовжити).

Примітка. Є ще один спосіб налаштувати сторінку: натисніть Datasets (Набори даних) у меню ліворуч і виберіть назву набору даних на сторінці Datasets (Набори даних).

(Необов’язково) Згенеруйте статистику

Щоб переглянути описову статистику для кожного стовпця набору даних, натисніть Generate statistics (Генерувати статистику).
Процес може тривати кілька хвилин, особливо якщо ви робите це вперше.
Коли статистика буде готова, можна переглянути аналітичні діаграми. Для цього потрібно натиснути назву стовпця.

Завдання 2. Навчіть свою модель

Ви завантажили набір даних і можете натренувати модель, щоб спрогнозувати, чи виплатить клієнт кредит.

Натисніть Train new model (Навчити нову модель) і виберіть Other (Інше).

Метод навчання

Набір даних уже має назву LoanRisk.
У полі Objective (Ціль) виберіть Classification (Класифікація).

Слід вибрати саме класифікацію, а не регресію, оскільки ви прогнозуєте не безперервну змінну, а конкретну цифру (чи відбудеться невиплата: 0 – ні, клієнт виплатить кредит; 1 – так, буде невиплата).

Натисніть Continue (Продовжити).

Інформація про модель

Укажіть назву моделі й цільовий стовпець.

Дайте моделі назву, наприклад LoanRisk.
У полі Target column (Цільовий стовпець) виберіть Default (Невиплата).
(Необов’язково) Відкрийте меню Advanced options (Додаткові параметри), щоб розподілити дані для навчання й тестування та вказати шифрування.
Натисніть Continue (Продовжити).
Щоб додати ознаки, натисніть Continue (Продовжити).

Способи навчання

Укажіть стовпці, які використовуватимуться для навчання моделі. Наприклад, для прогнозування кредитного ризику не потрібен стовпець ClientID.

Натисніть значок мінуса в рядку ClientID, щоб вилучити його з моделі.
(Необов’язково) У меню Advanced options (Додаткові параметри) можна вибрати інші цілі оптимізації.
Докладнішу інформацію про цілі оптимізації для моделей AutoML із табличними даними наведено на цій сторінці.
Натисніть Continue (Продовжити).

Обчислення й ціни

У полі Budget (Бюджет), де вказується час роботи вузла в годинах, введіть 1.
На початку навчання моделі AutoML цього часу зазвичай достатньо, щоб зрозуміти, чи існує зв’язок між вибраними ознаками й міткою. Пізніше можна буде змінити ознаки й довше навчати модель, щоб підвищити її ефективність.
Не вимикайте дострокову зупинку.
Натисніть Start training (Почати навчання).

Залежно від вибраного методу й обсягу даних навчання може тривати від кількох хвилин до кількох годин. Як правило, після завершення навчання користувач отримує електронний лист від Google Cloud, проте в середовищі Qwiklabs листи не надсилаються.

Примітка. Щоб не чекати, доки модель навчається, завантажте попередньо навчену модель у завданні 5. Вона є результатом виконання завдань 1 і 2. Завдання 3 й 4 – демонстраційні, і вони застосовуються, лише якщо ви самостійно навчили модель.

Завдання 3. Оцініть ефективність моделі (лише для демонстрації)

У Vertex AI є багато показників для аналізу ефективності моделі. Ви працюватимете з трьома, які наведено нижче.

Precision/Recall curve (Крива точності/повноти)
Confusion Matrix (Матриця помилок)
Feature Importance (Важливість ознак)

Примітка. Навчені моделі можна знайти на вкладці Model Registry у Vertex AI.

1. Перейдіть на вкладку Model Registry.

2. Натисніть модель, яку ви щойно навчили.

3. Перегляньте вкладку Evaluate (Оцінювання).

Зараз цей крок можна пропустити, оскільки під час цього практичного заняття використовується попередньо навчена модель.

Крива точності/повноти

Повзунок порогу достовірності, установлений на значенні 0,5; графіки для кривої точності/повноти, кривої ROC й кривої точності-повноти за пороговим значенням

Поріг достовірності визначає, як модель машинного навчання рахує позитивні випадки. Що вищий поріг, то більша точність і менша повнота. Що нижчий поріг, то менша точність і більша повнота.

Поріг можна налаштувати вручну, щоб побачити, як він впливає на точність і повноту. Це допоможе збалансувати ці показники з урахуванням потреб вашої компанії.

Матриця помилок

За матрицею помилок можна визначити відсоток прикладів кожного класу в тестовому наборі, які модель спрогнозувала правильно.

Таблиця матриці помилок, у якій наведено класифікації справжніх і прогнозованих міток

Матриця помилок показує, що ваша початкова модель може правильно спрогнозувати 100% прикладів виплати й 87% прикладів невиплати в тестовому наборі. Це непоганий результат.

Щоб підвищити цей показник, можна додати більше прикладів (даних), сконструювати нові ознаки, змінити метод навчання тощо.

Важливість ознак

Важливість ознак відображається в гістограмі Vertex AI, що ілюструє, як кожна ознака впливає на прогноз. Що довша смуга й що більше числове значення, пов’язане з ознакою, то важливіша ознака.

Гістограма важливості ознак "кредит", "дохід" і "вік"

За такими значеннями важливості ознак можна покращити модель і отримувати точніші прогнози. Наступного разу під час навчання можна вилучити найменш важливі ознаки або поєднати дві найважливіші, щоб перевірити, чи вплине це на ефективність моделі.

Важливість ознак – лише одна із численних функцій набору інструментів і фреймворків Vertex AI для машинного навчання під назвою Explainable AI. Explainable AI допомагає зрозуміти прогнози моделей машинного навчання.

Завдання 4. Розгорніть модель (лише для демонстрації)

Примітка. Ви не розгортатимете модель у кінцевій точці, оскільки її навчання може тривати годину. У цьому розділі наведено кроки, які потрібно виконувати в робочому середовищі.

Коли модель навчена, потрібно створити кінцеву точку у Vertex. З ресурсом моделі у Vertex можна зв’язати кілька кінцевих точок, розподіливши між ними трафік.

Створіть і визначте кінцеву точку

На сторінці моделі натисніть Deploy & test (Розгорнути й тестувати), а потім – Deploy to Endpoint (Розгорнути в кінцевій точці).
У полі Endpoint name (Назва кінцевої точки) введіть значення LoanRisk.
Натисніть Continue (Продовжити).

Налаштування й відстеження моделі

Не змінюйте налаштування розподілу трафіку.
У спадному меню Machine type (Тип машини) виберіть e2-standard-8, 8 vCPUs, 32 GiB memory (e2-standard-8, 8 віртуальних центральних процесорів, 32 ГіБ пам’яті).
У розділі Explainability Options (Параметри пояснюваності) натисніть Feature attribution (Атрибуція ознак).
Натисніть Done (Готово).
Натисніть Continue (Продовжити).
У розділі Model monitoring (Відстеження моделі) натисніть Continue (Продовжити).
У розділі Model objectives > Training data source (Цілі моделі > Джерело даних для навчання) виберіть Vertex AI dataset (Набір даних Vertex AI).
Виберіть свій набір даних зі спадного меню.
У полі Target column (Цільовий стовпець) введіть значення Default (Невиплата).
Залиште інші налаштування без змін і натисніть Deploy (Розгорнути).

Розгортання кінцевої точки триватиме кілька хвилин. Потім біля назви з’явиться зелений прапорець.

Час отримувати прогнози за допомогою розгорнутої моделі.

Завдання 5. Отримайте прогнози

У цьому розділі ви працюватимете з наявною навченою моделлю за допомогою сервісу AutoML-Gateway.

ЗМІННА СЕРЕДОВИЩА	ЗНАЧЕННЯ
Credit_Risk ENDPOINT	1411183591831896064
INPUT_DATA_FILE	INPUT-JSON

Щоб використовувати навчену модель, потрібно створити кілька змінних середовища.

Відкрийте вікно Cloud Shell.
Завантажте об’єкти практичного заняття:

gcloud storage cp gs://cloud-training/CBL455/INPUT-JSON .

Створіть змінну середовища INPUT_DATA_FILE:

export INPUT_DATA_FILE="INPUT-JSON"

Створіть змінну середовища PROJECT_NUMBER:

export PROJECT_NUMBER=$(gcloud projects describe $(gcloud config get-value project) --format="value(projectNumber)")

Створіть змінну середовища AUTOML_SERVICE:

export AUTOML_SERVICE="https://automl-proxy-$PROJECT_NUMBER.us-central1.run.app/v1"

Примітка. Коли об’єкти практичного заняття буде розархівовано, перегляньте їх вміст.

Vertex AI отримує потрібні дані моделі з файлу INPUT-JSON. Змініть цей файл, щоб згенерувати власні прогнози.

Файл INPUT-JSON містить наведені нижче значення.

{ "instances": [ { "age": 40.77430558, "ClientID": "997", "income": 44964.0106, "loan": 3944.219318 } ] }

Введіть наведену нижче команду, щоб отримати прогноз.

curl -X POST -H "Content-Type: application/json" $AUTOML_SERVICE -d "@${INPUT_DATA_FILE}" -s | jq

Очікуваний вивід:

{ "predictions": [ { "scores": [ 0.9999980926513672, 0.000001897001311590429 ], "classes": [ "0", "1" ] } ], "deployedModelId": "3093594712003575808", "model": "projects/1030115194620/locations/us-central1/models/4831874217005809664", "modelDisplayName": "credit_risk_20211119212817", "modelVersionId": "1" }

На зображенні нижче показано, як виконати ті самі дії в Google Cloud Console.

Кроки прогнозування виділено у відповідних розділах

Вітаємо!

Тепер ви можете використовувати Vertex AI, щоб виконувати такі дії:

завантажувати набір даних;
навчати модель за допомогою інструментів AutoML;
оцінювати ефективність моделі;
розгортати модель, навчену за допомогою інструментів AutoML, у кінцевій точці;
отримувати прогнози.

Щоб дізнатися більше про різні частини Vertex AI, перегляньте цю документацію.

Завершіть завдання

Закінчивши виконувати завдання, натисніть кнопку End Lab (Завершити завдання). Google Cloud Skills Boost вилучить використані ресурси й очистить обліковий запис.

Ви зможете оцінити, наскільки вам сподобалося виконувати завдання на платформі. Виберіть потрібну кількість зірочок, введіть коментар і натисніть Submit (Надіслати).

Кількість зірочок відповідає певній оцінці:

1 зірочка = зовсім не сподобалося
2 зірочки = не сподобалося
3 зірочки = не можу сказати напевно
4 зірочки = сподобалося
5 зірочок = дуже сподобалося

Якщо ви не хочете надсилати відгук, просто закрийте діалогове вікно.

Залишайте свої відгуки, пропозиції або коментарі на вкладці Support (Підтримка).

© Google LLC 2022. Усі права захищено. Назва та логотип Google є торговельними марками Google LLC. Усі інші назви компаній і продуктів можуть бути торговельними марками відповідних компаній, з якими вони пов’язані.

Vertex AI: прогноз кредитного ризику за допомогою інструментів AutoML

Vertex AI: прогноз кредитного ризику за допомогою інструментів AutoML

Огляд

Цілі

Налаштування

Перш ніж натиснути кнопку "Почати заняття"

Обов’язкові умови

Як почати виконувати завдання й увійти в Console

Знайомство з Vertex AI

Завдання 1. Підготуйте тренувальні дані

Створіть набір даних

Завантажте дані

(Необов’язково) Згенеруйте статистику

Завдання 2. Навчіть свою модель

Метод навчання

Інформація про модель

Способи навчання

Обчислення й ціни

Завдання 3. Оцініть ефективність моделі (лише для демонстрації)

Крива точності/повноти

Матриця помилок

Важливість ознак

Завдання 4. Розгорніть модель (лише для демонстрації)

Створіть і визначте кінцеву точку

Налаштування й відстеження моделі

Завдання 5. Отримайте прогнози

Вітаємо!

Завершіть завдання

Before you begin

Use private browsing

Sign in to the Console

Use private browsing to run the lab