L'objectif de cet atelier est de montrer aux participants comment instancier un notebook Jupyter exécuté sur le service Vertex AI de Google Cloud. Pour faciliter la démonstration, nous utiliserons un ensemble de données contenant différentes heures de départ et d'arrivée de vols.
Objectifs
Dans cet atelier, vous apprendrez à effectuer les tâches suivantes :
Instancier un notebook Jupyter sur Vertex AI
Exécuter une requête BigQuery à partir d'un notebook Jupyter et traiter les résultats à l'aide de Pandas
Préparation
Pour chaque atelier, nous vous attribuons un nouveau projet Google Cloud et un nouvel ensemble de ressources pour une durée déterminée, sans frais.
Connectez-vous à Qwiklabs dans une fenêtre de navigation privée.
Vérifiez le temps imparti pour l'atelier (par exemple : 01:15:00) : vous devez pouvoir le terminer dans ce délai.
Une fois l'atelier lancé, vous ne pouvez pas le mettre en pause. Si nécessaire, vous pourrez le redémarrer, mais vous devrez tout reprendre depuis le début.
Lorsque vous êtes prêt, cliquez sur Démarrer l'atelier.
Notez vos identifiants pour l'atelier (Nom d'utilisateur et Mot de passe). Ils vous serviront à vous connecter à Google Cloud Console.
Cliquez sur Ouvrir la console Google.
Cliquez sur Utiliser un autre compte, puis copiez-collez les identifiants de cet atelier lorsque vous y êtes invité.
Si vous utilisez d'autres identifiants, des messages d'erreur s'afficheront ou des frais seront appliqués.
Acceptez les conditions d'utilisation et ignorez la page concernant les ressources de récupération des données.
Ouvrir la console BigQuery
Dans Google Cloud Console, sélectionnez le menu de navigation > BigQuery. Le message Welcome to BigQuery in the Cloud Console (Bienvenue sur BigQuery dans Cloud Console) s'affiche. Il contient un lien vers le guide de démarrage rapide et répertorie les mises à jour de l'interface utilisateur.
Cliquez sur Done (OK).
Tâche 1 : Lancer une instance Vertex AI Workbench
Dans le menu de navigation () de la console Google Cloud, sélectionnez Vertex AI.
Cliquez sur Activer toutes les API recommandées.
Dans le menu de navigation, cliquez sur Workbench.
En haut de la page "Workbench", vérifiez que vous vous trouvez dans la vue Instances.
Cliquez sur Créer.
Configurez l'instance :
Nom : lab-workbench
Région : définissez la région sur
Zone : définissez la zone sur
Options avancées (facultatif) : si nécessaire, cliquez sur "Options avancées" pour une personnalisation plus avancée (par exemple, type de machine, taille du disque).
Cliquez sur Créer.
La création de l'instance prend quelques minutes. Une coche verte apparaît à côté de son nom quand elle est prête.
Cliquez sur Ouvrir JupyterLab à côté du nom de l'instance pour lancer l'interface JupyterLab. Un nouvel onglet s'ouvre alors dans votre navigateur.
Cliquez sur l'icône Python 3 pour lancer un nouveau notebook Python.
Effectuez un clic droit sur le fichier Untitled.ipynb dans la barre de menu et sélectionnez Renommer le notebook pour lui attribuer un nom significatif.
Votre environnement est configuré. Vous êtes maintenant prêt à utiliser votre notebook Vertex AI Workbench.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Lancer une instance Vertex AI Workbench
Tâche 2 : Exécuter une requête BigQuery
Saisissez la requête suivante dans la première cellule du notebook :
%%bigquery df --use_rest_api
SELECT
depdelay as departure_delay,
COUNT(1) AS num_flights,
APPROX_QUANTILES(arrdelay, 10) AS arrival_delay_deciles
FROM
`cloud-training-demos.airline_ontime_data.flights`
WHERE
depdelay is not null
GROUP BY
depdelay
HAVING
num_flights > 100
ORDER BY
depdelay ASC
La commande utilise la fonction magique %%bigquery. Les fonctions magiques dans les notebooks fournissent un alias pour une commande du système. Dans ce cas, %%bigquery exécute la requête dans la cellule dans BigQuery et enregistre le résultat dans un objet DataFrame Pandas appelé df.
Pour exécuter la cellule, appuyez sur Maj+Entrée quand le curseur se trouve dedans. Vous pouvez également accéder à l'onglet Exécuter et cliquer sur Exécuter les cellules sélectionnées. Notez le raccourci clavier pour cette action si ce n'est pas Maj + Entrée. L'exécution de la commande ne devrait renvoyer aucun résultat.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Exécuter une requête BigQuery
Affichez les cinq premières lignes du résultat de la requête en exécutant le code suivant dans une nouvelle cellule :
df.head()
Tâche 3 : Créer un graphique avec Pandas
Nous allons utiliser le DataFrame Pandas qui contient le résultat de notre requête pour créer un graphique qui représente le lien entre les retards à l'arrivée et les retards au départ. Avant de poursuivre, si vous ne maîtrisez pas Pandas, nous vous conseillons de lire le Guide de démarrage. Cela ne vous prendra que 10 minutes.
Pour obtenir un DataFrame contenant les données dont nous avons besoin, nous devons d'abord manipuler le résultat brut de la requête. Saisissez le code suivant dans une nouvelle cellule pour convertir la liste arrival_delay_deciles en un objet Pandas Series.
Le code renomme également les colonnes générées.
import pandas as pd
percentiles = df['arrival_delay_deciles'].apply(pd.Series)
percentiles.rename(columns = lambda x : '{0}%'.format(x*10), inplace=True)
percentiles.head()
Pour faire le rapprochement entre les retards de départ et les retards d'arrivée, nous devons concaténer notre table percentiles au champ departure_delay dans notre DataFrame d'origine. Exécutez le code suivant dans une nouvelle cellule :
Avant de créer un graphique à partir du contenu du DataFrame, retirez les valeurs extrêmes enregistrées dans les champs 0% et 100%. Exécutez le code suivant dans une nouvelle cellule :
Une fois l'atelier terminé, cliquez sur End Lab (Terminer l'atelier). Qwiklabs supprime les ressources que vous avez utilisées, puis efface le compte.
Si vous le souhaitez, vous pouvez noter l'atelier. Sélectionnez le nombre d'étoiles correspondant à votre note, saisissez un commentaire, puis cliquez sur Submit (Envoyer).
Le nombre d'étoiles que vous pouvez attribuer à un atelier correspond à votre degré de satisfaction :
1 étoile = très mécontent(e)
2 étoiles = insatisfait(e)
3 étoiles = ni insatisfait(e), ni satisfait(e)
4 étoiles = satisfait(e)
5 étoiles = très satisfait(e)
Si vous ne souhaitez pas donner votre avis, vous pouvez fermer la boîte de dialogue.
Pour soumettre des commentaires, suggestions ou corrections, veuillez utiliser l'onglet Support (Assistance).
Copyright 2020 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.
Les ateliers créent un projet Google Cloud et des ressources pour une durée déterminée.
Les ateliers doivent être effectués dans le délai imparti et ne peuvent pas être mis en pause. Si vous quittez l'atelier, vous devrez le recommencer depuis le début.
En haut à gauche de l'écran, cliquez sur Démarrer l'atelier pour commencer.
Utilisez la navigation privée
Copiez le nom d'utilisateur et le mot de passe fournis pour l'atelier
Cliquez sur Ouvrir la console en navigation privée
Connectez-vous à la console
Connectez-vous à l'aide des identifiants qui vous ont été attribués pour l'atelier. L'utilisation d'autres identifiants peut entraîner des erreurs ou des frais.
Acceptez les conditions d'utilisation et ignorez la page concernant les ressources de récupération des données.
Ne cliquez pas sur Terminer l'atelier, à moins que vous n'ayez terminé l'atelier ou que vous ne vouliez le recommencer, car cela effacera votre travail et supprimera le projet.
Ce contenu n'est pas disponible pour le moment
Nous vous préviendrons par e-mail lorsqu'il sera disponible
Parfait !
Nous vous contacterons par e-mail s'il devient disponible
Un atelier à la fois
Confirmez pour mettre fin à tous les ateliers existants et démarrer celui-ci
Utilisez la navigation privée pour effectuer l'atelier
Ouvrez une fenêtre de navigateur en mode navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.
L'objectif de cet atelier est de montrer aux participants comment instancier un notebook Jupyter exécuté sur Google Cloud Vertex AI.
Durée :
0 min de configuration
·
Accessible pendant 75 min
·
Terminé après 60 min