arrow_back

Analyse exploratoire de données à l'aide de BigQuery et d'instances Workbench

Accédez à plus de 700 ateliers et cours

Analyse exploratoire de données à l'aide de BigQuery et d'instances Workbench

Atelier 2 heures universal_currency_alt 1 crédit show_chart Intermédiaire
info Cet atelier peut intégrer des outils d'IA pour vous accompagner dans votre apprentissage.
Accédez à plus de 700 ateliers et cours

Présentation

Dans cet atelier, vous allez découvrir comment analyser un ensemble de données stocké dans BigQuery en exécutant des requêtes avec un notebook d'instance Workbench, et apprendre à générer différents types de représentation statistique. L'analyse vous permettra d'identifier des schémas de données.

Objectifs d'apprentissage

  • Créer un notebook d'instance Workbench
  • Se connecter à des ensembles de données BigQuery
  • Effectuer une analyse statistique sur un DataFrame Pandas
  • Créer des tracés Seaborn pour l'analyse exploratoire des données en Python
  • Écrire une requête SQL pour récupérer des champs spécifiques d'un ensemble de données BigQuery

Vertex AI est une plate-forme unifiée qui permet de créer, de déployer et de gérer des applications de machine learning (ML).

Les notebooks Vertex AI Workbench offrent une solution flexible et évolutive pour développer et déployer des modèles de ML sur Google Cloud. Choisissez Workbench si vous avez besoin de plus d'options de personnalisation et d'un contrôle total sur votre environnement de machine learning. Cet outil offre les fonctionnalités de sécurité et de conformité nécessaires aux grandes entreprises, et s'intègre à d'autres services Google Cloud tels que Vertex AI et BigQuery pour améliorer le workflow de data science et de machine learning.

BigQuery est un entrepôt de données sans serveur puissant et entièrement géré qui vous permet d'analyser et de gérer facilement de grands ensembles de données. Il utilise un dialecte SQL standard courant, ce qui permet aux analystes et aux data scientists de l'utiliser aisément sans avoir à apprendre un nouveau langage.

Vertex AI propose deux solutions de notebook, Workbench et Colab Enterprise.

Colab

Workbench

Vertex AI Workbench constitue un excellent choix pour les projets où la priorité est donnée au contrôle et à la personnalisation. Il convient particulièrement aux projets élaborés composés de plusieurs fichiers, avec des dépendances complexes. C'est également un bon choix pour un data scientist qui passe d'une station de travail ou d'un ordinateur portable au cloud.

Les instances Vertex AI Workbench sont fournies avec une suite préinstallée de packages de deep learning, compatibles avec les frameworks TensorFlow et PyTorch.

workbench1

Configurer vos environnements Qwiklabs

Configuration de Qwiklabs

Pour chaque atelier, nous vous attribuons un nouveau projet Google Cloud et un nouvel ensemble de ressources pour une durée déterminée, sans frais.

  1. Connectez-vous à Qwiklabs dans une fenêtre de navigation privée.

  2. Vérifiez le temps imparti pour l'atelier (par exemple : 01:15:00) : vous devez pouvoir le terminer dans ce délai.
    Une fois l'atelier lancé, vous ne pouvez pas le mettre en pause. Si nécessaire, vous pourrez le redémarrer, mais vous devrez tout reprendre depuis le début.

  3. Lorsque vous êtes prêt, cliquez sur Démarrer l'atelier.

  4. Notez vos identifiants pour l'atelier (Nom d'utilisateur et Mot de passe). Ils vous serviront à vous connecter à Google Cloud Console.

  5. Cliquez sur Ouvrir la console Google.

  6. Cliquez sur Utiliser un autre compte, puis copiez-collez les identifiants de cet atelier lorsque vous y êtes invité.
    Si vous utilisez d'autres identifiants, des messages d'erreur s'afficheront ou des frais seront appliqués.

  7. Acceptez les conditions d'utilisation et ignorez la page concernant les ressources de récupération des données.

Tâche 1 : Créer un notebook Workbench

  1. Dans le menu de navigation (Menu de navigation) de la console Google Cloud, sélectionnez Vertex AI.

  2. Cliquez sur Activer toutes les API recommandées.

  3. Dans le menu de navigation, cliquez sur Workbench.

    En haut de la page "Workbench", vérifiez que vous vous trouvez dans la vue Instances.

  4. Cliquez sur boîte de dialogue d'ajoutCréer.

  5. Configurez l'instance :

    • Nom : lab-workbench
    • Région : définissez la région sur
    • Zone : définissez la zone sur
    • Options avancées (facultatif) : si nécessaire, cliquez sur "Options avancées" pour une personnalisation plus avancée (par exemple, type de machine, taille du disque).

Créer une instance Vertex AI Workbench

  1. Cliquez sur Créer.

La création de l'instance prend quelques minutes. Une coche verte apparaît à côté de son nom quand elle est prête.

  1. Cliquez sur Ouvrir JupyterLab à côté du nom de l'instance pour lancer l'interface JupyterLab. Un nouvel onglet s'ouvre alors dans votre navigateur.

Instance Workbench déployée

  1. Cliquez sur l'icône Python 3 pour lancer un nouveau notebook Python.

Ouvrir le notebook Jupyter

  1. Effectuez un clic droit sur le fichier Untitled.ipynb dans la barre de menu et sélectionnez Renommer le notebook pour lui attribuer un nom significatif.

Renommer le notebook

Votre environnement est configuré. Vous êtes maintenant prêt à utiliser votre notebook Vertex AI Workbench.

Notebook Vertex prêt à l'emploi

Tâche 2 : Cloner un dépôt dans votre instance de notebook Vertex AI

Le dépôt GitHub contient le fichier de l'atelier et les fichiers de solution du cours.

  1. Copiez et exécutez le code suivant dans la première cellule de votre notebook pour cloner le dépôt training-data-analyst.
!git clone https://github.com/GoogleCloudPlatform/training-data-analyst

Cloner le dépôt training-data-analyst

  1. Vérifiez que vous avez bien cloné le dépôt. Double-cliquez sur le répertoire training-data-analyst et assurez-vous que vous pouvez voir son contenu.

Confirmer le dépôt training-data-analyst

  1. Dans l'interface du notebook, accédez à training-data-analyst > courses > machine_learning > deepdive2 > launching_into_ml > solutions et ouvrez workbench_explore_data.ipynb.

  2. Dans l'interface du notebook, sélectionnez Edit > Clear All Outputs (Modifier > Supprimer tous les résultats) dans le menu déroulant.

  3. Dans la boîte de dialogue Select Kernel (Sélectionner le kernel), sélectionnez Python 3 dans la liste des kernels disponibles.

  4. Lisez attentivement les instructions du notebook.

Instructions du notebook

Félicitations !

Dans cet atelier, vous avez appris à effectuer les tâches suivantes :

  • Créer un notebook d'instance Workbench
  • Cloner un dépôt GitHub
  • Vous connecter à un ensemble de données BigQuery
  • Effectuer une analyse statistique sur un DataFrame Pandas
  • Créer des tracés Seaborn pour l'analyse exploratoire des données en Python
  • Écrire une requête SQL pour récupérer des champs spécifiques d'un ensemble de données BigQuery

Terminer l'atelier

Une fois l'atelier terminé, cliquez sur End Lab (Terminer l'atelier). Qwiklabs supprime les ressources que vous avez utilisées, puis efface le compte.

Si vous le souhaitez, vous pouvez noter l'atelier. Sélectionnez le nombre d'étoiles correspondant à votre note, saisissez un commentaire, puis cliquez sur Submit (Envoyer).

Le nombre d'étoiles que vous pouvez attribuer à un atelier correspond à votre degré de satisfaction :

  • 1 étoile = très mécontent(e)
  • 2 étoiles = insatisfait(e)
  • 3 étoiles = ni insatisfait(e), ni satisfait(e)
  • 4 étoiles = satisfait(e)
  • 5 étoiles = très satisfait(e)

Si vous ne souhaitez pas donner votre avis, vous pouvez fermer la boîte de dialogue.

Pour soumettre des commentaires, suggestions ou corrections, veuillez utiliser l'onglet Support (Assistance).

Dernière mise à jour du manuel : 25 novembre 2024

Dernier test de l'atelier : 25 novembre 2024

Copyright 2020 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.

Avant de commencer

  1. Les ateliers créent un projet Google Cloud et des ressources pour une durée déterminée.
  2. Les ateliers doivent être effectués dans le délai imparti et ne peuvent pas être mis en pause. Si vous quittez l'atelier, vous devrez le recommencer depuis le début.
  3. En haut à gauche de l'écran, cliquez sur Démarrer l'atelier pour commencer.

Utilisez la navigation privée

  1. Copiez le nom d'utilisateur et le mot de passe fournis pour l'atelier
  2. Cliquez sur Ouvrir la console en navigation privée

Connectez-vous à la console

  1. Connectez-vous à l'aide des identifiants qui vous ont été attribués pour l'atelier. L'utilisation d'autres identifiants peut entraîner des erreurs ou des frais.
  2. Acceptez les conditions d'utilisation et ignorez la page concernant les ressources de récupération des données.
  3. Ne cliquez pas sur Terminer l'atelier, à moins que vous n'ayez terminé l'atelier ou que vous ne vouliez le recommencer, car cela effacera votre travail et supprimera le projet.

Ce contenu n'est pas disponible pour le moment

Nous vous préviendrons par e-mail lorsqu'il sera disponible

Parfait !

Nous vous contacterons par e-mail s'il devient disponible

Un atelier à la fois

Confirmez pour mettre fin à tous les ateliers existants et démarrer celui-ci

Utilisez la navigation privée pour effectuer l'atelier

Ouvrez une fenêtre de navigateur en mode navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.