arrow_back

Visualiser des données avec Google Data Studio

Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Visualiser des données avec Google Data Studio

Lab 1 heure 30 minutes universal_currency_alt 5 crédits show_chart Intermédiaire
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP197

Google Cloud – Ateliers adaptés au rythme de chacun

Présentation

Dans cet atelier, vous allez apprendre à utiliser Google Data Studio pour visualiser des données stockées dans Google BigQuery.

Le Bureau des statistiques du transport américain fournit des ensembles de données sur l'aviation commerciale, l'activité de fret multimodal et l'économie des transports, qui peuvent être utilisés pour démontrer un large éventail de concepts et de techniques de science des données. Cet atelier utilise un ensemble de données contenant des informations historiques sur les vols intérieurs aux États-Unis.

Objectifs

  • Créer des vues BigQuery
  • Créer une source de données BigQuery dans Google Data Studio
  • Créer un rapport Data Studio avec un sélecteur de plage de dates
  • Créer plusieurs graphiques à l'aide des vues BigQuery

Prérequis

Avant de cliquer sur le bouton "Démarrer l'atelier"

Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.

Cet atelier pratique vous permet de suivre vous-même les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Nous vous fournissons des identifiants temporaires pour vous connecter à Google Cloud le temps de l'atelier.

Pour réaliser cet atelier :

  • vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome) ;
Remarque : Ouvrez une fenêtre de navigateur en mode incognito/navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le temporaire étudiant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.
  • vous disposez d'un temps limité ; une fois l'atelier commencé, vous ne pouvez pas le mettre en pause.
Remarque : Si vous possédez déjà votre propre compte ou projet Google Cloud, veillez à ne pas l'utiliser pour réaliser cet atelier afin d'éviter que des frais supplémentaires ne vous soient facturés.

Démarrer l'atelier et se connecter à la console Google Cloud

  1. Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, un pop-up s'affiche pour vous permettre de sélectionner un mode de paiement. Sur la gauche, vous trouverez le panneau Détails concernant l'atelier, qui contient les éléments suivants :

    • Le bouton Ouvrir la console Google
    • Le temps restant
    • Les identifiants temporaires que vous devez utiliser pour cet atelier
    • Des informations complémentaires vous permettant d'effectuer l'atelier
  2. Cliquez sur Ouvrir la console Google. L'atelier lance les ressources, puis ouvre la page Se connecter dans un nouvel onglet.

    Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.

    Remarque : Si la boîte de dialogue Sélectionner un compte s'affiche, cliquez sur Utiliser un autre compte.
  3. Si nécessaire, copiez le nom d'utilisateur inclus dans le panneau Détails concernant l'atelier et collez-le dans la boîte de dialogue Se connecter. Cliquez sur Suivant.

  4. Copiez le mot de passe inclus dans le panneau Détails concernant l'atelier et collez-le dans la boîte de dialogue de bienvenue. Cliquez sur Suivant.

    Important : Vous devez utiliser les identifiants fournis dans le panneau de gauche. Ne saisissez pas vos identifiants Google Cloud Skills Boost. Remarque : Si vous utilisez votre propre compte Google Cloud pour cet atelier, des frais supplémentaires peuvent vous être facturés.
  5. Accédez aux pages suivantes :

    • Acceptez les conditions d'utilisation.
    • N'ajoutez pas d'options de récupération ni d'authentification à deux facteurs (ce compte est temporaire).
    • Ne vous inscrivez pas aux essais offerts.

Après quelques instants, la console Cloud s'ouvre dans cet onglet.

Remarque : Vous pouvez afficher le menu qui contient la liste des produits et services Google Cloud en cliquant sur le menu de navigation en haut à gauche. Icône du menu de navigation

Activer Cloud Shell

Cloud Shell est une machine virtuelle qui contient de nombreux outils pour les développeurs. Elle comprend un répertoire d'accueil persistant de 5 Go et s'exécute sur Google Cloud. Cloud Shell vous permet d'accéder via une ligne de commande à vos ressources Google Cloud.

  1. Cliquez sur Activer Cloud Shell Icône Activer Cloud Shell en haut de la console Google Cloud.

Une fois connecté, vous êtes en principe authentifié et le projet est défini sur votre ID_PROJET. Le résultat contient une ligne qui déclare YOUR_PROJECT_ID (VOTRE_ID_PROJET) pour cette session :

Your Cloud Platform project in this session is set to YOUR_PROJECT_ID

gcloud est l'outil de ligne de commande pour Google Cloud. Il est préinstallé sur Cloud Shell et permet la complétion par tabulation.

  1. (Facultatif) Vous pouvez lister les noms des comptes actifs à l'aide de cette commande :
gcloud auth list
  1. Cliquez sur Autoriser.

  2. Vous devez à présent obtenir le résultat suivant :

Résultat :

ACTIVE: * ACCOUNT: student-01-xxxxxxxxxxxx@qwiklabs.net To set the active account, run: $ gcloud config set account `ACCOUNT`
  1. (Facultatif) Vous pouvez lister les ID de projet à l'aide de cette commande :
gcloud config list project

Résultat :

[core] project = <ID_Projet>

Exemple de résultat :

[core] project = qwiklabs-gcp-44776a13dea667a6 Remarque : Pour consulter la documentation complète sur gcloud, dans Google Cloud, accédez au guide de présentation de la gcloud CLI.

Tâche 1 : Préparer votre environnement

Cet atelier utilise un ensemble de données, des exemples de code et des scripts développés pour l'ouvrage Data Science on the Google Cloud Platform (2e édition) publié par O'Reilly Media, Inc. et aborde les tâches de visualisation des données présentées au chapitre 3, "Creating Compelling Dashboards" (Création de tableaux de bord attrayants).

Cloner le dépôt "Data Science on Google Cloud"

  1. Dans Cloud Shell, saisissez la commande suivante pour cloner le dépôt :
git clone \ https://github.com/GoogleCloudPlatform/data-science-on-gcp/
  1. Accédez au répertoire du dépôt :
cd data-science-on-gcp/03_sqlstudio

Exploration du schéma

Cet atelier utilise un ensemble de données BigQuery qui a été prérempli de deux mois d'échantillons de données sur les vols de janvier et février 2015, obtenu auprès du Bureau des statistiques du transport américain. Ces données sont contenues dans une table appelée flights_raw dans l'ensemble de données dsongcp.

  1. Dans la console Cloud, développez le menu de navigation (Icône du menu de navigation) et sélectionnez BigQuery.

  2. Dans le panneau "Explorateur" sur la gauche, développez votre projet et l'ensemble de données dsongcp, puis sélectionnez la table flights_raw.

  3. À droite de la fenêtre, sélectionnez l'onglet "Schéma" pour afficher le schéma de la table flights_raw.

Pour afficher un aperçu de la table BigQuery, utilisez la fonctionnalité "Aperçu".

Remarque : En dehors de cet environnement d'atelier, la fonctionnalité d'aperçu n'est pas facturée. Cependant, l'exécution d'une requête, par exemple "SELECT * FROM ... LIMIT 10", entraîne des frais.
  1. Cliquez sur l'onglet "Aperçu" pour afficher la table flights_raw.

Créer des vues BigQuery

Créez des vues de table pour afficher facilement les vols retardés de 10, 15 et 20 minutes. Vous aurez besoin de ces vues plus loin dans cet atelier.

  1. Dans Cloud Shell, exécutez le script ./create_views.sh :
./create_views.sh
  1. Exécutez le script suivant afin de calculer la table de contingence pour différents seuils :
./contingency.sh Créer des vues BigQuery

Tâche 2 : Se connecter à Data Studio pour analyser visuellement l'ensemble de données

  1. Dans un nouvel onglet de navigateur, ouvrez Looker Studio.

  2. Si nécessaire, cliquez sur Utilisation non facturée.

  3. Cliquez sur Sources de données dans le menu supérieur.

  4. En haut à gauche, cliquez sur + Créer > Source de données.

  5. Sélectionnez un pays et indiquez un nom d'entreprise.

  6. Acceptez les conditions d'utilisation, puis cliquez sur Continuer.

  7. Sélectionnez Non pour toutes les préférences relatives aux e-mails, puis cliquez sur Continuer.

  8. Dans la liste des connecteurs Google, cliquez sur la tuile BigQuery.

  9. Cliquez sur AUTORISER pour permettre l'accès à vos sources Cloud à partir de Data Studio.

  10. Si nécessaire, vérifiez que le compte que vous utilisez pour l'atelier est sélectionné et cliquez sur AUTORISER.

  11. Cliquez sur MES PROJETS > [Project-ID] > dsongcp > flights.

  12. Cliquez sur le bouton bleu ASSOCIER en haut à droite de l'écran.

Créer une source de données BigQuery

Tâche 3 : Créer un graphique à nuage de points à l'aide de Data Studio

  1. Cliquez sur CRÉER UN RAPPORT en haut à droite de la page.

  2. Cliquez sur AJOUTER AU RAPPORT pour confirmer que vous souhaitez ajouter la table flights en tant que source de données.

  3. Remplacez Rapport sans nom en haut à gauche par le nom de rapport de votre choix.

  4. Étant donné que vous créerez vos propres graphiques, cliquez sur le graphique créé automatiquement pour le sélectionner, puis supprimez-le.

  5. Cliquez sur Ajouter un graphique > Graphique à nuage de points, puis tracez un rectangle sur la toile du rapport pour y placer le graphique.

Menu déroulant &quot;Ajouter un graphique&quot;

Dans le panneau de droite, l'onglet DONNÉES présente les propriétés des données.

  1. Dans cet onglet, cliquez sur le champ des paramètres en dessous et modifiez-les comme suit :
Champ Valeur

Dimension

UNIQUE CARRIER

Valeur X

DEP_DELAY

Valeur Y

ARR_DELAY

  1. Passez la souris sur l'icône de type de données (SUM) de la propriété Valeur X.

Propriété &quot;Valeur X&quot;

  1. Cliquez sur l'icône en forme de crayon pour modifier le type d'agrégation de Valeur X.

Icône de modification de &quot;Valeur X&quot;

  1. Remplacez le type d'agrégation par Moyenne.

  2. Cliquez en dehors de la case du type d'agrégation pour revenir au volet de la propriété.

  3. Procédez de la même manière pour Valeur Y en remplaçant le type d'agrégation Somme par Moyenne.

  4. Cliquez sur l'onglet STYLE.

  5. Dans le menu "Style", cliquez sur la liste déroulante Courbe de tendance, puis sélectionnez Linéaire.

  6. Dans le ruban situé au-dessus du rapport, cliquez sur Ajouter une commande > Sélecteur de plage de dates.

Menu déroulant &quot;Ajouter une commande&quot; développé, avec l&#39;option &quot;Sélecteur de plage de dates&quot; mise en évidence

  1. Tracez un rectangle de la taille d'un libellé sous le graphique pour ajouter le sélecteur de plage de dates.

Essayez !

  1. Sélectionnez une plage de dates entre le 1er janvier 2015 et le 28 février 2015 en procédant comme suit :
  • Cliquez sur Plage de dates automatique dans le sélecteur de plage de dates à droite, OU
  • Cliquez sur le rectangle Sélecteur de plage de dates que vous avez ajouté sous le graphique à nuage de points.
  1. Cliquez sur le bouton AFFICHER en haut à droite pour activer la vue de rapport interactive et tester cette commande.
Remarque : Des données s'affichent uniquement si la plage de dates inclut des dates comprises entre le 1er janvier 2015 et le 28 février 2015, car l'ensemble de données est limité à ces dates dans cet atelier.

Tâche 4 : Ajouter des types de graphiques supplémentaires à votre rapport

  1. Cliquez sur Modifier en haut à droite pour ajouter d'autres éléments de graphique.

  2. Cliquez sur Ajouter un graphique > Graphique à secteurs, puis tracez un rectangle sur la toile du rapport pour y placer le graphique.

  3. Sélectionnez le graphique à secteurs, puis cliquez sur AJOUTER UN CHAMP en bas à droite de l'onglet "Données" du panneau de droite.

Remarque : Si vous ne voyez pas l'option AJOUTER UN CHAMP, actualisez l'onglet de navigateur.
  1. Cliquez sur TOUS LES CHAMPS pour afficher le résumé des propriétés de champ.

  2. Cliquez sur l'icône de menu contextuel à droite du champ ARR_DELAY (trois points), puis sélectionnez Dupliquer.

Icône de menu contextuel avec le champ ARR_DELAY

  1. Cliquez sur + AJOUTER UN CHAMP en haut à droite de cette section.

  2. Nommez ce champ is_late.

  3. Dans la zone de texte Formule, saisissez la formule suivante :

CASE WHEN ( Copy of ARR_DELAY <15) THEN "ON TIME" ELSE "LATE" END

Le nom du champ doit être enregistré correctement. Si la syntaxe du code n'est pas mise en évidence comme illustré ci-dessous, vérifiez la formule ou utilisez le sélecteur Champs disponibles à droite pour sélectionner le champ Copie de ARR_DELAY.

Éditeur de formules avec &quot;Copie de ARR_DELAY&quot; mis en évidence

  1. Cliquez sur ENREGISTRER, puis sur OK.

  2. Dans l'onglet DONNÉES du panneau de droite, remplacez la Dimension du graphique à secteurs par le nouveau champ calculé is_late.

Remarque : Votre graphique renverra probablement une erreur à ce stade. Elle sera résolue lors d'une prochaine étape.
  1. Basculez la Métrique sur le nouveau champ is_late.

  2. Pointez sur l'icône CTD située à côté de la métrique is_late.

  3. Cliquez dessus et remplacez le type d'agrégation par Nombre.

Le graphique à secteurs affiche maintenant le pourcentage de vols arrivés à l'heure et retardés.

Ajouter un graphique à barres (ou à colonnes)

  1. Cliquez sur Ajouter un graphique > Graphique à colonnes, puis tracez un rectangle sur la toile du rapport pour y placer le graphique.

  2. Dans l'onglet DONNÉES, cliquez sur le champ des paramètres en dessous et modifiez-les comme suit :

Champ Valeur

Dimension

UNIQUE CARRIER

Métrique 1 (valeur par défaut)

DEP_DELAY

Métrique 2 (cliquez sur Ajouter une métrique)

ARR_DELAY

Trier

UNIQUE CARRIER

Ordre de tri

Ordre croissant

  1. Dans l'onglet STYLE, faites défiler jusqu'à Axe Y de droite et définissez la Valeur min. de l'axe sur 0.

Tâche 5 : Créer des éléments de tableau de bord supplémentaires pour différents seuils de retard au départ

Vous avez créé trois vues de table de base de données. Vous allez maintenant créer des graphiques pour afficher les seuils de retard pour ces tables.

Ajouter une source de données supplémentaire pour la vue de la table de base de données Delayed_10

  1. Copiez le graphique à secteurs et le graphique à barres de sorte que vous disposez maintenant de deux ensembles. La toile du rapport doit maintenant ressembler à ce qui suit :

Toile du rapport, incluant un graphique à points, deux graphiques à secteurs et deux graphiques à barres

  1. Sélectionnez le second graphique à secteurs, et cliquez sur flights dans la liste de propriétés Source de données.

  2. Cliquez sur + AJOUTER DES DONNÉES en bas du menu.

  3. Cliquez sur BigQuery dans la section "Google Connectors" du volet de sélection.

  4. Sélectionnez MES PROJETS > [Project-ID] > dsongcp.

  5. Cliquez sur la table delayed_10 pour la sélectionner, puis cliquez sur le bouton AJOUTER en bas à droite de l'écran.

Remarque : Techniquement, ceci est une vue de table et non une table, mais elle est indiquée comme une table dans l'interface.
  1. Cliquez sur AJOUTER AU RAPPORT.

Recréer la copie du champ Arr_Delay et du champ calculé is_late

  1. Cliquez sur + AJOUTER UN CHAMP en bas à droite de l'écran. Vous devrez éventuellement vous assurer que vous avez sélectionné l'onglet de propriété DONNÉES à droite de l'écran pour afficher cet écran.

  2. Si vous ne voyez pas la liste complète des champs avec leur type de données et le type d'agrégation, cliquez sur TOUS LES CHAMPS pour accéder au résumé des propriétés de champ.

  3. Cliquez sur l'icône de menu contextuel à droite du champ ARR_DELAY, et sélectionnez Dupliquer.

Icône de menu contextuel avec le champ ARR_DELAY

  1. Cliquez sur + AJOUTER UN CHAMP à droite de l'écran pour la source de données delayed_10.

  2. Saisissez is_late dans la zone de texte Nom du champ.

  3. Saisissez la formule suivante dans la zone de texte Formule :

CASE WHEN ( Copy of ARR_DELAY <15) THEN "ON TIME" ELSE "LATE" END

Le nom du champ doit être enregistré correctement. Si la syntaxe du code n'est pas mise en évidence comme illustré ci-dessous, vérifiez la formule ou utilisez le sélecteur Champs disponibles à droite pour sélectionner le champ Copie de ARR_DELAY.

Éditeur de formules avec &quot;Copie de ARR_DELAY&quot; mis en évidence

  1. Cliquez sur ENREGISTRER, puis sur OK.

  2. Remplacez maintenant la Source de données du nouveau graphique à secteurs par delayed_10. Le champ calculé is_late devrait être conservé.

Le second graphique à secteurs affiche maintenant le pourcentage de vols arrivés à l'heure et retardés pour la vue Delayed_10.

Toile du rapport, incluant le second graphique à secteurs mis à jour

Tâche 6 : Créer les vues de tableau de bord restantes (facultatif)

Si vous le souhaitez, vous pouvez répéter les deux dernières sections, dans lesquelles vous avez ajouté une vue de base de données supplémentaire, pour les vues Delayed_15 et Delayed_20.

Félicitations !

Vous avez utilisé Google Data Studio pour visualiser des données stockées dans des tables et des vues BigQuery.

Terminer votre quête

Cet atelier d'auto-formation fait partie de la quête Data Science on Google Cloud. Une quête est une série d'ateliers associés qui constituent un parcours de formation. Si vous terminez cette quête, vous obtenez un badge attestant de votre réussite. Vous pouvez rendre publics les badges que vous recevez et ajouter leur lien dans votre CV en ligne ou sur vos comptes de réseaux sociaux. Inscrivez-vous à cette quête pour obtenir immédiatement les crédits associés. Découvrez toutes les quêtes disponibles dans le catalogue Google Cloud Skills Boost.

Atelier suivant

Poursuivez votre quête avec :

Étapes suivantes et informations supplémentaires

Pour aller plus loin :

Data Science on the Google Cloud Platform (2e édition), publié par O'Reilly Media, Inc.

Formations et certifications Google Cloud

Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.

Dernière mise à jour du manuel : 28 août 2023

Dernier test de l'atelier : 17 août 2023

Copyright 2024 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.