arrow_back

BigQuery en JupyterLab en Vertex AI

Acceder Unirse
Obtén acceso a más de 700 labs y cursos

BigQuery en JupyterLab en Vertex AI

Lab 1 hora 15 minutos universal_currency_alt 5 créditos show_chart Introductorio
info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.
Obtén acceso a más de 700 labs y cursos

Descripción general

El objetivo de este lab es mostrarles a los estudiantes cómo crear una instancia de un notebook de Jupyter que se ejecute en el servicio Vertex AI de Google Cloud. Como ayuda para la demostración, se aprovechará un conjunto de datos con varias horas de salida y llegada de vuelos.

Objetivos

En este lab, aprenderás a realizar las siguientes tareas:

  • Crear una instancia de un notebook de Jupyter en Vertex AI
  • Ejecutar una consulta de BigQuery desde un notebook de Jupyter y procesar el resultado con Pandas

Configuración y requisitos

En cada lab, recibirá un proyecto de Google Cloud y un conjunto de recursos nuevos por tiempo limitado y sin costo adicional.

  1. Accede a Qwiklabs desde una ventana de incógnito.

  2. Ten en cuenta el tiempo de acceso del lab (por ejemplo, 1:15:00) y asegúrate de finalizarlo en el plazo asignado.
    No existe una función de pausa. Si lo necesita, puede reiniciar el lab, pero deberá hacerlo desde el comienzo.

  3. Cuando esté listo, haga clic en Comenzar lab.

  4. Anote las credenciales del lab (el nombre de usuario y la contraseña). Las usarás para acceder a la consola de Google Cloud.

  5. Haga clic en Abrir Google Console.

  6. Haga clic en Usar otra cuenta, copie las credenciales para este lab y péguelas en el mensaje emergente que aparece.
    Si usa otras credenciales, se generarán errores o incurrirá en cargos.

  7. Acepta las condiciones y omite la página de recursos de recuperación.

Abra BigQuery Console

  1. En Google Cloud Console, seleccione Menú de navegación > BigQuery. Se abrirá el cuadro de mensaje Bienvenido a BigQuery en Cloud Console, que contiene un vínculo a la guía de inicio rápido y enumera las actualizaciones de la IU.
  2. Haga clic en Listo.

Tarea 1: Inicia la instancia de Vertex AI Workbench

  1. En el menú de navegación (Menú de navegación) de la consola de Google Cloud, selecciona Vertex AI.

  2. Haz clic en Habilitar todas las APIs recomendadas.

  3. En el menú de navegación, haz clic en Workbench.

    En la parte superior de la página de Workbench, asegúrate de estar en la vista Instances.

  4. Haz clic en agregar cuadroCreate New.

  5. Configura la instancia:

    • Name: lab-workbench
    • Region: Configura la región como
    • Zone: Establece la zona en
    • Advanced Options: Si es necesario, haz clic en "Advanced Options" para realizar personalizaciones adicionales (p. ej., tipo de máquina, tamaño del disco).

Crea una instancia de Vertex AI Workbench

  1. Haz clic en Create.

La instancia tardará algunos minutos en crearse. Se mostrará una marca de verificación verde junto a su nombre cuando esté lista.

  1. Haz clic en ABRIR JUPYTERLAB junto al nombre de la instancia para iniciar la interfaz de JupyterLab. Se abrirá una pestaña nueva en el navegador.

Instancia de Workbench implementada

  1. Haz clic en el ícono de Python 3 para iniciar un nuevo notebook de Python.

Abre el notebook de Jupyter

  1. Haz clic con el botón derecho en el archivo Untitled.ipynb en la barra de menú y selecciona Cambiar el nombre del notebook para asignarle un nombre significativo.

Cambia el nombre del notebook

Acabas de configurar el entorno. Ya tienes todo listo para comenzar a trabajar con tu notebook de Vertex AI Workbench.

Notebook de Vertex listo para usar

Haz clic en Revisar mi progreso para verificar el objetivo. Iniciar la instancia de Vertex AI Workbench

Tarea 2: Ejecuta una consulta en BigQuery

  1. Ingresa la siguiente consulta en la primera celda del notebook:
%%bigquery df --use_rest_api SELECT depdelay as departure_delay, COUNT(1) AS num_flights, APPROX_QUANTILES(arrdelay, 10) AS arrival_delay_deciles FROM `cloud-training-demos.airline_ontime_data.flights` WHERE depdelay is not null GROUP BY depdelay HAVING num_flights > 100 ORDER BY depdelay ASC

El comando utiliza la función mágica %%bigquery. Las funciones mágicas en notebooks proporcionan un alias para un comando del sistema. En este caso, %%bigquery ejecuta la consulta en la celda en BigQuery y almacena el resultado en un objeto DataFrame de Pandas que se llama df.

  1. Ejecuta la celda presionando Mayúsculas + Intro cuando el cursor esté en la celda. De manera alternativa, desde la pestaña Ejecutar, puedes hacer clic en Ejecutar celdas seleccionadas. Ten en cuenta que, en este caso, la combinación de teclas para esta acción no es Mayúsculas + Intro. No debería generarse ningún resultado cuando ejecutes el comando.

Haz clic en Revisar mi progreso para verificar el objetivo. Ejecutar una consulta en BigQuery

  1. Observa las cinco primeras filas del resultado de la consulta. Para hacerlo, ejecuta el siguiente código en una celda nueva:
df.head()

Cinco líneas de datos debajo de los títulos: departure_delay, num_flights, y arrival_delay_deciles

Tarea 3. Haz un trazado con Pandas

Usaremos el DataFrame de Pandas que contiene el resultado de nuestra consulta para crear un trazado que ilustre la relación entre las demoras en la salida y la llegada. Antes de continuar, si no conoces Pandas, te recomendamos que leas la Guía de introducción en diez minutos.

  1. Para obtener un DataFrame con los datos que necesitamos, primero, tenemos que derivar el resultado de la consulta sin procesar. Ingresa el siguiente código en una celda nueva para convertir la lista de arrival_delay_deciles en un objeto de serie de Pandas. El código también cambia el nombre de las columnas resultantes.
import pandas as pd percentiles = df['arrival_delay_deciles'].apply(pd.Series) percentiles.rename(columns = lambda x : '{0}%'.format(x*10), inplace=True) percentiles.head()
  1. Dado que deseamos relacionar las demoras en la hora de salida con las demoras en la hora de llegada, debemos concatenar nuestra tabla de percentiles con el campo departure_delay en el DataFrame original. Ejecuta el siguiente código en una celda nueva:
df = pd.concat([df['departure_delay'], percentiles], axis=1) df.head()
  1. Antes de trazar el contenido del DataFrame, descarta los valores extremos almacenados en los campos 0% y 100%. Ejecuta el siguiente código en una celda nueva:
df.drop(labels=['0%', '100%'], axis=1, inplace=True) df.plot(x='departure_delay', xlim=(-30,50), ylim=(-50,50));

Gráfico de líneas que representa las demoras en la llegada frente a las demoras en la salida

Finalice su lab

Cuando haya completado su lab, haga clic en Finalizar lab. Qwiklabs quitará los recursos que usó y limpiará la cuenta por usted.

Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.

La cantidad de estrellas indica lo siguiente:

  • 1 estrella = Muy insatisfecho
  • 2 estrellas = Insatisfecho
  • 3 estrellas = Neutral
  • 4 estrellas = Satisfecho
  • 5 estrellas = Muy satisfecho

Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.

Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.

Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Antes de comenzar

  1. Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
  2. .
  3. Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
  4. En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar

Usa la navegación privada

  1. Copia el nombre de usuario y la contraseña proporcionados para el lab
  2. Haz clic en Abrir la consola en modo privado

Accede a la consola

  1. Accede con tus credenciales del lab. Si usas otras credenciales, se generarán errores o se incurrirá en cargos.
  2. Acepta las condiciones y omite la página de recursos de recuperación
  3. No hagas clic en Finalizar lab, a menos que lo hayas terminado o quieras reiniciarlo, ya que se borrará tu trabajo y se quitará el proyecto

Este contenido no está disponible en este momento

Te enviaremos una notificación por correo electrónico cuando esté disponible

¡Genial!

Nos comunicaremos contigo por correo electrónico si está disponible

Un lab a la vez

Confirma para finalizar todos los labs existentes y comenzar este

Usa la navegación privada para ejecutar el lab

Usa una ventana de navegación privada o de Incógnito para ejecutar el lab. Así evitarás cualquier conflicto entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.