arrow_back

Explora BigQuery

Acceder Unirse
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Explora BigQuery

Lab 1 hora 30 minutos universal_currency_alt 2 créditos show_chart Introductorio
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses
ícono de información importante IMPORTANTE:

ícono de computadora de escritorio/laptop Asegúrate de completar este lab práctico únicamente en una computadora de escritorio o laptop.

ícono de verificación Se permiten solo 5 intentos por lab.

ícono de diana del cuestionario A modo de recordatorio, es habitual no responder de forma correcta a todas las preguntas en el primer intento o incluso tener que volver a realizar una tarea; esto forma parte del proceso de aprendizaje.

ícono de cronómetro Una vez comenzado el lab, no se puede detener el cronómetro. Después de 1 hora y 30 minutos, el lab terminará y tendrás que volver a empezar.

ícono de sugerencia Para obtener más información, consulta la lectura Sugerencias técnicas para el lab.

Descripción general de la actividad

Para los análisis de datos en la nube, se usa una variedad de herramientas que pueden ayudarte con cada etapa del proceso de análisis. Dos herramientas populares y potentes, que son compatibles con muchas de las plataformas de nube más importantes, son BigQuery y Looker.

BigQuery es un almacén de datos empresarial completamente administrado que te ayuda a administrar y analizar tus datos con la interfaz de la consola de Google Cloud. Con BigQuery, puedes usar consultas en SQL para recuperar, borrar y organizar datos, a la vez que te aseguras de obtener datos de calidad para los informes y el análisis. También puedes usar BigQuery para escribir consultas en SQL para combinar datos de varias tablas con JOIN.

Looker es una plataforma de inteligencia empresarial (IE) que te ayuda a explorar, analizar, visualizar y compartir tus datos. Looker Studio, que forma parte de la plataforma de Looker y de fácil acceso en la IU de BigQuery, es una herramienta que convierte tus datos en informes y paneles esclarecedores y totalmente personalizables.

En este lab, explorarás dos conjuntos de datos en BigQuery y ejecutarás consultas en SQL para filtrar los datos. Luego, revisarás los resultados visualizados con Looker Studio.

Situación

¡Felicitaciones! Te contrataron como analista de datos del comercio electrónico TheLook, una empresa internacional que vende ropa a través de tiendas físicas y canales digitales, lo que incluye su propio sitio web, su propia app para dispositivos móviles y varias apps de redes sociales de terceros. El comercio electrónico TheLook creció con rapidez gracias a su amplia variedad de estilos de ropa, su enfoque en la innovación y su compromiso con el aprovisionamiento ético y sustentable.

El comercio electrónico TheLook planea publicar una campaña publicitaria que muestre a los jugadores de baloncesto universitario de la National Collegiate Athletic Association (NCAA) con más puntos marcados luciendo la indumentaria de la empresa. Martina, la gerente de Marketing, quiere que en la primera etapa de la campaña se promuevan trajes de baño.

Para identificar los productos de trajes de baño con las ventas más altas en junio, el mes con más ventas de trajes de baño históricamente para la empresa, Martina te pide que generes un informe con los datos de las ventas de junio de 2023 para la categoría de trajes de baño. Para determinar qué deportistas se destacarán en la campaña, explorarás el conjunto de datos públicos de la NCAA para generar un informe con los jugadores de baloncesto con más puntos marcados.

Sigue estos pasos para completar esta tarea: Primero, deberás explorar las tablas del conjunto de datos thelook_gcda. A continuación, deberás filtrar los datos para recuperar la información sobre los productos de trajes de baño vendidos en los últimos 30 días. Tercero, deberás explorar las tablas en el conjunto de datos públicos ncaa_basketball. Finalmente, deberás filtrar los datos para recuperar la información de los 10 jugadores de baloncesto con más puntos marcados.

Configuración

Antes de hacer clic en Comenzar lab

Lee estas instrucciones. Los labs son cronometrados y no se pueden pausar. El cronómetro, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.

En este lab práctico, puedes realizar las actividades por tu cuenta en un entorno de nube real, en lugar de una simulación o un entorno de demostración. Para ello, se te proporcionan credenciales temporales nuevas que usarás para acceder a Google Cloud durante todo el lab.

Para completar este lab, necesitarás lo siguiente:

  • Acceso a un navegador de Internet estándar (se recomienda el navegador Chrome)
Nota: Usa una ventana del navegador privada o de Incógnito para ejecutar este lab. Así evitarás cualquier conflicto entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
  • Tiempo para completar el lab: Recuerda que, una vez que comienzas un lab, no puedes pausarlo.
Nota: Si ya tienes un proyecto o una cuenta personal de Google Cloud, no los uses en este lab para evitar cargos adicionales en tu cuenta.

Cómo iniciar tu lab y acceder a la consola de Google Cloud

  1. Haz clic en el botón Comenzar lab. A la izquierda, se encuentra el panel Detalles del lab, que tiene estos elementos:

    • Tiempo restante
    • El botón Abrir la consola de Google
    • Las credenciales temporales que debes usar para el lab
    • Otra información para completar el lab, si es necesaria
    Nota: Si debes pagar por el lab, se abrirá una ventana emergente para que selecciones tu forma de pago.
  2. Haz clic en Abrir la consola de Google (o haz clic con el botón derecho y selecciona Abrir el vínculo en una ventana de incógnito) si ejecutas el navegador Chrome. La página Acceder se abre en una pestaña del navegador nueva.

    Sugerencia: Puedes organizar las pestañas de manera independiente (una ventana al lado de la otra) para alternar fácilmente entre ellas.

    Nota: Si aparece el diálogo Elige una cuenta, haz clic en Usar otra cuenta.
  3. Si es necesario, copia el nombre de usuario de Google Cloud a continuación, y pégalo en el diálogo Ingresar. Haz clic en Siguiente.

{{{user_0.username | "nombre de usuario de Google Cloud"}}}

También puedes encontrar el nombre de usuario de Google Cloud en el panel Detalles del lab.

  1. Copia la contraseña de Google Cloud a continuación y pégala en el diálogo te damos la bienvenida. Haz clic en Siguiente.
{{{user_0.password | "contraseña de Google Cloud"}}}

También puedes encontrar la contraseña de Google Cloud en el panel Detalles del lab.

Importante: Debes usar las credenciales que te proporciona el lab. No uses las credenciales de tu cuenta de Google Cloud. Nota: Usar tu propia cuenta de Google Cloud podría generar cargos adicionales.
  1. Haz clic para avanzar por las páginas siguientes:
    • Acepta los Términos y Condiciones.
    • No agregues opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
    • No te registres para las pruebas gratuitas.

Después de un momento, se abrirá la consola de Cloud en esta pestaña.

Nota: Para ver el menú con una lista de los productos y servicios de Google Cloud, haz clic en el menú de navegación que se encuentra en la parte superior izquierda de la pantalla. Menú de la consola de Google Cloud con el ícono de menú de navegación destacado

Tarea 1. Explora el conjunto de datos thelook_gcda

En esta tarea, deberás explorar el conjunto de datos thelook_gcda y las tablas que contiene. Luego, deberás ejecutar una consulta que una dos tablas y recupere datos sobre los productos de trajes de baño vendidos en junio de 2023.

  1. En el menú de navegación (Menú de navegación) de la consola de Google Cloud, haz clic en BigQuery > BigQuery Studio.
Nota: Puede aparecer un mensaje de Te damos la bienvenida a BigQuery en la consola de Cloud, que proporciona vínculos a la guía de inicio rápido y las notas de la versión para actualizaciones de la IU. Haz clic en Listo para continuar.
  1. En el campo de búsqueda Explorador, escribe thelook y presiona INTRO.
  2. Selecciona el conjunto de datos thelook_gcda.
  3. En el panel Explorador, expande el conjunto de datos thelook_gcda. Se muestran las tablas de este conjunto de datos. Es posible que debas desplazarte hacia abajo para explorar la lista completa de tablas.

Para esta parte de la tarea, deberás examinar los productos de trajes de baño vendidos en junio de 2023.

  1. Selecciona la tabla products. Se muestra el esquema de la tabla.
  2. Selecciona la pestaña Vista previa para examinar los datos. Ten en cuenta que cada producto tiene un identificador único en la columna id.

Ahora, examina las tablas order_items y product. Para determinar cuántos productos de trajes de baño se vendieron en junio de 2023, se deberá unir estas dos tablas en una sola columna.

  1. En el editor de consultas, haz clic en el ícono Redactar una nueva consulta (+) para abrir una nueva pestaña Sin título y ejecutar la consulta.
  2. Copia y pega el siguiente comando en la pestaña Sin título:
Nota: Cada vez que ejecutes una nueva consulta en el editor de consultas, puedes copiar y pegar la nueva consulta y reemplazar la anterior en la misma pestaña Sin título, o puedes hacer clic en el ícono Redactar una nueva consulta (+) para abrir una nueva pestaña Sin título y ejecutar la consulta. SELECT o.order_id,p.name,p.brand,o.sale_price,o.created_at, o.status FROM `thelook_gcda.order_items` as o JOIN `thelook_gcda.products` as p ON o.product_id=p.id WHERE UPPER(p.category) like "SWIM" AND UPPER(o.status) NOT in ('RETURNED','CANCELED','CANCELLED') AND o.created_at >= '2023-06-01' AND o.created_at < '2023-07-01';
  1. Haz clic en Ejecutar.

Esta consulta unirá las tablas order_items y product, y devolverá todos los pedidos relacionados con trajes de baño, que no se devolvieron ni cancelaron, de junio de 2023.

Finalmente, explora los resultados con Looker Studio.

  1. Haz clic en Explorar datos en el panel de resultados de la consulta y selecciona Explorar con Looker Studio.

Haz clic en Revisar mi progreso para verificar que completaste esta tarea correctamente.

Explorar el conjunto de datos thelook_gcda

Tarea 2. Explora el conjunto de datos públicos de baloncesto de la NCAA

En esta tarea, explorarás el conjunto de datos públicos ncaa_basketball y las tablas que contiene. Luego, ejecutarás una consulta para recuperar datos sobre los jugadores de baloncesto de la NCAA con la mayor cantidad de puntos marcados. Finalmente, ejecutarás una consulta que clasificará los 10 jugadores con la mayor cantidad de puntos marcados en un solo juego.

  1. Si todavía no estás en BigQuery Studio, en el menú de navegación de la consola de Google Cloud (Menú de navegación), haz clic en BigQuery > BigQuery Studio.
  2. En la barra Explorador, haz clic en + Agregar para agregar una fuente de datos al proyecto.
  3. En la lista Fuentes adicionales de la página Agregar, selecciona Conjuntos de datos públicos. Se abre la página Marketplace.
  4. En el campo de búsqueda, escribe ncaa y presiona INTRO.
  5. Selecciona el conjunto de datos NCAA Basketball.
  6. En la página Products details, haz clic en Ver conjunto de datos para ver el esquema de datos detallado de este conjunto de datos públicos de BigQuery.
  7. En el panel Explorador, expande el conjunto de datos ncaa_basketball. Se muestran las tablas de este conjunto de datos.

Primero, deberás sumar todos los puntos que un jugador acumuló en todos los juegos.

  1. Obtén una vista previa de todas las tablas en el conjunto de datos ncaa_basketball.
  2. Selecciona la tabla mbb_players_games_sr. ¿Qué columnas crees que serán útiles para encontrar los jugadores con la mayor cantidad de puntos?

Cada fila en mbb_players_games_sr tiene los resultados de cada jugador y de cada juego en el que participaron. Para obtener la cantidad total de puntos por jugador por juego, deberás ejecutar una consulta que resuma los datos de todos los juegos.

  1. Copia la siguiente consulta en el editor de consultas:
SELECT first_name, last_name, team_name, sum(points) as total_points FROM `bigquery-public-data.ncaa_basketball.mbb_players_games_sr` group by first_name, last_name, team_name order by total_points desc;

La consulta devolverá una fila por cada uno de los jugadores, su equipo respectivo y la suma de los puntos de todos los juegos en los que participaron.

  1. Haz clic en Ejecutar.

Ahora, deberás encontrar los 10 principales jugadores con la mayor cantidad de puntos marcados en un solo juego.

  1. Copia la siguiente consulta en el editor de consultas:
WITH rankings AS ( SELECT RANK() OVER (ORDER BY points DESC) AS ranking, first_name, last_name, team_name, points FROM `bigquery-public-data.ncaa_basketball.mbb_players_games_sr` ) SELECT ranking , first_name, last_name, team_name, points FROM rankings WHERE ranking<=10 ORDER BY ranking;

Esta consulta devolverá la información de los 10 principales jugadores de baloncesto de la NCAA en función de los puntos que marcaron en juegos y los clasificará, en orden, del 1 al 10.

Ten en cuenta que esta consulta tiene dos sentencias SELECT. La primera sentencia SELECT crea una tabla temporal llamada "rankings". La segunda sentencia SELECT selecciona las siguientes columnas de la tabla "rankings".

La función RANK() se usa para asignar una clasificación para cada jugador en función de sus puntos.

  1. Haz clic en Ejecutar.
Nota: De nuevo, puedes hacer clic en Explorar datos y seleccionar Explorar con Looker Studio para examinar los resultados. Nota: Los resultados muestran que hay jugadores con la misma cantidad de puntos y que, en este caso, la función RANK() les asigna la misma clasificación.

Cuando estás clasificando un valor que incluye empates, es buena idea conocer la diferencia entre ROW_NUMBER, DENSE_RANK y RANK.

  • ROW_NUMBER() ignorará los empates. Esto puede funcionar si quieres que se devuelvan los 10 principales jugadores de forma arbitraria.
  • DENSE_RANK() frente a RANK() los clasificará de manera diferente en función de los empates.
  • DENSE_RANK() no se salta números, por lo que será 1, 2, 2, 3.
  • RANK() se salta números, por lo que será 1, 2, 2, 4.

Haz clic en Revisar mi progreso para verificar que completaste esta tarea correctamente.

Explorar un conjunto de datos públicos de baloncesto de la NCAA

Conclusión

¡Muy bien!

Como analista de datos en la nube en el comercio electrónico TheLook, proporcionaste con éxito los datos necesarios para que el equipo de marketing lance la primera etapa de una campaña publicitaria genial que promoverá productos de trajes de baño con jugadores de baloncesto de la NCAA.

Obtuviste la información sobre los productos de trajes de baño vendidos en junio de 2023 explorando y filtrando tablas del conjunto de datos thelook_gcda.

También filtraste tablas en el conjunto de datos públicos ncaa_basketball para recuperar la información sobre los jugadores de baloncesto con la mayor cantidad de puntos marcados.

Con esta información, el equipo de marketing podrá tomar decisiones fundamentadas sobre los productos de trajes de baño que deben destacar en la campaña publicitaria y los mejores jugadores que deben invitar para modelar sus productos.

Estás en buen camino para usar herramientas potentes de análisis de datos en la nube. ¡Bien hecho!

Finaliza el lab

Antes de que finalices el lab, asegúrate de estar conforme con la forma en que completaste todas las tareas. Cuando estés conforme, haz clic en Finalizar Lab y luego haz clic en Enviar.

Finalizar el lab te quitará el acceso al entorno del lab y no podrás volver a acceder al trabajo que completaste.

Copyright 2024 Google LLC. Todos los derechos reservados. Google y el logotipo de Google son marcas de Google LLC. El resto de los nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que están asociados.