BigQuery es la base de datos de estadísticas de Google de bajo costo, no-ops y completamente administrada. Con BigQuery, puedes consultar muchos terabytes de datos sin tener que administrar infraestructuras y sin necesitar un administrador de base de datos. BigQuery usa SQL y puedes aprovechar el modelo de pago por uso. BigQuery te permite enfocarte en el análisis de datos para buscar estadísticas valiosas.
En BigQuery, se cargó un conjunto de datos de comercio electrónico recientemente disponible que incluye millones de registros de Google Analytics para Google Merchandise Store. Tienes una copia de ese conjunto de datos para este lab y explorarás los campos y las filas disponibles para obtener estadísticas.
Este lab lo guiará a través de la lógica que tienen las consultas para solucionar problemas mediante actividades dentro del contexto de una situación real. Durante el lab, imagina que trabajas con un analista de datos que se acaba de incorporar a tu equipo y que te proporcionaron las consultas a continuación para responder a algunas preguntas sobre tu conjunto de datos de comercio electrónico. Use las respuestas para resolver las consultas y obtener así un resultado significativo.
Actividades
En este lab, aprenderá a realizar las siguientes tareas:
Consultar el conjunto de datos públicos de estadísticas generadas a partir de datos
Usar el editor de consultas de BigQuery para solucionar errores comunes de SQL
Usar el validador de consultas
Solucionar errores de sintaxis y lógica de SQL
Configuración y requisitos
En cada lab, recibirá un proyecto de Google Cloud y un conjunto de recursos nuevos por tiempo limitado y sin costo adicional.
Accede a Qwiklabs desde una ventana de incógnito.
Ten en cuenta el tiempo de acceso del lab (por ejemplo, 1:15:00) y asegúrate de finalizarlo en el plazo asignado.
No existe una función de pausa. Si lo necesita, puede reiniciar el lab, pero deberá hacerlo desde el comienzo.
Cuando esté listo, haga clic en Comenzar lab.
Anote las credenciales del lab (el nombre de usuario y la contraseña). Las usarás para acceder a la consola de Google Cloud.
Haga clic en Abrir Google Console.
Haga clic en Usar otra cuenta, copie las credenciales para este lab y péguelas en el mensaje emergente que aparece.
Si usa otras credenciales, se generarán errores o incurrirá en cargos.
Acepta las condiciones y omite la página de recursos de recuperación.
Abre BigQuery y fija un proyecto al árbol de recursos
En esta sección, agregarás el proyecto data-to-insights a tus recursos de entorno.
Haga clic en el menú de Navegación > BigQuery.
Se abre el cuadro de mensaje Bienvenido a BigQuery en el Cloud Console.
El cuadro de mensaje Bienvenido a BigQuery en el Cloud Console proporciona un enlace a la guía de inicio rápido y a las actualizaciones de la interfaz de usuario.
Haga clic en Listo.
Los conjuntos de datos públicos de BigQuery no se muestran por defecto en la interfaz web de BigQuery. Para abrir el proyecto de conjuntos de datos públicos
Haga clic en + Agregar datos.
Seleccione Fijar un proyecto > Ingresar nombre del proyecto.
En el nombre del proyecto introduzca data-to-insights.
Haga clic en Fijar.
En el panel izquierdo, en Visualizando los proyectos fijados, usted podrá ver el proyecto data-to-insights fijado.
Editor de códigos de BigQuery
En las actividades de las siguientes secciones, deberá solucionar problemas de consultas con errores comunes. El lab te indicará qué debes mirar y te sugerirá cómo corregir la sintaxis y devolver resultados significativos.
Para continuar con la solución de problemas y las sugerencias, copia y pega la consulta en el editor de consultas de BigQuery. Si hay algún error, verás un signo de exclamación rojo en la línea que contiene el error y en el validador de consultas (esquina inferior).
Si ejecutas la consulta con errores, fallará y se especificará el error en la información del trabajo.
Si la consulta no tiene errores, verás una marca de verificación verde en el validador de consultas. Cuando veas esa marca, haz clic en EJECUTAR para ejecutar la consulta y ver los resultados que arroja.
Determina el número total de clientes que realizaron la confirmación de la compra
En esta sección, debe diseñar una consulta que muestre el número de visitantes únicos que realizaron con éxito el proceso de confirmación de la compra en su sitio web. Su equipo de analistas le proporcionó los datos en la tabla rev_transactions y te entregó consultas de ejemplo para ayudarte a comenzar el análisis, aunque no sabes con certeza si son correctas.
Soluciona problemas en consultas que contienen errores relacionados con el validador de consultas, comas y alias
Observa la siguiente consulta y responde la pregunta:
#standardSQL
SELECT FROM `data-to-inghts.ecommerce.rev_transactions` LIMIT 1000
¿Qué ocurre con esta consulta actualizada?
#standardSQL
SELECT * FROM [data-to-insights:ecommerce.rev_transactions] LIMIT 1000
¿Qué ocurre con esta consulta que usa SQL estándar?
#standardSQL
SELECT FROM `data-to-insights.ecommerce.rev_transactions`
¿Qué ocurre ahora? Esta consulta tiene una columna.
#standardSQL
SELECT
fullVisitorId
FROM `data-to-insights.ecommerce.rev_transactions`
¿Qué ocurre ahora? La siguiente consulta tiene un título de página.
#standardSQL
SELECT fullVisitorId hits_page_pageTitle
FROM `data-to-insights.ecommerce.rev_transactions` LIMIT 1000
¿Qué ocurre ahora? Se corrigió la coma que faltaba.
#standardSQL
SELECT
fullVisitorId
, hits_page_pageTitle
FROM `data-to-insights.ecommerce.rev_transactions` LIMIT 1000
Respuesta: Esta consulta devuelve resultados, pero ¿seguro que los visitantes no se registran dos veces? Además, al mostrar solo una fila, se responde la pregunta de cuántos visitantes únicos realizaron la confirmación de la compra.
En la siguiente sección, descubrirá una forma de sumar sus resultados.
Solucione problemas en consultas que contienen errores de lógica, instrucciones de GROUP BY y filtros comodines
Suma la siguiente consulta para responder a esta pregunta: ¿Cuántos visitantes únicos realizaron la confirmación de la compra?
#standardSQL
SELECT
fullVisitorId
, hits_page_pageTitle
FROM `data-to-insights.ecommerce.rev_transactions` LIMIT 1000
¿Qué ocurre aquí? Se agregó una función de suma, COUNT().
#standardSQL
SELECT
COUNT(fullVisitorId) AS visitor_count
, hits_page_pageTitle
FROM `data-to-insights.ecommerce.rev_transactions`
En la próxima consulta, se agregaron las instrucciones GROUP BY y DISTINCT.
#standardSQL
SELECT
COUNT(DISTINCT fullVisitorId) AS visitor_count
, hits_page_pageTitle
FROM `data-to-insights.ecommerce.rev_transactions`
GROUP BY hits_page_pageTitle
Resultados
Perfecto. Los resultados están bien, pero se ven extraños.
Aplica solo el filtro “Confirmación de la compra” en los resultados.
#standardSQL
SELECT
COUNT(DISTINCT fullVisitorId) AS visitor_count
, hits_page_pageTitle
FROM `data-to-insights.ecommerce.rev_transactions`
WHERE hits_page_pageTitle = "Checkout Confirmation"
GROUP BY hits_page_pageTitle
Enumera las ciudades con más transacciones en tu sitio de comercio electrónico
Soluciona problemas relacionados con los pedidos, los campos calculados y la aplicación de filtros después de la suma
Completa la consulta escrita parcialmente:
SELECT
geoNetwork_city,
totals_transactions,
COUNT( DISTINCT fullVisitorId) AS distinct_visitors
FROM
`data-to-insights.ecommerce.rev_transactions`
GROUP BY
Solución posible:
#standardSQL
SELECT
geoNetwork_city,
SUM(totals_transactions) AS totals_transactions,
COUNT( DISTINCT fullVisitorId) AS distinct_visitors
FROM
`data-to-insights.ecommerce.rev_transactions`
GROUP BY geoNetwork_city
Actualiza tu consulta anterior para ordenar las ciudades de manera descendente.
Solución posible:
#standardSQL
SELECT
geoNetwork_city,
SUM(totals_transactions) AS totals_transactions,
COUNT( DISTINCT fullVisitorId) AS distinct_visitors
FROM
`data-to-insights.ecommerce.rev_transactions`
GROUP BY geoNetwork_city
ORDER BY distinct_visitors DESC
Actualiza tu consulta y crea un nuevo campo calculado para devolver el número promedio de productos por pedido en cada ciudad.
Solución posible:
#standardSQL
SELECT
geoNetwork_city,
SUM(totals_transactions) AS total_products_ordered,
COUNT( DISTINCT fullVisitorId) AS distinct_visitors,
SUM(totals_transactions) / COUNT( DISTINCT fullVisitorId) AS avg_products_ordered
FROM
`data-to-insights.ecommerce.rev_transactions`
GROUP BY geoNetwork_city
ORDER BY avg_products_ordered DESC
Resultados
Filtra tus resultados totales para devolver solo las ciudades con más de 20 avg_products_ordered (20 productos en promedio ordenados).
¿Cuál es el problema en esta consulta?
#standardSQL
SELECT
geoNetwork_city,
SUM(totals_transactions) AS total_products_ordered,
COUNT( DISTINCT fullVisitorId) AS distinct_visitors,
SUM(totals_transactions) / COUNT( DISTINCT fullVisitorId) AS avg_products_ordered
FROM
`data-to-insights.ecommerce.rev_transactions`
WHERE avg_products_ordered > 20
GROUP BY geoNetwork_city
ORDER BY avg_products_ordered DESC
Solución posible:
#standardSQL
SELECT
geoNetwork_city,
SUM(totals_transactions) AS total_products_ordered,
COUNT( DISTINCT fullVisitorId) AS distinct_visitors,
SUM(totals_transactions) / COUNT( DISTINCT fullVisitorId) AS avg_products_ordered
FROM
`data-to-insights.ecommerce.rev_transactions`
GROUP BY geoNetwork_city
HAVING avg_products_ordered > 20
ORDER BY avg_products_ordered DESC
Determina el número total de productos en cada categoría
Filtra con valores NULL y descubre cuáles son los productos más vendidos
¿Cuál es el problema en esta consulta? ¿Cómo puedes solucionarlo?
#standardSQL
SELECT hits_product_v2ProductName, hits_product_v2ProductCategory
FROM `data-to-insights.ecommerce.rev_transactions`
GROUP BY 1,2
¿Cuál es el problema en esta consulta?
#standardSQL
SELECT
COUNT(hits_product_v2ProductName) as number_of_products,
hits_product_v2ProductCategory
FROM `data-to-insights.ecommerce.rev_transactions`
WHERE hits_product_v2ProductName IS NOT NULL
GROUP BY hits_product_v2ProductCategory
ORDER BY number_of_products DESC
Actualiza la consulta anterior para registrar únicamente los productos diferentes en cada categoría.
Solución posible:
#standardSQL
SELECT
COUNT(DISTINCT hits_product_v2ProductName) as number_of_products,
hits_product_v2ProductCategory
FROM `data-to-insights.ecommerce.rev_transactions`
WHERE hits_product_v2ProductName IS NOT NULL
GROUP BY hits_product_v2ProductCategory
ORDER BY number_of_products DESC
LIMIT 5
¡Felicitaciones!
Pudiste solucionar problemas y corregir consultas incorrectas en SQL estándar de BigQuery. Recuerda usar el validador de consultas para detectar sintaxis incorrecta y analizar objetivamente los resultados de tus consultas, incluso si estas se ejecutan con éxito.
Finalice su lab
Cuando haya completado el lab, haga clic en Finalizar lab. Google Cloud Skills Boost quitará los recursos que usó y limpiará la cuenta.
Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.
La cantidad de estrellas indica lo siguiente:
1 estrella = Muy insatisfecho
2 estrellas = Insatisfecho
3 estrellas = Neutral
4 estrellas = Satisfecho
5 estrellas = Muy satisfecho
Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.
Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.
Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.
Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
.
Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar
Usa la navegación privada
Copia el nombre de usuario y la contraseña proporcionados para el lab
Haz clic en Abrir la consola en modo privado
Accede a la consola
Accede con tus credenciales del lab. Si usas otras credenciales, se generarán errores o se incurrirá en cargos.
Acepta las condiciones y omite la página de recursos de recuperación
No hagas clic en Finalizar lab, a menos que lo hayas terminado o quieras reiniciarlo, ya que se borrará tu trabajo y se quitará el proyecto
Este contenido no está disponible en este momento
Te enviaremos una notificación por correo electrónico cuando esté disponible
¡Genial!
Nos comunicaremos contigo por correo electrónico si está disponible
Un lab a la vez
Confirma para finalizar todos los labs existentes y comenzar este
Usa la navegación privada para ejecutar el lab
Usa una ventana de navegación privada o de Incógnito para ejecutar el lab. Así
evitarás cualquier conflicto entre tu cuenta personal y la cuenta
de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
En este lab, usarás BigQuery para solucionar problemas comunes de SQL, consultar el conjunto de datos públicos de estadísticas generadas a partir de datos, usar el validador de consultas y solucionar errores de sintaxis y lógica de SQL.
Duración:
0 min de configuración
·
Acceso por 50 min
·
50 min para completar