arrow_back

Cómo comenzar a usar BQML

Unirse Acceder

Cómo comenzar a usar BQML

45 minutos Gratis

GSP247

Labs de autoaprendizaje de Google Cloud

Descripción general

BigQuery Machine Learning (BQML, producto en versión Beta) permite a los usuarios crear y ejecutar modelos de aprendizaje automático en BigQuery mediante consultas de SQL. El objetivo es democratizar el aprendizaje automático permitiéndoles a los profesionales de SQL que compilen modelos con sus herramientas existentes y aumenten la velocidad de desarrollo al eliminar la necesidad de mover datos.

Hay un nuevo conjunto de datos de comercio electrónico disponible que tiene millones de registros de Google Analytics para la Tienda de productos de Google cargados en BigQuery. En este lab, utilizará estos datos para crear un modelo que prediga si un visitante hará una transacción.

Qué aprenderá

Cómo crear, evaluar y utilizar modelos de aprendizaje automático en BigQuery

Requisitos

  • Un navegador, como Chrome o Firefox

  • Conocimiento básico de SQL o de BigQuery

Configuración y requisitos

Antes de hacer clic en el botón Comenzar lab

Lea estas instrucciones. Los labs son cronometrados y no se pueden pausar. El cronómetro, que comienza a funcionar cuando hace clic en Comenzar lab, indica por cuánto tiempo tendrá a su disposición los recursos de Google Cloud.

Este lab práctico de Qwiklabs le permitirá llevar a cabo las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, le proporciona credenciales temporales nuevas que utilizará para acceder a Google Cloud durante todo el lab.

Qué necesita

Para completar este lab, necesitará lo siguiente:

  • Acceso a un navegador de Internet estándar (se recomienda el navegador Chrome)
  • Tiempo para completar el lab

Nota: Si ya tiene un proyecto o una cuenta personal de Google Cloud, no los use para este lab.

Nota: Si usa un dispositivo con Chrome OS, ejecute este lab en una ventana de incógnito.

Cómo iniciar su lab y acceder a la consola de Google Cloud

  1. Haga clic en el botón Comenzar lab. Si debe pagar por el lab, se abrirá una ventana emergente para que seleccione su forma de pago. A la izquierda, se encuentra el panel Detalles del lab que tiene estos elementos:

    • El botón Abrir la consola de Google
    • Tiempo restante
    • Las credenciales temporales que debe usar para el lab
    • Otra información para completar el lab, si es necesaria
  2. Haga clic en Abrir la consola de Google. El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.

    Sugerencia: Ordene las pestañas en ventanas separadas, una junto a la otra.

    Nota: Si ve el diálogo Elegir una cuenta, haga clic en Usar otra cuenta.
  3. Si es necesario, copie el nombre de usuario del panel Detalles del lab y péguelo en el cuadro de diálogo Acceder. Haga clic en Siguiente.

  4. Copie la contraseña del panel Detalles del lab y péguela en el cuadro de diálogo de bienvenida. Haga clic en Siguiente.

    Importante: Debe usar las credenciales del panel de la izquierda. No use sus credenciales de Google Cloud Skills Boost. Nota: Usar su propia Cuenta de Google podría generar cargos adicionales.
  5. Haga clic para avanzar por las páginas siguientes:

    • Acepte los términos y condiciones.
    • No agregue opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
    • No se registre para obtener pruebas gratuitas.

Después de un momento, se abrirá la consola de Cloud en esta pestaña.

Nota: Para ver el menú con una lista de los productos y servicios de Google Cloud, haga clic en el Menú de navegación que se encuentra en la parte superior izquierda de la pantalla. Ícono del menú de navegación

Cómo abrir la consola de BigQuery

  1. En la consola de Google Cloud, seleccione elmenú de navegación > BigQuery.

Se abrirá el cuadro de mensaje Te damos la bienvenida a BigQuery en la consola de Cloud. Este cuadro de mensaje contiene un vínculo a la guía de inicio rápido y las notas de la versión.

  1. Haga clic en Listo.

Se abrirá la consola de BigQuery.

Cree un conjunto de datos

Para crear un conjunto de Datos, haga clic en el icono de Ver acciones junto a su ID de Proyecto y seleccione Crear conjunto de Datos.

CD_1.png

A continuación, nombre a su ID de conjunto de Datos bqml_lab y haga clic en Crear conjunto de Datos.

create_dataset_1.png

Pruebe la tarea completada

Haga clic en Revisar mi progreso para verificar la tarea realizada. Si la completó correctamente, se le otorgará un puntaje de evaluación.

Cree un conjunto de datos de BigQuery

Cree un modelo

Ahora, avance a su tarea.

Haga clic en EDITOR y agregue esta consulta para crear un modelo que prediga si un visitante hará una transacción:

#standardSQL
CREATE OR REPLACE MODEL `bqml_lab.sample_model`
OPTIONS(model_type='logistic_reg') AS
SELECT
  IF(totals.transactions IS NULL, 0, 1) AS label,
  IFNULL(device.operatingSystem, "") AS os,
  device.isMobile AS is_mobile,
  IFNULL(geoNetwork.country, "") AS country,
  IFNULL(totals.pageviews, 0) AS pageviews
FROM
  `bigquery-public-data.google_analytics_sample.ga_sessions_*`
WHERE
  _TABLE_SUFFIX BETWEEN '20160801' AND '20170631'
LIMIT 100000;

Haga clic en Ejecutar.

Aquí se utiliza el sistema operativo del dispositivo del visitante (si dicho dispositivo es un dispositivo móvil), el país del visitante y el número de páginas vistas como criterio para determinar si se realizó una transacción.

En este caso, bqml_lab es el nombre del conjunto de datos y sample_model es el nombre del modelo. El tipo de modelo especificado es regresión logística binaria. En este caso, label es lo que está intentado ajustar.

Los datos de prueba se limitan a los recolectados entre el 1 de agosto de 2016 y el 30 de junio de 2017. Esto se hace a fin de guardar el último mes de datos para la "predicción". Se limita, además, a 100,000 datos para ahorrar tiempo.

La ejecución del comando CREATE MODEL crea un trabajo de consulta que se ejecutará de manera asíncrona para que pueda, por ejemplo, cerrar o actualizar la ventana de la IU de BigQuery.

Pruebe la tarea completada

Haga clic en Revisar mi progreso para verificar la tarea realizada. Si la completó correctamente, se le otorgará un puntaje de evaluación.

Cree un modelo para predecir la transacción de un visitante

Opcional: Información del modelo y estadísticas de entrenamiento

Si le interesa, puede obtener información sobre el modelo haciendo clic en bqml_lab y, luego, en el conjunto de datos sample_model en la IU. En la pestaña Detalles, debería encontrar información básica sobre el modelo y las opciones de entrenamiento utilizadas para crearlo. En ENTRENAMIENTO, debería ver una tabla similar a la siguiente:

sm-table.png

sm-graph.png

Evalúe el modelo

Reemplace la consulta anterior por la siguiente y luego haga clic en Ejecutar.

#standardSQL
SELECT
  *
FROM
  ml.EVALUATE(MODEL `bqml_lab.sample_model`, (
SELECT
  IF(totals.transactions IS NULL, 0, 1) AS label,
  IFNULL(device.operatingSystem, "") AS os,
  device.isMobile AS is_mobile,
  IFNULL(geoNetwork.country, "") AS country,
  IFNULL(totals.pageviews, 0) AS pageviews
FROM
  `bigquery-public-data.google_analytics_sample.ga_sessions_*`
WHERE
  _TABLE_SUFFIX BETWEEN '20170701' AND '20170801'));

Si la utiliza con un modelo de regresión lineal, la consulta anterior muestra las siguientes columnas:

  • mean_absolute_error, mean_squared_error, mean_squared_log_error,
  • median_absolute_error, r2_score, explained_variance.

Si la utiliza con un modelo de regresión logística, la consulta anterior muestra las siguientes columnas:

  • precision, recall
  • accuracy, f1_score
  • log_loss, roc_auc

Consulte el glosario de aprendizaje automático o ejecute una búsqueda de Google para comprender cómo se calcula y qué significa cada una de estas métricas.

Se dará cuenta de que las partes SELECT y FROM de la consulta son idénticas a la utilizada durante el entrenamiento. La parte WHERE refleja el cambio en el período y la parte FROM muestra que está llamando a ml.EVALUATE.

Debería ver una tabla similar a la siguiente:

40b9e88efb1252e6.png

Pruebe la tarea completada

Haga clic en Revisar mi progreso para verificar la tarea realizada. Si la completó correctamente, se le otorgará un puntaje de evaluación.

Evalúe el modelo

Use el modelo

Prediga compras por país

Con esta consulta, intentará predecir el número de transacciones realizadas por visitantes de cada país, ordenar los resultados y seleccionar los 10 países que realizaron más compras:

Reemplace la consulta anterior por la siguiente y luego haga clic en Ejecutar.

#standardSQL
SELECT
  country,
  SUM(predicted_label) as total_predicted_purchases
FROM
  ml.PREDICT(MODEL `bqml_lab.sample_model`, (
SELECT
  IFNULL(device.operatingSystem, "") AS os,
  device.isMobile AS is_mobile,
  IFNULL(totals.pageviews, 0) AS pageviews,
  IFNULL(geoNetwork.country, "") AS country
FROM
  `bigquery-public-data.google_analytics_sample.ga_sessions_*`
WHERE
  _TABLE_SUFFIX BETWEEN '20170701' AND '20170801'))
GROUP BY country
ORDER BY total_predicted_purchases DESC
LIMIT 10;

Esta consulta es muy parecida a la consulta de evaluación demostrada en la sección anterior. En lugar de ml.EVALUATE, utiliza ml.PREDICT y la parte BQML de la consulta se une con comandos de SQL estándar. En este lab, le interesan el país y la suma de compras por país, por lo que se utilizan SELECT, GROUP BY y ORDER BY. LIMIT para garantizar que obtenga solo los 10 resultados principales.

Debería ver una tabla similar a la siguiente:

country-list.png

Pruebe la tarea completada

Haga clic en Revisar mi progreso para verificar la tarea realizada. Si la completó correctamente, se le otorgará un puntaje de evaluación.

Prediga compras por país

Prediga compras por usuario

A continuación, se muestra otro ejemplo. Esta vez, intentará predecir el número de transacciones realizada por cada visitante, ordenar los resultados y seleccionar los 10 visitantes que más transacciones realizan:

Reemplace la consulta anterior por la siguiente y luego haga clic en Ejecutar.

#standardSQL
SELECT
  fullVisitorId,
  SUM(predicted_label) as total_predicted_purchases
FROM
  ml.PREDICT(MODEL `bqml_lab.sample_model`, (
SELECT
  IFNULL(device.operatingSystem, "") AS os,
  device.isMobile AS is_mobile,
  IFNULL(totals.pageviews, 0) AS pageviews,
  IFNULL(geoNetwork.country, "") AS country,
  fullVisitorId
FROM
  `bigquery-public-data.google_analytics_sample.ga_sessions_*`
WHERE
  _TABLE_SUFFIX BETWEEN '20170701' AND '20170801'))
GROUP BY fullVisitorId
ORDER BY total_predicted_purchases DESC
LIMIT 10;

Debería ver una tabla similar a la siguiente:

visitor-list.png

Pruebe la tarea completada

Haga clic en Revisar mi progreso para verificar la tarea realizada. Si la completó correctamente, se le otorgará un puntaje de evaluación.

Prediga compras por usuario

Ponga a prueba sus conocimientos

A continuación, se presentan algunas preguntas de opción múltiple para reforzar sus conocimientos de los conceptos de este lab. Trate de responderlas lo mejor posible.

Esto concluye el laboratorio a su propio ritmo, Introducción al aprendizaje automático de BigQuery. Creó un modelo de regresión logística binaria, evaluó el modelo y utilizó el modelo para hacer predicciones.

¡Felicitaciones!

Esto concluye el laboratorio a su propio ritmo, Introducción al aprendizaje automático de BigQuery. Creó un modelo de regresión logística binaria, evaluó el modelo y utilizó el modelo para hacer predicciones.

BigQueryBasicsforMachineLearning-125x135.png

Finalice su Quest

Este lab de autoaprendizaje es parte de la Quest BigQuery for Machine Learning de Qwiklabs. Una Quest es una serie de labs relacionados que forman una ruta de aprendizaje. Si completa esta Quest, obtendrá la insignia que se muestra arriba como reconocimiento de su logro. Puede hacer públicas sus insignias y agregar vínculos a ellas en su currículum en línea o en sus cuentas de redes sociales. Inscríbase en esta Quest y obtenga un crédito inmediato de finalización si realizó este lab. Consulte otras Quests de Qwiklabs disponibles.

Próximos pasos/Más información

Google Cloud Training & Certification

Aproveche al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarlo a ponerse en marcha rápidamente y a seguir aprendiendo. Para que pueda realizar nuestros cursos cuando más le convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: según demanda, presenciales y virtuales. Las certificaciones lo ayudan a validar y demostrar sus habilidades y experiencia en las tecnologías de Google Cloud.

Última actualización del manual: 03 de marzo de 2022
Prueba más reciente del lab: 03 de marzo de 2022

Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.