arrow_back

Mejora la calidad de los datos

Acceder Unirse
Obtén acceso a más de 700 labs y cursos

Mejora la calidad de los datos

Lab 45 minutos universal_currency_alt 5 créditos show_chart Introductorio
info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.
Obtén acceso a más de 700 labs y cursos

Descripción general

Los modelos de aprendizaje automático solo pueden procesar datos numéricos, que deben ser números 1 o 0. Se dice que los datos están desorganizados o desordenados cuando les faltan valores de atributos, contienen ruido o valores atípicos, tienen datos duplicados o incorrectos, incluyen nombres de columnas en mayúsculas y minúsculas, o básicamente no están preparados para que un algoritmo de aprendizaje automático los transfiera.

En este lab, presentarás y resolverás algunos de los problemas más comunes de los datos desordenados. Ten en cuenta que los distintos problemas requerirán diferentes métodos, y estos exceden el alcance de este notebook.

Objetivos

En este lab, aprenderás a hacer lo siguiente:

  • Resolver valores faltantes
  • Convertir la columna de atributos Fecha a un formato de fecha y hora
  • Cambiar el nombre de una columna de atributos y quitar un valor de una columna de atributos
  • Crear atributos con codificación one-hot
  • Comprender las conversiones de atributos temporales

Configuración y requisitos

En cada lab, recibirá un proyecto de Google Cloud y un conjunto de recursos nuevos por tiempo limitado y sin costo adicional.

  1. Accede a Qwiklabs desde una ventana de incógnito.

  2. Ten en cuenta el tiempo de acceso del lab (por ejemplo, 1:15:00) y asegúrate de finalizarlo en el plazo asignado.
    No existe una función de pausa. Si lo necesita, puede reiniciar el lab, pero deberá hacerlo desde el comienzo.

  3. Cuando esté listo, haga clic en Comenzar lab.

  4. Anote las credenciales del lab (el nombre de usuario y la contraseña). Las usarás para acceder a la consola de Google Cloud.

  5. Haga clic en Abrir Google Console.

  6. Haga clic en Usar otra cuenta, copie las credenciales para este lab y péguelas en el mensaje emergente que aparece.
    Si usa otras credenciales, se generarán errores o incurrirá en cargos.

  7. Acepta las condiciones y omite la página de recursos de recuperación.

Tarea 1. Configura tu entorno

Habilita la API de Vertex AI

  1. En el menú de navegación de la consola de Google Cloud, haz clic en Vertex AI > Panel.
  2. Haz clic en HABILITAR TODAS LAS APIS RECOMENDADAS.

Tarea 2. Inicia la instancia de Vertex AI Notebooks

  1. En el menú de navegación de la consola de Google Cloud, haz clic en Vertex AI > Workbench. Selecciona Notebooks administrados por el usuario.

  2. En la página instancias de Notebook, haz clic en Nuevo Notebook > TensorFlow Enterprise > TensorFlow Enterprise 2.11 (with LTS) > Without GPUs.

  3. En el diálogo Instancia de notebook nueva, confirma el nombre de la VM de aprendizaje profundo y, si no quieres cambiar la región ni la zona, deja todos los parámetros de configuración como están. Luego, haz clic en Crear. La VM nueva tardará 2 o 3 minutos en iniciarse.

  4. Haz clic en Abrir JupyterLab.
    Se abrirá en una pestaña nueva.

  5. Si ves una ventana emergente que indica “Build recommended”, haz clic en Build. Si ves que la compilación falló, ignórala.

Tarea 3. Clona el repo del curso en tu instancia de notebook de Vertex AI

El repo de GitHub contiene el archivo del lab y los archivos de soluciones del curso.

  1. Copia y ejecuta el siguiente código en la primera celda de tu notebook para clonar el repositorio training-data-analyst.
!git clone https://github.com/GoogleCloudPlatform/training-data-analyst

Clonar el repo training-data-analyst

  1. Para confirmar que se haya clonado el repositorio, haz doble clic en el directorio training-data-analyst y confirma que puedes ver el contenido.

confirmar el repo training-data-analyst

Tarea 4. Mejora la calidad de los datos

  1. En la interfaz del notebook, navega a training-data-analyst > courses > machine_learning > deepdive2 > launching_into_ml > labs y abre improve_data_quality.ipynb.

  2. En la interfaz del notebook, haz clic en Editar > Borrar todos los resultados.

  3. Lee con atención las instrucciones del notebook y completa con el código correspondiente las líneas que están marcadas con #TODO según sea necesario.

Nota: Sugerencias

  • Para ejecutar la celda actual, haz clic en ella y presiona MAYÚSCULAS + INTRO. Podrás encontrar otros comandos de la celda en la IU del notebook, en Ejecutar.
  • Las tareas también pueden incluir sugerencias que te orientarán. Destaca el texto para leer las sugerencias (están escritas en blanco).
  • Si necesitas más ayuda, consulta la solución completa. Para ello, navega a training-data-analyst > courses > machine_learning > deepdive2 > launching_into_ml > solutions y abre improve_data_quality.ipynb.

Finalice su lab

Cuando haya completado su lab, haga clic en Finalizar lab. Qwiklabs quitará los recursos que usó y limpiará la cuenta por usted.

Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.

La cantidad de estrellas indica lo siguiente:

  • 1 estrella = Muy insatisfecho
  • 2 estrellas = Insatisfecho
  • 3 estrellas = Neutral
  • 4 estrellas = Satisfecho
  • 5 estrellas = Muy satisfecho

Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.

Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.

Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Antes de comenzar

  1. Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
  2. .
  3. Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
  4. En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar

Usa la navegación privada

  1. Copia el nombre de usuario y la contraseña proporcionados para el lab
  2. Haz clic en Abrir la consola en modo privado

Accede a la consola

  1. Accede con tus credenciales del lab. Si usas otras credenciales, se generarán errores o se incurrirá en cargos.
  2. Acepta las condiciones y omite la página de recursos de recuperación
  3. No hagas clic en Finalizar lab, a menos que lo hayas terminado o quieras reiniciarlo, ya que se borrará tu trabajo y se quitará el proyecto

Este contenido no está disponible en este momento

Te enviaremos una notificación por correo electrónico cuando esté disponible

¡Genial!

Nos comunicaremos contigo por correo electrónico si está disponible

Un lab a la vez

Confirma para finalizar todos los labs existentes y comenzar este

Usa la navegación privada para ejecutar el lab

Usa una ventana de navegación privada o de Incógnito para ejecutar el lab. Así evitarás cualquier conflicto entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.