arrow_back

Análise de dados exploratória usando o BigQuery e as instâncias do Workbench

Acesse mais de 700 laboratórios e cursos

Análise de dados exploratória usando o BigQuery e as instâncias do Workbench

Laboratório 2 horas universal_currency_alt 1 crédito show_chart Intermediário
info Este laboratório pode incorporar ferramentas de IA para ajudar no seu aprendizado.
Acesse mais de 700 laboratórios e cursos

Visão geral

Neste laboratório, você vai aprender o processo de análise de um conjunto de dados armazenado no BigQuery usando um notebook da Instância do Workbench para fazer consultas e apresentar os dados usando várias técnicas de plotagem estatística. A análise vai ajudar você a descobrir padrões nos dados.

Objetivos de aprendizagem

  • Criar um notebook de instância do Workbench
  • Conectar-se a conjuntos de dados do BigQuery
  • Fazer análises estatísticas em um DataFrame do Pandas
  • Criar plots do Seaborn para análise de dados exploratória em Python
  • Escrever uma consulta SQL para selecionar campos específicos de um conjunto de dados do BigQuery

A Vertex AI é uma plataforma unificada para criar, implantar e gerenciar aplicativos de machine learning (ML).

Os notebooks do Vertex AI Workbench oferecem uma solução flexível e escalonável para desenvolver e implantar modelos de ML no Google Cloud. Escolha o Workbench se você precisar de mais opções de personalização e controle total sobre seu ambiente de machine learning. Ele oferece os recursos de segurança e compliance necessários para organizações corporativas e se integra a outros serviços do Google Cloud, como Vertex AI e BigQuery, para um fluxo de trabalho aprimorado de ciência de dados e machine learning.

O BigQuery é um data warehouse sem servidor, totalmente gerenciado e avançado que permite analisar e gerenciar grandes conjuntos de dados com facilidade. O BigQuery usa um dialeto SQL padrão familiar, facilitando o uso por analistas e cientistas de dados sem a necessidade de aprender uma nova linguagem.

A Vertex AI tem duas soluções de notebooks, o Workbench e o Colab Enterprise.

Colab

Workbench

O Vertex AI Workbench é uma boa opção para projetos que priorizam o controle e a personalização. Ele é ótimo para quando há vários arquivos com dependências complexas. Também é uma boa escolha para cientistas de dados que estão fazendo a transição de um laptop ou estação de trabalho para a nuvem.

As instâncias do Vertex AI Workbench vêm com um conjunto pré-instalado de pacotes de aprendizado profundo, incluindo o suporte para os frameworks TensorFlow e PyTorch.

workbench1

Configurar os ambientes do Qwiklabs

Configuração do Qwiklabs

Para cada laboratório, você recebe um novo projeto do Google Cloud e um conjunto de recursos por um determinado período e sem custos financeiros.

  1. Faça login no Qwiklabs em uma janela anônima.

  2. Confira o tempo de acesso do laboratório (por exemplo, 1:15:00) e finalize todas as atividades nesse prazo.
    Não é possível pausar o laboratório. Você pode reiniciar o desafio, mas vai precisar refazer todas as etapas.

  3. Quando tudo estiver pronto, clique em Começar o laboratório.

  4. Anote as credenciais (Nome de usuário e Senha). É com elas que você vai fazer login no Console do Google Cloud.

  5. Clique em Abrir Console do Google.

  6. Clique em Usar outra conta, depois copie e cole as credenciais deste laboratório nos locais indicados.
    Se você usar outras credenciais, vai receber mensagens de erro ou cobranças.

  7. Aceite os termos e pule a página de recursos de recuperação.

Tarefa 1: Criar um notebook do Workbench

  1. No console do Google Cloud, no Menu de navegação (Menu de navegação), clique em Vertex AI.

  2. Selecione Ativar todas as APIs recomendadas.

  3. No Menu de navegação, clique em Workbench.

    Verifique se você está na visualização Instâncias do topo da página do Workbench.

  4. Clique em caixa "adicionar"+ Criar nova.

  5. Configure a instância:

    • Nome: lab-workbench
    • Região: configure a região como
    • Zona: configure a zona como
    • Opções avançadas (opcional): se necessário, clique em "Opções avançadas" para personalizar mais (ex.: tipo de máquina, tamanho do disco).

crie uma instância do Vertex AI Workbench

  1. Clique em Criar.

O processo vai levar alguns minutos, e uma marca de confirmação verde vai aparecer ao lado do nome da instância quando ela for criada.

  1. Clique em ABRIR O JUPYTERLAB ao lado do nome da instância para iniciar a interface do ambiente. Uma nova guia será aberta no navegador.

Instância do Workbench implantada

  1. Clique no ícone do Python 3 para iniciar um novo notebook do Python.

Abrir o Jupyter Notebook

  1. Clique com o botão direito no arquivo Untitled.ipynb na barra de menus e escolha Renomear notebook para dar um nome a ele.

Renomear o notebook

Seu ambiente está configurado. Está tudo pronto para você começar a trabalhar com seu notebook do Vertex AI Workbench.

Notebook pronto para uso

Tarefa 2: Clonar o repositório na sua instância de notebooks da Vertex AI

O repositório do GitHub contém o arquivo do laboratório e os arquivos das soluções do curso.

  1. Copie e execute o código a seguir na primeira célula do notebook para clonar o repositório training-data-analyst.
!git clone https://github.com/GoogleCloudPlatform/training-data-analyst

Clonar o repositório raining-data-analyst

  1. Para confirmar que você clonou o repositório, clique duas vezes no diretório training-data-analyst e veja se o conteúdo aparece.

confirmar o repositório training-data-analyst

  1. Na interface do notebook, navegue até training-data-analyst > courses > machine_learning > deepdive2 > launching_into_ml > solutions e abra workbench_explore_data.ipynb.

  2. Ainda na interface do notebook, clique em Edit > Clear All Outputs (clique em "Edit", depois selecione "Clear All Outputs" no menu suspenso).

  3. Na caixa de diálogo Selecionar Kernel, escolha Python 3 na lista de kernels disponíveis.

  4. Leia as instruções do notebook com atenção.

Instruções do notebook

Parabéns!

Neste laboratório, você aprendeu a:

  • Criar um notebook de instância do Workbench
  • Clonar um repositório do GitHub
  • Conectar a um conjunto de dados do BigQuery
  • Fazer análises estatísticas em um DataFrame do Pandas
  • Criar plots do Seaborn para análise de dados exploratória em Python
  • Escrever uma consulta SQL para selecionar campos específicos de um conjunto de dados do BigQuery.

Finalize o laboratório

Após terminar seu laboratório, clique em End Lab. O Qwiklabs removerá os recursos usados e limpará a conta para você.

Você poderá avaliar sua experiência neste laboratório. Basta selecionar o número de estrelas, digitar um comentário e clicar em Submit.

O número de estrelas indica o seguinte:

  • 1 estrela = muito insatisfeito
  • 2 estrelas = insatisfeito
  • 3 estrelas = neutro
  • 4 estrelas = satisfeito
  • 5 estrelas = muito satisfeito

Feche a caixa de diálogo se não quiser enviar feedback.

Para enviar seu feedback, fazer sugestões ou correções, use a guia Support.

Manual atualizado em 25 de novembro de 2024

Laboratório testado em 25 de novembro de 2024

Copyright 2020 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.

Antes de começar

  1. Os laboratórios criam um projeto e recursos do Google Cloud por um período fixo
  2. Os laboratórios têm um limite de tempo e não têm o recurso de pausa. Se você encerrar o laboratório, vai precisar recomeçar do início.
  3. No canto superior esquerdo da tela, clique em Começar o laboratório

Usar a navegação anônima

  1. Copie o nome de usuário e a senha fornecidos para o laboratório
  2. Clique em Abrir console no modo anônimo

Fazer login no console

  1. Faça login usando suas credenciais do laboratório. Usar outras credenciais pode causar erros ou gerar cobranças.
  2. Aceite os termos e pule a página de recursos de recuperação
  3. Não clique em Terminar o laboratório a menos que você tenha concluído ou queira recomeçar, porque isso vai apagar seu trabalho e remover o projeto

Este conteúdo não está disponível no momento

Você vai receber uma notificação por e-mail quando ele estiver disponível

Ótimo!

Vamos entrar em contato por e-mail se ele ficar disponível

Um laboratório por vez

Confirme para encerrar todos os laboratórios atuais e iniciar este

Use a navegação anônima para executar o laboratório

Para executar este laboratório, use o modo de navegação anônima ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e a conta de estudante, o que poderia causar cobranças extras na sua conta pessoal.