arrow_back

Criar e implantar soluções de machine learning com a Vertex AI: laboratório com desafio

Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Criar e implantar soluções de machine learning com a Vertex AI: laboratório com desafio

Lab 2 horas universal_currency_alt 5 créditos show_chart Intermediário
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP354

Laboratórios autoguiados do Google Cloud

Visão geral

Nos laboratórios com desafio, apresentamos uma situação e um conjunto de tarefas. Para concluí-las, em vez de seguir instruções passo a passo, você usará o que aprendeu nos laboratórios da Quest. Um sistema automático de pontuação (mostrado nesta página) avaliará seu desempenho.

Nos laboratórios com desafio, não ensinamos novos conceitos do Google Cloud. O objetivo dessas tarefas é aprimorar aquilo que você já aprendeu, como a alteração de valores padrão ou a leitura e pesquisa de mensagens para corrigir seus próprios erros.

Para alcançar a pontuação de 100%, você precisa concluir todas as tarefas no tempo definido.

Este laboratório é recomendado para os alunos que se inscreveram na Quest Building Machine Learning Solutions with Vertex AI. Tudo pronto para começar o desafio?

Configuração

Antes de clicar no botão Start Lab

Leia estas instruções. Os laboratórios são cronometrados e não podem ser pausados. O timer é iniciado quando você clica em Começar o laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.

Este laboratório prático permite que você realize as atividades em um ambiente real de nuvem, não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.

Confira os requisitos para concluir o laboratório:

  • Acesso a um navegador de Internet padrão (recomendamos o Chrome).
Observação: para executar este laboratório, use o modo de navegação anônima ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e a conta de estudante, o que poderia causar cobranças extras na sua conta pessoal.
  • Tempo para concluir o laboratório---não se esqueça: depois de começar, não será possível pausar o laboratório.
Observação: não use seu projeto ou conta do Google Cloud neste laboratório para evitar cobranças extras na sua conta.

Cenário do desafio

Recentemente, contrataram você para trabalhar na engenharia de machine learning de uma startup que tem um site de resenhas de filmes. Seu gerente pediu para você criar um modelo que classifica como positivo ou negativo o sentimento das resenhas de filmes feitas pelos usuários. Essas previsões vão ser usadas como uma entrada em sistemas que agregam avaliações de filmes e para exibir as principais críticas positivas e negativas no aplicativo do site. O desafio: você tem apenas seis semanas para produzir um modelo com mais de 75% de precisão para melhorar a solução atual desenvolvida pela empresa. Além disso, após uma análise exploratória no data warehouse da startup, você descobre que ele contém apenas um pequeno conjunto de dados com 50 mil resenhas em texto que vão servir como base para criar uma solução com melhor desempenho.

Seu desafio

Para criar e implantar rapidamente um modelo de machine learning de alto desempenho com dados limitados, você vai treinar e implantar um classificador de sentimentos personalizado BERT do TensorFlow. Ele vai realizar previsões on-line na plataforma Vertex AI do Google Cloud, que é nossa plataforma avançada de desenvolvimento de machine learning. Nela, é possível usar o AutoML e os componentes pré-criados de ML mais recentes para melhorar muito a produtividade de desempenho, a capacidade de escalonar o fluxo de trabalho e os processos de decisão com dados, além de acelerar o retorno do investimento.

Diagrama da arquitetura do laboratório

Primeiro, você vai passar por um fluxo de trabalho experimental típico. Nele, você vai criar seu modelo usando componentes BERT pré-treinados do TF-Hub e camadas de classificação do tf.keras para treinar e avaliar seu modelo em um notebook da Vertex. Em seguida, você vai empacotar o código do modelo em um contêiner do Docker para fazer o treinamento na Vertex AI do Google Cloud. Por último, você vai definir e executar um pipeline do Kubeflow no Vertex Pipelines que faz o treinamento e a implantação do seu modelo em um endpoint da Vertex que oferece previsões on-line para consultas.

Tarefa 1: crie uma instância de notebooks da Vertex AI

  1. Acesse Vertex AI > Workbench > Instâncias.

  2. Como o projeto é novo, ainda não há instâncias listadas. Clique no botão Criar novo no meio da tela. Selecione as seguintes opções:

  • Nome: vertex-ai-challenge
  • Região:
  • Zona: deixe o valor como padrão
  1. Selecione Instância em Tipo de Workbench e clique em Continuar.

  2. Selecione Usar uma versão anterior. No menu suspenso Versão, selecione workbench-instances-v20230717-debian-11-py310 (M109). Clique em Continuar.

  3. Para o tipo de máquina, escolha e2-standard-4. Clique em Criar.

Clique em Verificar meu progresso para conferir o objetivo. Crie uma instância de notebooks da Vertex AI

Tarefa 2: faça o download do Challenge Notebook

  1. No seu notebook, clique em terminal.

  2. Clone o repositório:

git clone https://github.com/GoogleCloudPlatform/training-data-analyst
  1. Para instalar os pacotes necessários para o laboratório, use este código:
cd training-data-analyst/quests/vertex-ai/vertex-challenge-lab pip install -U -r requirements.txt --user

Clique em Verificar meu progresso para conferir o objetivo. Faça o download do Challenge Notebook.

  1. Acesse a pasta: training-data-analyst/quests/vertex-ai/vertex-challenge-lab.

  2. Abra o arquivo do notebook vertex-challenge-lab.ipynb. Para o kernel a ser usado, selecione TensorFlow 2-11.

  3. Na seção Configurações, defina as variáveis PROJECT_ID, GCS_BUCKET e USER.

Todo o código REST para importar e pré-processar o conjunto de dados foi fornecido para você. As próximas etapas estão descritas no arquivo do notebook. Ao longo das tarefas, volte a esta página do laboratório para verificar seu progresso e ver algumas dicas.

Clique em Verificar meu progresso para conferir o objetivo. Importar conjunto de dados

Tarefa 3: crie e treine seu modelo localmente em um notebook da Vertex AI

Nesta seção, você vai treinar seu modelo localmente usando o TensorFlow.

Observação: este laboratório é uma adaptação e extensão do tutorial oficial de classificação de texto BERT do TensorFlow para usar os serviços da Vertex AI. Para mais detalhes, veja o tutorial sobre o ajuste de modelos BERT usando o TensorFlow.

Criar e compilar um classificador de sentimentos BERT do TensorFlow

  1. Preencha a seção #TODO para adicionar um hub.KerasLayer ao pré-processamento de texto BERT.

  2. Preencha a seção #TODO para adicionar um hub.KerasLayer à codificação de texto BERT.

  3. Preencha a seção #TODO para salvar a classificação de sentimento BERT localmente no diretório ./bert-sentiment-classifier-local.

Clique em Verificar meu progresso para conferir o objetivo. Crie e treine o modelo.

Tarefa 4: use o Cloud Build para criar e enviar seu contêiner de modelos para o Artifact Registry no Google Cloud

Criar um repositório do Artifact Registry para imagens de contêiner personalizadas

Observação: especifique as sinalizações location, repository-format e description.

Criar e enviar a imagem do contêiner para o Artifact Registry usando o Cloud Build

  • Preencha a seção #TODO para usar o Cloud Build na criação e envio do seu contêiner de modelos personalizado para o Artifact Registry. Saiba mais na documentação do gcloud builds submit.
Observação: verifique se a sinalização de configuração está direcionada para {MODEL_DIR}/cloudbuild.yaml, definido acima, e inclua seu diretório de modelos.

Clique em Verificar meu progresso para conferir o objetivo. Crie e envie a imagem do contêiner para o Artifact Registry.

Tarefa 5: defina um pipeline usando o SDK do KFP

  • Preencha a seção #TODO para adicionar e configurar o componente CustomContainerTrainingJobOp definido na célula acima.
Observação: os argumentos são iguais aos utilizados antes em CustomContainerTrainingJob. Observação: o treinamento e a implantação do modelo podem levar de 30 a 40 minutos.

Clique em Verificar meu progresso para conferir o objetivo. Defina um pipeline usando o SDK do KFP.

Tarefa 6: consulte previsões on-line em modelos implantados no endpoint da Vertex

  • Preencha a seção #TODO para gerar previsões on-line usando o endpoint da Vertex.

Parabéns!

Parabéns! Neste laboratório, você aprendeu a criar e implantar um classificador de sentimentos BERT personalizado usando a Vertex AI. Você também aprendeu a usar o Cloud Build para criar e enviar seu contêiner de modelos personalizado para o Artifact Registry e definir um pipeline usando o SDK do KFP. Agora você já sabe criar e implantar seus próprios modelos personalizados usando a Vertex AI.

Selo ML Vertex AI

Conquistar seu próximo selo de habilidade

Este laboratório autoguiado faz parte do selo de habilidade da Quest Building Machine Learning Solutions with Vertex AI. Após a conclusão, você ganha o selo de habilidade acima como reconhecimento. Compartilhe essa conquista no seu currículo e nas mídias sociais usando #GoogleCloudBadge.

Essa Quest com selo de habilidade faz parte do programa de aprendizado Data Scientist/Machine Learning Engineer do Google. Se você já completou outras Quests de selo de habilidade nesse programa de aprendizado, confira no catálogo mais de 20 Quests desse tipo disponíveis.

Treinamento e certificação do Google Cloud

Esses treinamentos ajudam você a aproveitar as tecnologias do Google Cloud ao máximo. Nossas aulas incluem habilidades técnicas e práticas recomendadas para ajudar você a alcançar rapidamente o nível esperado e continuar sua jornada de aprendizado. Oferecemos treinamentos que vão do nível básico ao avançado, com opções de aulas virtuais, sob demanda e por meio de transmissões ao vivo para que você possa encaixá-las na correria do seu dia a dia. As certificações validam sua experiência e comprovam suas habilidades com as tecnologias do Google Cloud.

Manual atualizado em 11 de novembro de 2023

Laboratório testado em 31 de outubro de 2023

Copyright 2024 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.