Acesse mais de 700 laboratórios e cursos

Treinamento contínuo usando os modelos do TensorFlow, PyTorch, XGBoost e Scikit-learn com o Kubeflow e o AI Platform Pipelines

Laboratório 2 horas universal_currency_alt 5 créditos show_chart Introdutório

info Este laboratório pode incorporar ferramentas de IA para ajudar no seu aprendizado.

Visão geral
Configuração e requisitos
Tarefa 1: criar um bucket do Cloud Storage
Tarefa 2: ativar serviços do Cloud
Tarefa 3: criar uma instância de Pipelines do AI Platform
Tarefa 4: criar uma instância de Notebooks do Vertex AI Platform.
Tarefa 5: Clonar o repositório de exemplo na sua instância de notebooks do AI Platform
Tarefa 6: navegar até o notebook do laboratório
Tarefa 7: executar o job de treinamento na nuvem
Parabéns!
Finalize o laboratório

Acesse mais de 700 laboratórios e cursos

Visão geral

Neste laboratório, vamos criar aplicativos de treinamento conteinerizados para modelos de ML no TensorFlow, PyTorch, XGBoost e Scikit-learn. Depois vamos usar essas imagens como ops em um pipeline do KubeFlow e treinar vários modelos paralelamente. Por fim, vamos configurar execuções recorrentes do pipeline do Kubeflow na IU.

Objetivos:

criar o script de treinamento;
empacotar o script de treinamento como uma imagem do Docker;
criar e enviar a imagem de treinamento para o Container Registry do Google Cloud;
criar um pipeline do Kubeflow que consulta o BigQuery para criar divisões de treinamento/validação e exportar os resultados como um arquivo CSV fragmentado no GCS;
lançar um job de treinamento da AI Platform com quatro aplicativos de treinamento conteinerizados usando os dados do CSV exportados como entrada.

Configuração e requisitos

Para cada laboratório, você recebe um novo projeto do Google Cloud e um conjunto de recursos por um determinado período e sem custos financeiros.

Faça login no Qwiklabs em uma janela anônima.
Confira o tempo de acesso do laboratório (por exemplo, 1:15:00) e finalize todas as atividades nesse prazo.
Não é possível pausar o laboratório. Você pode reiniciar o desafio, mas vai precisar refazer todas as etapas.
Quando tudo estiver pronto, clique em Começar o laboratório.
Anote as credenciais (Nome de usuário e Senha). É com elas que você vai fazer login no Console do Google Cloud.
Clique em Abrir Console do Google.
Clique em Usar outra conta, depois copie e cole as credenciais deste laboratório nos locais indicados.
Se você usar outras credenciais, vai receber mensagens de erro ou cobranças.
Aceite os termos e pule a página de recursos de recuperação.

Ativar o Cloud Shell

O Cloud Shell é uma máquina virtual que contém ferramentas para desenvolvedores. Ele tem um diretório principal permanente de 5 GB e é executado no Google Cloud. O Cloud Shell oferece aos seus recursos do Google Cloud acesso às linhas de comando. A gcloud é a ferramenta ideal para esse tipo de operação no Google Cloud. Ela vem pré-instalada no Cloud Shell e aceita preenchimento com tabulação.

No painel de navegação do Console do Google Cloud, clique em Ativar o Cloud Shell ().
Clique em Continuar.
O provisionamento e a conexão do ambiente podem demorar um pouco. Quando esses processos forem concluídos, você já vai ter uma autenticação, e o projeto estará definido com seu PROJECT_ID. Por exemplo:

Terminal do Cloud Shell

Exemplo de comandos

Liste o nome da conta ativa:

gcloud auth list

(Saída)

Credentialed accounts: - <myaccount>@<mydomain>.com (active)

(Exemplo de saída)

Credentialed accounts: - google1623327_student@qwiklabs.net

Liste o ID do projeto:

gcloud config list project

(Saída)

[core] project = <project_ID>

(Exemplo de saída)

[core] project = qwiklabs-gcp-44776a13dea667a6

Para ver a documentação completa do gcloud, consulte a visão geral da ferramenta de linha de comando gcloud.

Tarefa 1: criar um bucket do Cloud Storage

No Cloud Shell, execute o comando a seguir para criar um bucket do Cloud Storage. Para facilitar, o bucket deve ser público.

PROJECT_ID=`gcloud config list --format 'value(core.project)'` gsutil mb -p $PROJECT_ID gs://$PROJECT_ID gsutil acl ch -u AllUsers:R gs://$PROJECT_ID

Teste as tarefas concluídas: criar um bucket do Cloud Storage

Clique em Verificar meu progresso para conferir o objetivo. Criar um bucket do Cloud Storage.

Tarefa 2: ativar serviços do Cloud

Agora execute os comandos a seguir para ativar os serviços necessários do Cloud:

gcloud services enable \ cloudbuild.googleapis.com \ container.googleapis.com \ cloudresourcemanager.googleapis.com \ iam.googleapis.com \ containerregistry.googleapis.com \ containeranalysis.googleapis.com \ ml.googleapis.com \ dataflow.googleapis.com

Adicione a permissão de editor em sua conta de serviço do Cloud Build:

PROJECT_NUMBER=$(gcloud projects describe $PROJECT_ID --format="value(projectNumber)") CLOUD_BUILD_SERVICE_ACCOUNT="${PROJECT_NUMBER}@cloudbuild.gserviceaccount.com" gcloud projects add-iam-policy-binding $PROJECT_ID \ --member serviceAccount:$CLOUD_BUILD_SERVICE_ACCOUNT \ --role roles/editor

Clique em Verificar meu progresso para conferir o objetivo. Adicione a permissão de editor em uma conta de serviço do Cloud Build.

Tarefa 3: criar uma instância de Pipelines do AI Platform

No menu de navegação do console do Google Cloud (), role para baixo até AI Platform e fixe a seção para facilitar o acesso ao laboratório.
Acesse AI Platform > Pipelines.
Depois clique em Nova instância.
Clique em Configurar.
Para criar um cluster, selecione Zona como . Em seguida, marque a opção Permitir acesso às seguintes APIs do Cloud, não mude o nome e clique em Criar novo cluster.

Observação: a criação do cluster leva de 3 a 5 minutos. Antes de continuar, espere esse processo ser concluído.

Role até a parte de baixo da página, aceite os termos do Marketplace e clique em Implantar. Você verá cada serviço do KFP implantado no seu cluster do GKE. Aguarde a implantação ser concluída antes de seguir para a próxima tarefa.
No Cloud Shell, execute este comando para configurar o acesso à linha de comando kubectl:

gcloud container clusters get-credentials cluster-1 --zone {{{project_0.default_zone|place_holder_text}}} --project {{{project_0.project_id|place_holder_text}}}

No Cloud Shell, execute o comando abaixo para conseguir o ENDPOINT da implantação do KFP:

kubectl describe configmap inverse-proxy-config | grep googleusercontent.com

Importante: na tarefa 6, você precisará configurar o endpoint do KFP em uma das células do Notebook. Não se esqueça de usar a saída acima como seu ENDPOINT.

Clique em Verificar meu progresso para conferir o objetivo. Crie uma instância do AI Platform Pipelines

Tarefa 4: criar uma instância de Notebooks do Vertex AI Platform.

Uma instância de notebooks da Vertex AI Platform é usada como um workbench principal de experimentação/desenvolvimento.

No console do Cloud, abra o Menu de navegação e selecione Vertex AI > Workbench.
Clique em ATIVAR A API NOTEBOOKS caso ainda não tenha feito isso.
Na página "Workbench", clique em CRIAR NOVA.
Na caixa de diálogo Nova instância, selecione como a Região e selecione como a Zona.
Em seguida, selecione Debian 10 como o sistema operacional e Python 3 (com Intel MKL e CUDA 11.3) como o ambiente.
Mantenha os outros campos como padrão e clique em Criar.

Observação: a instância do notebook pode levar até cinco minutos para aparecer. Observação: aguarde até que a instância esteja disponível antes de prosseguir para a próxima etapa.

Clique em Abrir o JupyterLab. Uma janela do JupyterLab será aberta em uma nova guia.
Quando o pop-up "Build recomendado" aparecer, clique em Build. Se houver uma falha nesse processo, ela poderá ser ignorada.

Clique em Verificar meu progresso para conferir o objetivo. Crie uma instância de Notebooks do AI Platform

Tarefa 5: Clonar o repositório de exemplo na sua instância de notebooks do AI Platform

Siga estas instruções para clonar o notebook mlops-on-gcp na sua instância do JupyterLab:

No JupyterLab, clique no ícone Terminal para abrir um novo terminal.
No prompt da linha de comando, digite o código abaixo e pressione Enter.
git clone https://github.com/GoogleCloudPlatform/mlops-on-gcp Observação: se o repositório clonado não aparecer na interface do JupyterLab, use o menu da parte de cima da tela e acesse Git > Clonar um repositório para realizar o processo (https://github.com/GoogleCloudPlatform/mlops-on-gcp) usando a UI.
Para confirmar que você clonou o repositório, clique duas vezes no diretório mlops-on-gcp e confira se o conteúdo dele aparece. Os arquivos de todos os laboratórios com notebooks do Jupyter deste curso estão nesse diretório.

Execute o comando a seguir para instalar os pacotes necessários.
pip install kfp==0.2.5 fire gcsfs requests-toolbelt==0.10.1

Tarefa 6: navegar até o notebook do laboratório

Na IU do JupyterLab, navegue até mlops-on-gcp/continuous_training/kubeflow/labs e abra multiple_frameworks_lab.ipynb.
Limpe todas as células do notebook (procure o botão "Limpar" na barra de ferramentas do notebook) e execute as células uma a uma. Observe que há um #TODO em algumas células solicitando que você escreva o código antes da execução.
Quando solicitado, volte a estas instruções para verificar seu progresso.

Se precisar de mais ajuda, confira a solução completa em mlops-on-gcp/continuous_training/kubeflow/solutions e abra multiple_frameworks_kubeflow.ipynb.

Tarefa 7: executar o job de treinamento na nuvem

Teste as tarefas concluídas: crie uma tabela e um conjunto de dados do BigQuery, gere as imagens e as envie para o Container Registry do seu projeto

Clique em Verificar meu progresso para conferir o objetivo. Crie um conjunto de dados do BigQuery, uma tabela, as imagens e as envie para o Container Registry do seu projeto

Teste as tarefas concluídas: implantar o pipeline do KubeFlow

Clique em Verificar meu progresso para conferir o objetivo. Implantar o pipeline do KubeFlow

Teste as tarefas concluídas: criar execuções de pipelines

Clique em Verificar meu progresso para conferir o objetivo. Criar execuções de pipelines

Parabéns!

Neste laboratório, você aprendeu a desenvolver, empacotar como uma imagem do Docker e executar um aplicativo de treinamento no AI Platform Training.

Finalize o laboratório

Após terminar seu laboratório, clique em End Lab. O Qwiklabs removerá os recursos usados e limpará a conta para você.

Você poderá avaliar sua experiência neste laboratório. Basta selecionar o número de estrelas, digitar um comentário e clicar em Submit.

O número de estrelas indica o seguinte:

1 estrela = muito insatisfeito
2 estrelas = insatisfeito
3 estrelas = neutro
4 estrelas = satisfeito
5 estrelas = muito satisfeito

Feche a caixa de diálogo se não quiser enviar feedback.

Para enviar seu feedback, fazer sugestões ou correções, use a guia Support.

Copyright 2020 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.

Treinamento contínuo usando os modelos do TensorFlow, PyTorch, XGBoost e Scikit-learn com o Kubeflow e o AI Platform Pipelines

Treinamento contínuo usando os modelos do TensorFlow, PyTorch, XGBoost e Scikit-learn com o Kubeflow e o AI Platform Pipelines

Visão geral

Objetivos:

Configuração e requisitos

Ativar o Cloud Shell

Exemplo de comandos

Tarefa 1: criar um bucket do Cloud Storage

Teste as tarefas concluídas: criar um bucket do Cloud Storage

Tarefa 2: ativar serviços do Cloud

Tarefa 3: criar uma instância de Pipelines do AI Platform

Tarefa 4: criar uma instância de Notebooks do Vertex AI Platform.

Tarefa 5: Clonar o repositório de exemplo na sua instância de notebooks do AI Platform

Tarefa 6: navegar até o notebook do laboratório

Tarefa 7: executar o job de treinamento na nuvem

Teste as tarefas concluídas: crie uma tabela e um conjunto de dados do BigQuery, gere as imagens e as envie para o Container Registry do seu projeto

Teste as tarefas concluídas: implantar o pipeline do KubeFlow

Teste as tarefas concluídas: criar execuções de pipelines

Parabéns!

Finalize o laboratório

Antes de começar

Usar a navegação anônima

Fazer login no console

Use a navegação anônima para executar o laboratório