Checkpoints
Find the 10 most recent orders
/ 20
Determine the order frequency
/ 20
Determine the total amount spent
/ 20
Create a common table expression (CTE)
/ 20
Apply a statistical method to RFM calculations
/ 20
Aplicar o método RFM para segmentar os dados do cliente
- Informações gerais da atividade
- Cenário
- Configuração
- Tarefa 1: analisar os dados
- Tarefa 2: encontrar os 10 pedidos mais recentes
- Tarefa 3: determinar a frequência dos pedidos
- Tarefa 4: determinar o valor total gasto
- Tarefa 5: criar uma CTE
- Tarefa 6: aplicar um método estatístico aos cálculos de RFM
- Conclusão
- Finalize o laboratório
Conclua este laboratório prático usando um computador ou notebook.
Só 5 tentativas são permitidas por laboratório.
É comum não acertar todas as questões na primeira tentativa e precisar refazer uma tarefa. Isso faz parte do processo de aprendizado.
Depois que o laboratório é iniciado, não é possível pausar o tempo. Depois de 1h30, o laboratório será finalizado, e você vai precisar recomeçar.
Para saber mais, confira as Dicas técnicas do laboratório.
Informações gerais da atividade
Técnicas de transformação de dados são usadas para preparar os dados de forma a tornar mais fácil para os usuários receberem respostas para suas perguntas sobre negócios com agilidade e eficiência. Um exemplo de análise de dados que muitas vezes exige transformação é a segmentação de clientes.
A segmentação é o processo de dividir dados em grupos com base em características em comum, que pode ser feito para diversos fins, como entender o comportamento dos clientes, identificar tendências e segmentar campanhas de marketing.
O método RFM é uma técnica de segmentação de clientes que significa tempo decorrido desde a última visita, frequência e valor monetário. O tempo decorrido desde a última visita se refere ao tempo desde a última compra do cliente. Frequência se refere ao número de compras que o cliente fez. Valor monetário se refere ao valor total de dinheiro que o cliente gastou.
O método RFM é uma abordagem focada em dados para a segmentação de clientes que pode ser usada para identificar os clientes com mais chances de desistir, com maior potencial de fazer um upsell ou uma venda cruzada. Além disso, pode ser usado para segmentar campanhas de marketing com mais eficácia.
Neste laboratório, você vai usar o BigQuery para aplicar o método RFM e segmentar os dados dos clientes para ajudar a equipe de marketing a decidir a melhor forma de concentrar seus esforços.
Cenário
A TheLook eCommerce constatou um crescimento rápido no número de clientes nos últimos anos, mas, apesar desse crescimento, a retenção e a satisfação dos clientes caíram.
Como analista de dados em nuvem na TheLook eCommerce, você recebeu a tarefa de colaborar com Martina, líder da equipe de marketing, para encontrar uma forma de concentrar melhor os esforços do marketing em toda a base de clientes.
Para isso, você decide fazer uma análise de RFM identificando três comportamentos de cada cliente: o tempo decorrido desde a última compra, a frequência de compras e o valor total de dinheiro gasto. O método RFM é uma técnica de segmentação de clientes que vai ajudar você a classificar clientes em quatro grupos, incluindo Clientes de alto valor, Clientes fiéis, Clientes de risco e Clientes persuasíveis.
Essa análise de RFM pode ajudar a equipe de marketing a identificar o comportamento dos clientes e focar os esforços de marketing nesses comportamentos para manter o engajamento. Para realizar a análise de RFM, você vai usar técnicas de transformação para analisar um conjunto de dados, agregar dados, mesclar dados, derivar dados e aplicar um método estatístico aos dados.
Para esta tarefa, primeiro você vai analisar os dados. Segundo, você vai usar a tabela de pedidos para determinar os pedidos mais recentes e a frequência com que os clientes fazem pedidos. Em terceiro lugar, você vai usar uma junção interna para deduzir o valor total pago pelos 10 principais clientes em 2022. Quarto, você vai criar uma expressão de tabela comum (CTE, na sigla em inglês) para consolidar os resultados da consulta. Por fim, você vai aplicar um método estatístico aos cálculos de RFM para a segmentação de clientes.
Configuração
Antes de clicar em "Começar o laboratório"
Leia as instruções a seguir. Os laboratórios são cronometrados e não podem ser pausados. O timer é iniciado quando você clica em Começar o laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.
Neste laboratório prático, você pode fazer as atividades por conta própria em um ambiente cloud de verdade, não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.
Confira os requisitos para concluir o laboratório:
- Acesso a um navegador de Internet padrão (recomendamos o Chrome).
- Tempo para concluir o laboratório---não se esqueça: depois de começar, não será possível pausar o laboratório.
Como iniciar seu laboratório e fazer login no console do Google Cloud
-
Clique no botão Começar o laboratório. No painel Detalhes do laboratório à esquerda, você verá o seguinte:
- Tempo restante
- O botão Abrir console do Google Cloud
- As credenciais temporárias que você vai usar neste laboratório
- Outras informações, se forem necessárias
Observação: se for preciso pagar pelo laboratório, um pop-up vai aparecer para você escolher a forma de pagamento. -
Se você estiver usando o navegador Chrome, clique em Abrir console do Google Cloud (ou clique com o botão direito do mouse e selecione Abrir link em uma janela anônima). A página de login será aberta em uma nova guia do navegador.
Dica: é possível organizar as guias em janelas separadas, lado a lado, para alternar facilmente entre elas.
Observação: se a caixa de diálogo Escolha uma conta aparecer, clique em Usar outra conta. -
Se necessário, copie o Nome de usuário do Google Cloud abaixo e cole na caixa de diálogo de login. Clique em Próximo.
Você também encontra o Nome de usuário do Google Cloud no painel Detalhes do laboratório.
- Copie a Senha do Google Cloud abaixo e cole na caixa de diálogo seguinte. Clique em Próximo.
Você também encontra a Senha do Google Cloud no painel Detalhes do laboratório.
- Nas próximas páginas:
- Aceite os Termos e Condições
- Não adicione opções de recuperação nem autenticação de dois fatores nesta conta temporária
- Não se inscreva em testes gratuitos
Depois de alguns instantes, o console será aberto nesta guia.
Tarefa 1: analisar os dados
Nesta tarefa, você vai analisar os dados disponíveis no conjunto de dados thelook_ecommerce.
- No console do Cloud, no Menu de navegação (), selecione BigQuery.
-
Expanda a lista de conjuntos de dados clicando na seta suspensa ao lado do ID do projeto.
-
Role a página até o conjunto de dados thelook_ecommerce, expanda ele e estude as tabelas listadas.
Observe as tabelas orders e order_items quando o conjunto de dados for aberto.
-
Selecione a tabela orders e analise as guias Esquema, Detalhes e Visualização.
-
Na guia Esquema, perceba as colunas na tabelas, listadas na coluna Nome do campo. Estude as colunas e as informações de Tipo.
-
Selecione a guia Detalhes e estude as seções Informações da tabela e Informações do armazenamento.
-
Selecione a guia Visualização, que mostra as primeiras mil linhas de uma tabela.
-
No painel Explorador, selecione a tabela order_items e analise as guias Esquema, Detalhes e Visualização.
Tarefa 2: encontrar os 10 pedidos mais recentes
O tempo decorrido desde a última visita se refere ao tempo desde a última compra do cliente. Ele é medido em unidades de tempo como dias, semanas ou meses. Uma pontuação maior indica que um cliente fez uma compra mais recente.
Nesta tarefa, você vai calcular o tempo decorrido desde os pedidos dos clientes para determinar se um cliente fez um pedido recentemente. Por exemplo, se a última compra do cliente foi há 400 dias, a pontuação dele é 400.
- No BigQuery Studio, clique em + Escrever nova consulta. Uma nova guia Sem título é aberta.
- Copie a consulta a seguir no Editor de consultas. Reserve um momento para analisar o código SQL. Você consegue prever como serão os resultados da consulta?
- Clique em Executar.
Na seção Resultados da consulta da guia Resultados, uma tabela mostra os 10 clientes que fizeram um pedido há mais tempo.
Clique em Verificar meu progresso para confirmar que você concluiu a tarefa corretamente.
Tarefa 3: determinar a frequência dos pedidos
Clientes que fazem pedidos com maior frequência são considerados mais engajados com a marca e têm mais chances de fazer novas compras no futuro.
Nesta tarefa, você vai determinar a frequências dos pedidos dos clientes, ou seja, vai contar o número total de pedidos que cada cliente fez. Por exemplo, se um cliente fez 10 pedidos separados, a frequência desse cliente é 10.
- Copie a consulta a seguir no Editor de consultas. Reserve um momento para analisar o código SQL. Você consegue prever como serão os resultados da consulta?
- Clique em Executar.
Clique em Verificar meu progresso para confirmar que você concluiu a tarefa corretamente.
Tarefa 4: determinar o valor total gasto
Valor em dinheiro é o valor total que um cliente gastou com uma empresa em determinado período. Identificar os clientes que gastaram mais dinheiro pode ajudar as empresas a melhorar o relacionamento com os clientes e segmentar os esforços de marketing para os clientes mais lucrativos.
Nesta tarefa, você vai determinar o valor total de dinheiro gasto em 2022 pelos 10 principais clientes. Para isso, você vai usar uma junção interna para conectar as tabelas "order" e "order_items". Você também vai precisar usar o método SUM()
para somar o preço de venda.
- Copie a consulta a seguir no Editor de consultas. Copie a consulta a seguir no Editor de consultas. Reserve um momento para analisar o código SQL. Você consegue prever como serão os resultados da consulta?
- Clique em Executar.
Clique em Verificar meu progresso para confirmar que você concluiu a tarefa corretamente.
Tarefa 5: criar uma CTE
Uma CTE, ou expressão de tabela comum, é um conjunto temporário de resultados em uma consulta SQL. Para criá-la, use uma cláusula WITH
e uma instrução SELECT
nomeada. CTEs geralmente são incluídas em outras instruções SELECT
. Elas tornam mais fácil escrever consultas mais complexas sem precisar criar uma nova tabela.
Nesta tarefa, você vai usar uma CTE para escrever uma consulta que combina os cálculos de tempo decorrido desde a última compra, frequência e valor em dinheiro que você fez antes.
- Copie a consulta a seguir no Editor de consultas. Reserve um momento para analisar o código SQL. Você consegue prever como serão os resultados da consulta?
- Clique em Executar.
Clique em Verificar meu progresso para confirmar que você concluiu a tarefa corretamente.
Tarefa 6: aplicar um método estatístico aos cálculos de RFM
Valores de RFM medem o tempo desde a última compra de um cliente, a frequência com que esse cliente faz compras e quanto ele gastou em cada compra. Quantis dividem um conjunto de dados em partes iguais. Por exemplo, tercis dividem um conjunto de dados em três partes iguais e quartis dividem em quatro partes iguais.
Nesta tarefa, você vai segmentar os clientes neste exemplo usando os valores de RFM e quantis. Você vai usar a função NTILE()
no BigQuery para calcular os quantis dos valores de RFM. Assim, poderá entender melhor como os clientes estão distribuídos em termos dos valores de RFM.
Para isso, crie uma nova CTE chamada rfm_quant
. Ela vai usar a função NTILE()
para calcular os quantis dos valores de RFM na CTE "rfm_calc" que você criou na etapa anterior.
Depois de criar a CTE rfm_quant
, você pode usá-la para segmentar os clientes.
Por fim, use a instrução CASE
para atribuir nomes de categorias de segmentação de clientes com base nos quantis produzidos. Uma instrução CASE
é uma instrução SQL que permite avaliar várias condições e retornar um valor diferente com base nas condições atendidas.
- Copie a consulta a seguir no Editor de consultas:
- Clique em Executar.
Clique em Verificar meu progresso para confirmar que você concluiu a tarefa corretamente.
Conclusão
Bom trabalho!
Você ajudou a Martina a entender melhor os clientes segmentando os dados.
Primeiro, você analisou os dados.
Segundo, você usou a tabela de pedidos para determinar os pedidos mais recentes e a frequência com que os clientes fazem pedidos.
Terceiro, você usou uma junção interna para deduzir o valor total pago pelos 10 principais clientes em 2022.
Quarto, você criou uma CTE para consolidar os resultados da consulta.
Por fim, você aplicou um método estatístico aos cálculos de RFM para a segmentação de clientes.
Agora você tem experiência prática em usar o BigQuery para calcular o tempo desde a última compra e com que frequência os clientes fazem compras. Você também aprendeu a calcular quanto dinheiro os clientes gastaram combinando duas tabelas. Depois, usou essas tabelas e cálculos para criar uma nova tabela temporária. Isso permitiu que usasse métodos estatísticos para agrupar os clientes em segmentos.
Agora você sabe como usar o método RFM em fontes de dados no BigQuery.
Finalize o laboratório
Antes de encerrar o laboratório, certifique-se de que você concluiu todas as tarefas. Quando tudo estiver pronto, clique em Terminar o laboratório e depois em Enviar.
Depois que você finalizar um laboratório, não será mais possível acessar o ambiente do laboratório nem o trabalho que você concluiu nele.
Copyright 2024 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de empresas e produtos podem ser marcas registradas das empresas a que estão associados.