Os pipelines de dados geralmente se encaixam em um desses três paradigmas: extração e carregamento (EL), extração, carregamento e transformação (ELT) ou extração, transformação e carregamento (ETL). Este curso descreve qual paradigma deve ser usado em determinadas situações e quando isso ocorre com dados em lote. Além disso, vamos falar sobre várias tecnologias no Google Cloud para transformação de dados, incluindo o BigQuery, a execução do Spark no Dataproc, gráficos de pipeline no Cloud Data Fusion e processamento de dados sem servidor com o Dataflow. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados no Google Cloud usando o Qwiklabs.
A incorporação de machine learning em pipelines de dados aumenta a capacidade de extrair insights dessas informações. Neste curso, mostramos as várias formas de incluir essa tecnologia em pipelines de dados do Google Cloud. Para casos de pouca ou nenhuma personalização, vamos falar sobre o AutoML. Para usar recursos de machine learning mais personalizados, vamos apresentar os Notebooks e o machine learning do BigQuery (BigQuery ML). No curso, você também vai aprender sobre a produção de soluções de machine learning usando a Vertex AI.
Este é o segundo curso da série "Data to Insights". Vamos aprender a fazer a ingestão de novos conjuntos de dados externos no BigQuery e visualizá-los no Looker Studio. Também vamos analisar conceitos intermediários de SQL, como as operações JOIN e UNION em várias tabelas, para analisar dados de diversas fontes. Observação: Mesmo que você tenha experiência em SQL, há aspectos específicos do BigQuery (como usar o cache de consultas e os caracteres curinga de tabela) que podem ser novidade para você. Depois de terminar este curso, faça sua inscrição no "Achieving Advanced Insights with BigQuery".
Este é o primeiro de uma série de três cursos sobre processamento de dados sem servidor com o Dataflow. Nele, vamos relembrar o que é o Apache Beam e qual é a relação entre ele e o Dataflow. Depois, falaremos sobre a visão do Apache Beam e os benefícios do framework de portabilidade desse modelo de programação. Com esse processo, o desenvolvedor pode usar a linguagem de programação favorita com o back-end de execução que quiser. Em seguida, mostraremos como o Dataflow permite a separação entre a computação e o armazenamento para economizar dinheiro. Além disso, você vai aprender como as ferramentas de identidade, acesso e gerenciamento interagem com os pipelines do Dataflow. Por fim, vamos ver como implementar o modelo de segurança ideal para seu caso de uso no Dataflow.
Neste curso, conhecemos os desafios mais comuns enfrentados pelos analistas de dados e como resolvê-los com as ferramentas de big data no Google Cloud. Ao longo do caminho, você vai aprender um pouco de SQL e se familiarizar com o uso do BigQuery e do Dataprep para analisar e transformar seus conjuntos de dados. Este é o primeiro curso da série From Data to Insights with Google Cloud. Depois de concluir este curso, inscreva-se no curso Creating New BigQuery Datasets and Visualizing Insights.
Os dois principais componentes de um pipeline de dados são data lakes e warehouses. Neste curso, destacamos os casos de uso para cada tipo de armazenamento e as soluções de data lake e warehouse disponíveis no Google Cloud de forma detalhada e técnica. Além disso, também descrevemos o papel de um engenheiro de dados, os benefícios de um pipeline de dados funcional para operações comerciais e analisamos por que a engenharia de dados deve ser feita em um ambiente de nuvem. Este é o primeiro curso da série "Engenharia de dados no Google Cloud". Após a conclusão, recomendamos que você comece o curso "Como criar pipelines de dados em lote no Google Cloud".
O processamento de dados de streaming é cada vez mais usado pelas empresas para gerar métricas sobre as operações comerciais em tempo real. Neste curso, você vai aprender a criar pipelines de dados de streaming no Google Cloud. O Pub/Sub é apresentado como a ferramenta para gerenciar dados de streaming de entrada. No curso, também abordamos a aplicação de agregações e transformações a dados de streaming usando o Dataflow, além de formas de armazenar registros processados no BigQuery ou no Bigtable para análise. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados de streaming no Google Cloud usando o Qwiklabs.
As pessoas estão muito animadas com a tecnologia de nuvem e a transformação digital, mas também ainda têm muitas dúvidas. Exemplo: O que é a tecnologia de nuvem? O que significa transformação digital? Como a tecnologia de nuvem pode ajudar sua organização? Por onde começar? Se você já se questionou sobre isso, veio ao lugar certo. Este curso fornece uma visão geral dos tipos de oportunidades e desafios que as empresas encaram em suas jornadas de transformação digital. Se quiser saber mais sobre tecnologia de nuvem para se destacar no trabalho e ajudar a construir o futuro da sua empresa, este curso introdutório sobre transformação digital é para você. Este curso faz parte do programa de aprendizado do Cloud Digital Leader.
As tecnologias de nuvem podem agregar muito valor a uma organização e, ao combinar esse poder com dados, o potencial de crescer e criar novas experiências para os clientes é ainda maior. O curso "Exploring Data Transformation with Google Cloud" mostra como os dados agregam valor às organizações e como o Google Cloud torna esses dados eficientes e acessíveis. Este curso, que faz parte do programa de aprendizado do Cloud Digital Leader, se destina às pessoas que querem crescer na profissão e construir o futuro da empresa.