Modernizzazione di data lake e data warehouse con Google Cloud
Modernizzazione di data lake e data warehouse con Google Cloud
I due componenti chiave di qualsiasi pipeline di dati sono costituiti dai data lake e dai data warehouse. In questo corso evidenzieremo i casi d'uso per ogni tipo di spazio di archiviazione e approfondiremo i dettagli tecnici delle soluzioni di data lake e data warehouse disponibili su Google Cloud. Inoltre, descriveremo il ruolo di un data engineer, illustreremo i vantaggi di una pipeline di dati di successo per le operazioni aziendali ed esamineremo i motivi per cui il data engineering dovrebbe essere eseguito in un ambiente cloud.
Questo è il primo corso della serie Data engineering su Google Cloud. Dopo il completamento di questo corso, iscriviti al corso Creazione di pipeline di dati in batch su Google Cloud.
- Capire la differenza tra data lake e data warehouse.
- Esplorare i casi d'uso per ogni tipo di spazio di archiviazione e le soluzioni di data lake e data warehouse disponibili su Google Cloud.
- Discutere il ruolo di un data engineer e i vantaggi di una pipeline di dati di successo per le operazioni aziendali.
- Esaminare i motivi per cui il data engineering dovrebbe avvenire in un ambiente cloud.
Per trarre vantaggio da questo corso, i partecipanti devono aver completato "Concetti fondamentali di Google Cloud: big data e machine learning" o possedere un'esperienza equivalente. Il partecipante deve inoltre possedere: • Una buona conoscenza di base dei linguaggi di query più comuni, come SQL. • Esperienza nelle attività di modellazione dei dati ed ETL (Extract, Transform, Load). • Esperienza nello sviluppo di applicazioni mediante un linguaggio di programmazione comune, come Python. • Familiarità con il machine learning e/o la statistica.