04
Modernizing Data Lakes and Data Warehouses with Google Cloud - Italiano
04
Modernizing Data Lakes and Data Warehouses with Google Cloud - Italiano
I due componenti chiave di qualsiasi pipeline di dati sono costituiti dai data lake e dai data warehouse. In questo corso evidenzieremo i casi d'uso per ogni tipo di spazio di archiviazione e approfondiremo i dettagli tecnici delle soluzioni di data lake e data warehouse disponibili su Google Cloud. Inoltre, descriveremo il ruolo di un data engineer, illustreremo i vantaggi di una pipeline di dati di successo per le operazioni aziendali ed esamineremo i motivi per cui il data engineering dovrebbe essere eseguito in un ambiente cloud.
Questo è il primo corso della serie Data Engineering on Google Cloud. Dopo il completamento di questo corso, iscriviti al corso Building Batch Data Pipelines on Google Cloud.
- Capire la differenza tra data lake e data warehouse.
- Esplorare i casi d'uso per ogni tipo di spazio di archiviazione e le soluzioni di data lake e data warehouse disponibili su Google Cloud.
- Discutere il ruolo di un data engineer e i vantaggi di una pipeline di dati di successo per le operazioni aziendali.
- Esaminare i motivi per cui il data engineering dovrebbe avvenire in un ambiente cloud.
Per trarre vantaggio da questo corso, i partecipanti devono aver completato "Nozioni fondamentali su Big Data e machine learning di Google Cloud" o possedere un'esperienza equivalente. Il partecipante deve inoltre possedere • Una buona conoscenza di base dei linguaggi di query più comuni, come SQL. • Esperienza nelle attività di modellazione dei dati ed ETL (Extract, Transform, Load). • Esperienza nello sviluppo di applicazioni mediante un linguaggio di programmazione comune, come Python. • Familiarità con il machine learning e/o la statistica.