04
Modernizing Data Lakes and Data Warehouses with Google Cloud - Português Brasileiro
04
Modernizing Data Lakes and Data Warehouses with Google Cloud - Português Brasileiro
Os dois principais componentes de um pipeline de dados são data lakes e warehouses. Neste curso, destacamos os casos de uso para cada tipo de armazenamento e as soluções de data lake e warehouse disponíveis no Google Cloud de forma detalhada e técnica. Além disso, também descrevemos o papel de um engenheiro de dados, os benefícios de um pipeline de dados funcional para operações comerciais e analisamos por que a engenharia de dados deve ser feita em um ambiente de nuvem.
Este é o primeiro curso da série "Data Engineering on Google Cloud". Após a conclusão, recomendamos que você comece o curso "Building Batch Data Pipelines on Google Cloud".
- Diferenciar data lakes de data warehouses.
- Conhecer os casos de uso para cada tipo de armazenamento e as soluções de data lake e warehouse disponíveis no Google Cloud.
- Entender o papel de um engenheiro de dados e quais os benefícios de um pipeline de dados funcional para as operações comerciais.
- Analisar por que a engenharia de dados deve ser feita em um ambiente na nuvem.
Para aproveitar ao máximo este curso, os participantes devem ter concluído o "Google Cloud: Big Data and Machine Learning Fundamentals" ou ter experiência equivalente. O participante também deve ter: • proficiência básica em linguagem de consulta comum, como SQL; • experiência com atividades de modelagem de dados e ETL (extração, transformação e carregamento); • experiência com desenvolvimento de aplicativos usando uma linguagem de programação comum, como Python; • conhecimento sobre machine learning e/ou estatística.