04
Modernizing Data Lakes and Data Warehouses with Google Cloud - 日本語版
04
Modernizing Data Lakes and Data Warehouses with Google Cloud - 日本語版
すべてのデータ パイプラインには、データレイクとデータ ウェアハウスという 2 つの主要コンポーネントがあります。このコースでは、各ストレージ タイプのユースケースを紹介し、Google Cloud で利用可能なデータレイクとデータ ウェアハウスのソリューションを技術的に詳しく説明します。また、データ エンジニアの役割や、効果的なデータ パイプラインが事業運営にもたらすメリットについて確認し、クラウド環境でデータ エンジニアリングを行うべき理由を説明します。
これは「Data Engineering on Google Cloud」シリーズの最初のコースです。このコースを修了したら、「Building Batch Data Pipelines on Google Cloud」コースに登録してください。
- データレイクとデータ ウェアハウスの違いを確認する。
- 各ストレージ タイプのユースケースのほか、Google Cloud で利用可能なデータレイクとデータ ウェアハウスのソリューションを確認する。
- データ エンジニアの役割と、効果的なデータ パイプラインが事業運営にもたらすメリットについて検討する。
- クラウド環境でデータ エンジニアリングを行うべき理由を確認する。
このコースを有効に活用するには、「Google Cloud Big Data and Machine Learning Fundamentals」を修了しているか、同等の経験を有している必要があります。参加者には次の要件もあります。• SQL などの一般的なクエリ言語の基本的なスキルがある。• データ モデリングと ETL(抽出、変換、読み込み)アクティビティの経験がある。• Python などの一般的なプログラミング言語を使用してアプリケーションを開発した経験がある。• ML と統計の一方または両方の基本知識がある。