05
Building Batch Data Pipelines on Google Cloud - 日本語版
05
Building Batch Data Pipelines on Google Cloud - 日本語版
These skills were generated by A.I. Do you agree this course teaches these skills?
通常、データ パイプラインは、「抽出、読み込み」、「抽出、読み込み、変換」、「抽出、変換、読み込み」のいずれかの枠組みに分類できます。このコースでは、バッチデータではどの枠組みを、どのような場合に使用するのかについて説明します。本コースではさらに、BigQuery、Dataproc 上での Spark の実行、Cloud Data Fusion のパイプラインのグラフ、Dataflow でのサーバーレスのデータ処理など、データ変換用の複数の Google Cloud テクノロジーについて説明します。受講者には、Qwiklabs を使用して Google Cloud でデータ パイプラインのコンポーネントを構築する実践演習を行っていただきます。
コース情報
目標
- データ読み込みのさまざまな方法の確認: EL、ELT、ETL について、また何をどのタイミングで使用するか
- Dataproc での Hadoop の実行、Cloud Storage の活用、Dataproc ジョブの最適化
- Dataflow を使用したデータ処理パイプラインの構築
- Data Fusion と Cloud Composer を使用したデータ パイプラインの管理
前提条件
このコースを有効に活用するには、「Google Cloud Big Data and Machine Learning Fundamentals」を修了しているか、同等の経験を有している必要があります。参加者には次も必要です。• SQL などの一般的なクエリ言語の基本的なスキルがある。• データ モデリングと ETL(抽出、変換、読み込み)アクティビティの経験がある。• 一般的なプログラミング言語(Python など)を使用してアプリケーションを開発した経験がある。• 機械学習と統計の一方または両方の基本知識がある。
対象
データ処理用のパイプラインとアーキテクチャ設計を担当するデベロッパー
使用できる言語
English、español (Latinoamérica)、日本語、français、português (Brasil)、italiano、한국어
このコースを修了した後はどうすればよいですか?
コースを修了した後は、学習プログラム のその他のコンテンツを確認したり、学習カタログ を閲覧したりできます。
どのようなバッジを獲得できますか?
コースを修了すると、修了バッジが付与されます。バッジはプロフィールで確認可能で、ソーシャル ネットワークで共有していただくこともできます。
オンデマンド パートナーを介してこのコースの受講を希望される場合
Coursera および Pluralsight で Google Cloud のコンテンツをご確認ください。
インストラクターによる指導をご希望の場合