05
Building Batch Data Pipelines on Google Cloud - 日本語版
05
Building Batch Data Pipelines on Google Cloud - 日本語版
These skills were generated by AI. Do you agree this course teaches these skills?
通常、データ パイプラインは、「抽出、読み込み(EL)」、「抽出、読み込み、変換(ELT)」、「抽出、変換、読み込み(ETL)」のいずれかの考え方に分類できます。このコースでは、バッチデータではどの枠組みを、どのような場合に使用するのかについて説明します。本コースではさらに、BigQuery、Dataproc 上での Spark の実行、Cloud Data Fusion のパイプラインのグラフ、Dataflow でのサーバーレスのデータ処理など、データ変換用の複数の Google Cloud テクノロジーについて説明します。また、Qwiklabs を使用して Google Cloud でデータ パイプラインのコンポーネントを構築する実践演習を行います。
コース情報
目標
- データ読み込みのさまざまな方法の確認: EL、ELT、ETL について、また何をどのタイミングで使用するか。
- Dataproc での Hadoop の実行、Cloud Storage の活用、Dataproc ジョブの最適化。
- Dataflow を使用したデータ処理パイプラインの構築。
- Data Fusion と Cloud Composer を使用したデータ パイプラインの管理。
前提条件
データ モデリングと ETL(抽出、変換、読み込み)操作の経験
一般的なプログラミング言語(Python や Java など)を使用してアプリケーションを開発した経験
対象
データ処理用のパイプラインとアーキテクチャの設計を担当するデベロッパー
使用できる言語
English、español (Latinoamérica)、日本語、français、português (Brasil)、italiano、한국어
このコースを修了した後はどうすればよいですか?
コースを修了した後は、学習プログラム のその他のコンテンツを確認したり、学習カタログ を閲覧したりできます。
どのようなバッジを獲得できますか?
コースを修了すると、修了バッジが付与されます。バッジはプロフィールで確認可能で、ソーシャル ネットワークで共有していただくこともできます。
オンデマンド パートナーを介してこのコースの受講を希望される場合
Coursera および Pluralsight で Google Cloud のコンテンツをご確認ください。
インストラクターによる指導をご希望の場合