arrow_back

Build a Data Mesh with Dataplex: チャレンジラボ

ログイン 参加
知識をテストして、コミュニティで共有しましょう
done
700 を超えるハンズオンラボ、スキルバッジ、コースへのアクセス

Build a Data Mesh with Dataplex: チャレンジラボ

ラボ 1時間 30分 universal_currency_alt クレジット: 1 show_chart 入門
info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。
知識をテストして、コミュニティで共有しましょう
done
700 を超えるハンズオンラボ、スキルバッジ、コースへのアクセス

GSP514

Google Cloud セルフペース ラボ

概要

チャレンジラボでは、シナリオと一連のタスクが提供されます。手順ガイドに沿って進める形式ではなく、コース内のラボで習得したスキルを駆使して、ご自身でタスクを完了していただきます。タスクが適切に完了したかどうかは、このページに表示される自動スコアリング システムで確認できます。

チャレンジラボは、Google Cloud の新しいコンセプトについて学習するためのものではありません。デフォルト値を変更する、エラー メッセージを読み調査を行ってミスを修正するなど、習得したスキルを応用する能力が求められます。

100% のスコアを達成するには、制限時間内に全タスクを完了する必要があります。

設定

[ラボを開始] ボタンをクリックする前に

こちらの手順をお読みください。ラボの時間は記録されており、一時停止することはできません。[ラボを開始] をクリックするとスタートするタイマーは、Google Cloud のリソースを利用できる時間を示しています。

このハンズオンラボでは、シミュレーションやデモ環境ではなく、実際のクラウド環境を使ってご自身でラボのアクティビティを行うことができます。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。

このラボを完了するためには、下記が必要です。

  • 標準的なインターネット ブラウザ(Chrome を推奨)
注: このラボの実行には、シークレット モードまたはシークレット ブラウジング ウィンドウを使用してください。これにより、個人アカウントと受講者アカウント間の競合を防ぎ、個人アカウントに追加料金が発生することを防ぎます。
  • ラボを完了するために十分な時間を確保してください。ラボをいったん開始すると一時停止することはできません。
注: すでに個人の Google Cloud アカウントやプロジェクトをお持ちの場合でも、このラボでは使用しないでください。アカウントへの追加料金が発生する可能性があります。

チャレンジ シナリオ

ジュニア データ エンジニアという新たな役割を任されて間もないあなたは、各チームが Dataplex のアセットを作成して管理できるようサポートしており、

これらのタスクのスキルや知識がすでにあると想定されています。

チャレンジ

あなたに任務が与えられました。それは、新たに結成された開発チームが Dataplex を使用して新しいデータメッシュを構築できるようサポートすることです。そのためには、複数のゾーンとアセットを含む Dataplex レイクを作成するほか、新しいレイク内のアセットにタグを付けて、データ品質を評価する必要があり、具体的には、次のタスクを行うよう依頼されています。

  • 2 つのゾーンと 2 つのアセットを含む Dataplex レイクを作成する。
  • タグ テンプレートを作成して適用し、ゾーン全体を保護対象データとしてタグ付けする。
  • Dataplex IAM ロールを別のユーザーに割り当てる。
  • データ品質仕様ファイルを作成して Cloud Storage にアップロードする。
  • Dataplex でデータ品質ジョブを定義して実行する。

以下のような基準に従う必要があります。

  • 必要な API(Dataplex、Data Catalog、Dataproc など)が正常に有効になっていることを確認する。
  • 特別な指示がない限り、すべてのリソースを リージョンに作成する。

それぞれのタスクについて以下に詳しく説明します。それでは始めましょう。

タスク 1. 2 つのゾーンと 2 つのアセットを含む Dataplex レイクを作成する

ステップ 2 の Cloud Storage バケットと BigQuery データセットは、このラボで事前に作成されています。

  1. 次の 2 つのリージョン ゾーンを持つ Sales Lake という名前の Dataplex レイクを作成します。
  • Raw Customer Zone という名前の未加工ゾーン
  • Curated Customer Zone という名前のキュレートされたゾーン
  1. 事前に作成されたアセットの 1 つを次の各ゾーンにアタッチします。
  • 未加工ゾーンには、-customer-online-sessions という名前の Cloud Storage バケットを Customer Engagements という名前の新しいアセットとしてアタッチします。
  • キュレートされたゾーンには、.customer_orders という名前の BigQuery データセットを Customer Orders という名前の新しいアセットとしてアタッチします。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 2 つのゾーンと 2 つのアセットを含む Dataplex レイクを作成する

タスク 2. タグ テンプレートを作成してゾーンに適用する

  1. 次の 2 つの列挙型フィールドを含む、Protected Customer Data Template という名前の公開タグ テンプレートを作成します。
  • 最初のフィールド Raw Data Flag には、YesNo という 2 つの値を指定できます。
  • 2 番目のフィールド Protected Contact Information Flag には、YesNo という 2 つの値を指定できます。
  1. このテンプレートを使用して、両方のフラグに値 Yes を設定して Raw Customer Zone にタグを付けます。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 タグ テンプレートを作成してゾーンに適用する

タスク 3. Dataplex IAM ロールを別のユーザーに割り当てる

  • 最小権限の原則を使用して、適切な Dataplex IAM ロールをユーザー 2()に割り当てます。これにより、ユーザー 2 は新しい Cloud Storage ファイルを Customer Engagements という名前の Dataplex アセットにアップロードできるようになります。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 Dataplex IAM ロールを別のユーザーに割り当てる

タスク 4. データ品質仕様ファイルを作成して Cloud Storage にアップロードする

ステップ 2 の Cloud Storage バケットは、このラボで事前に作成済みです。

  1. dq-customer-orders.yaml という名前のデータ品質仕様ファイルを次の仕様で作成します。
  • NOT NULL ルールを customer_orders.ordered_items テーブルの user_id 列に適用
  • NOT NULL ルールを customer_orders.ordered_items テーブルの order_id 列に適用
  1. このファイルを -dq-config という名前の Cloud Storage バケットにアップロードします。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 データ品質仕様ファイルを作成してアップロードする

タスク 5. Dataplex でデータ品質ジョブを定義して実行する

ステップ 1 の BigQuery データセットは、このラボで事前に作成済みです。

  1. 次の仕様で dq-customer-orders.yaml ファイルを使用してデータ品質ジョブを定義します。
プロパティ
データ品質ジョブ名 Customer Orders Data Quality Job
結果の BigQuery 宛先テーブル .orders_dq_dataset.results
ユーザー サービス アカウント Compute Engine のデフォルトのサービス アカウント
  1. データ品質ジョブを直ちに実行します。
ジョブの実行には数分かかることがあり、ジョブが正常に実行されたことを確認するためにページの更新が必要になる場合があります。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 Dataplex でデータ品質ジョブを定義して実行する

お疲れさまでした

「Build a Data Mesh with Dataplex」バッジ

次のスキルバッジを獲得する

このセルフペース ラボは、「Build a Data Mesh with Dataplex」スキルバッジ クエストの一部です。このクエストを完了すると成果が認められて上のようなバッジが贈られます。獲得したバッジを履歴書やソーシャル プラットフォームに記載し、#GoogleCloudBadge を使用して成果を公表しましょう。

Google Cloud トレーニングと認定資格

Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。

マニュアルの最終更新日: 2023 年 7 月 4 日

ラボの最終テスト日: 2023 年 7 月 4 日

Copyright 2024 Google LLC All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。

このコンテンツは現在ご利用いただけません

利用可能になりましたら、メールでお知らせいたします

ありがとうございます。

利用可能になりましたら、メールでご連絡いたします