arrow_back

Dataplex アセットのタグ付け

ログイン 参加
700 以上のラボとコースにアクセス

Dataplex アセットのタグ付け

ラボ 45分 universal_currency_alt クレジット: 1 show_chart 入門
info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。
700 以上のラボとコースにアクセス

GSP1145

概要

Dataplex は、データレイク、データ ウェアハウス、データマートに分散したデータの一元的な検出、管理、モニタリング、統制を実現し、大規模な分析を支援するインテリジェントなデータ ファブリックです。

Data Catalog は、Dataplex 内のスケーラブルなフルマネージド型メタデータ管理サービスです。Data Catalog を使用することにより、データアセットにタグを付けたり、アクセス可能なアセットを検索したりできます。タグによって特定のデータアセットにカスタム メタデータ フィールドを追加できるため(例: 保護対象データや機密データを含む特定のアセットにタグを付ける)、簡単にアセットを識別して取得できるようになります。また、再利用可能なタグ テンプレートを作成すると、同じタグを別のデータアセットに迅速に割り当てることができます。

このラボでは、Dataplex 内の Data Catalog を使用してタグ テンプレートを作成し、それを Dataplex アセットに適用してから、そのタグを使用してアセットを検索する方法を学習します。

演習内容

  • Dataplex API と Data Catalog API を有効にする
  • Dataplex でレイク、ゾーン、アセットを作成する
  • タグ テンプレートを作成する
  • タグ テンプレートを Dataplex アセットに適用する
  • タグを使用してアセットを検索する

設定と要件

[ラボを開始] ボタンをクリックする前に

こちらの説明をお読みください。ラボには時間制限があり、一時停止することはできません。タイマーは、Google Cloud のリソースを利用できる時間を示しており、[ラボを開始] をクリックするとスタートします。

このハンズオンラボでは、シミュレーションやデモ環境ではなく実際のクラウド環境を使って、ラボのアクティビティを行います。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。

このラボを完了するためには、下記が必要です。

  • 標準的なインターネット ブラウザ(Chrome を推奨)
注: このラボの実行には、シークレット モード(推奨)またはシークレット ブラウジング ウィンドウを使用してください。これにより、個人アカウントと受講者アカウント間の競合を防ぎ、個人アカウントに追加料金が発生しないようにすることができます。
  • ラボを完了するための時間(開始後は一時停止できません)
注: このラボでは、受講者アカウントのみを使用してください。別の Google Cloud アカウントを使用すると、そのアカウントに料金が発生する可能性があります。

ラボを開始して Google Cloud コンソールにログインする方法

  1. [ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるダイアログでお支払い方法を選択してください。 左側の [ラボの詳細] ペインには、以下が表示されます。

    • [Google Cloud コンソールを開く] ボタン
    • 残り時間
    • このラボで使用する必要がある一時的な認証情報
    • このラボを行うために必要なその他の情報(ある場合)
  2. [Google Cloud コンソールを開く] をクリックします(Chrome ブラウザを使用している場合は、右クリックして [シークレット ウィンドウで開く] を選択します)。

    ラボでリソースがスピンアップし、別のタブで [ログイン] ページが表示されます。

    ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。

    注: [アカウントの選択] ダイアログが表示されたら、[別のアカウントを使用] をクリックします。
  3. 必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。

    {{{user_0.username | "Username"}}}

    [ラボの詳細] ペインでもユーザー名を確認できます。

  4. [次へ] をクリックします。

  5. 以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。

    {{{user_0.password | "Password"}}}

    [ラボの詳細] ペインでもパスワードを確認できます。

  6. [次へ] をクリックします。

    重要: ラボで提供された認証情報を使用する必要があります。Google Cloud アカウントの認証情報は使用しないでください。 注: このラボでご自身の Google Cloud アカウントを使用すると、追加料金が発生する場合があります。
  7. その後次のように進みます。

    • 利用規約に同意してください。
    • 一時的なアカウントなので、復元オプションや 2 要素認証プロセスは設定しないでください。
    • 無料トライアルには登録しないでください。

その後、このタブで Google Cloud コンソールが開きます。

注: Google Cloud のプロダクトやサービスにアクセスするには、ナビゲーション メニューをクリックするか、[検索] フィールドにサービス名またはプロダクト名を入力します。

Dataplex API と Data Catalog API を有効にする

  1. Google Cloud コンソールで、上部の検索バーに「Cloud Dataplex API」と入力します。

  2. [マーケットプレイス] の下に表示された検索結果で、「Cloud Dataplex API」をクリックします。

  3. まだ有効になっていない場合は、[有効にする] をクリックします。

  4. Google Cloud Data Catalog API についても手順 1~3 を繰り返します。

タスク 1. レイク、ゾーン、アセットを作成する

このタスクでは、顧客の注文情報を保存するための新しい Dataplex レイクを作成し、そのレイクにキュレートされたゾーンを追加してから、事前に作成された BigQuery データセットをそのゾーン内の新しいアセットとしてアタッチします。

レイクを作成する

  1. Google Cloud コンソールのナビゲーション メニュー)で、[すべてのプロダクトを表示] をクリックします。[分析] で、[Dataplex Universal Catalog] をクリックします。

新しい Dataplex エクスペリエンスへようこそ」というメッセージが表示されたら、[閉じる] をクリックします。

  1. [レイクの管理] で [管理] をクリックします。

  2. [作成] をクリックします。

  3. 必要な情報を入力して新しいレイクを作成します。

プロパティ
表示名 Orders Lake
ID デフォルト値のままにします。
リージョン

上記以外はデフォルト値のままにします。

  1. [作成] をクリックします。

レイクが作成されるまでに数分かかることがあります。

レイクのステータスが [有効] になったら、次のセクションに進むことができます。

ゾーンをレイクに追加する

  1. [管理] タブでレイクの名前をクリックします。

  2. [ゾーンを追加] をクリックします。

  3. 必要な情報を入力して新しいゾーンを作成します。

プロパティ
表示名 Customer Curated Zone
ID デフォルト値のままにします。
タイプ キュレートされたゾーン
データのロケーション リージョン

上記以外はデフォルト値のままにします。

たとえば、[検出の設定] の下の [メタデータの検出を有効にする] はデフォルトで有効になっており、許可されたユーザーはこのゾーン内のデータを検出できます。

  1. [作成] をクリックします。

ゾーンが作成されるまでに数分かかることがあります。

ゾーンのステータスが [有効] になったら、次のセクションに進むことができます。

アセットをゾーンにアタッチする

  1. [ゾーン] タブでゾーンの名前をクリックします。

  2. [アセット] タブで [アセットを追加] をクリックします。

  3. [アセットを追加] をクリックします。

  4. 必要な情報を入力して新しいアセットをアタッチします。

プロパティ
タイプ BigQuery データセット
表示名 Customer Details Dataset
ID デフォルト値のままにします。
データセット .customers

上記以外はデフォルト値のままにします。

  1. [続行] をクリックします。

  2. [検出の設定] で [継承] を選択して、検出の設定をゾーンレベルから継承し、[続行] をクリックします。

  3. [送信] をクリックします。

Dataplex でレイク、ゾーン、アセットを作成する

タスク 2. タグ テンプレートを作成する

データのタグ付けを開始するには、まず、タグ テンプレートを 1 つ以上作成する必要があります。タグ テンプレートは、公開タグ テンプレートまたは非公開タグ テンプレートのいずれかです。新しいタグ テンプレートを作成する場合、公開タグ テンプレートを作成するオプションがデフォルトの推奨オプションです。データアセットに必要な表示権限を持つユーザーは、そのデータアセットに関連付けられているすべての公開タグを表示できます。これにより、基盤となるデータにすでに実装されているデータアクセス制御に従いながら、検出のためのシンプルな検索がサポートされます。

このタスクでは、公開タグ テンプレートを作成して、BigQuery テーブルの列に保護対象ステータスのラベルを付けます。公開タグ テンプレートを使用すると、基盤となる BigQuery テーブルの列にアクセスできるユーザーが、列に適用されたタグを表示できます。

  1. 左側のメニューの [メタデータの管理] で [カタログ] をクリックします。

  2. [タグ テンプレートを作成する(非推奨)] をクリックします。

  3. [続行してもよろしいですか?] と表示されたら、[続行] をクリックします。

注: タグ テンプレートはアスペクト タイプに置き換えられつつありますが、現時点ではまだ機能しています。次の手順に進んでタグ テンプレートを作成してください。

このラボは、アスペクト タイプを使用するように更新される予定です。この変更はまもなく反映されます。
  1. 必要な情報を入力してタグ テンプレートを定義します。
プロパティ
テンプレートの表示名 Protected Data Template
テンプレート ID デフォルト値のままにします。
ロケーション
公開設定 公開
  1. [フィールドを追加] をクリックし、必要な情報を入力して新しいフィールドをテンプレートに追加します。
プロパティ
フィールド表示名 Protected Data Flag
フィールド ID デフォルト値のままにします。
タイプ 列挙
  1. [列挙値] > [Values 1] に「YES」と入力します。

  2. [値を追加] をクリックし、[Values 2] に「NO」と入力します。

  3. [完了] をクリックします。

  4. [作成] をクリックします。

注: タグ テンプレートが作成されてから、進行状況チェックで成功メッセージが返されるまでに数分かかることがあります。 タグ テンプレートを作成する

タスク 3. タグ テンプレートを Dataplex アセットに適用する

タグ テンプレートを作成したら、それを使用して、アクセス可能な任意の数のデータアセットにタグをアタッチできるようになります。

このタスクでは、保護対象データのステータスのラベルを付けたい BigQuery テーブル内の特定の列に、以前作成したタグ テンプレートを適用します。

  1. 左側のメニューの [探索] で [検索] をクリックします。

  2. [Filters] の [システム] で [Dataplex] のチェックボックスをオンにします。

  3. [customer_details] テーブルをクリックします。

[customer_details] テーブルが表示されない場合は、数分待ってからページを更新し、Dataplex のアセットリストの更新を待ちます。

  1. [タグを付ける] をクリックします。

  2. [タグを付ける対象の選択] で次の列のチェックボックスをオンにします。

    • zip
    • state
    • last_name
    • country
    • email
    • latitude
    • first_name
    • city
    • longitude
  3. [OK] をクリックします。

  4. [タグ テンプレートの選択] で [Protected data template] を選択します。

  5. [Protected data flag] で [YES] を選択します。

  6. [保存] をクリックします。

注: タグ テンプレートが適用されてから、進行状況チェックで成功メッセージが返されるまでに数分かかることがあります。 タグ テンプレートを Dataplex アセットに適用する

タスク 4. タグを使用してアセットを検索する

データアセットにタグを付けたら、Dataplex 内の Data Catalog を使用して、データアセットを検索できるようになります。

このタスクでは、タグ テンプレート「Protected data template」を使用して、タグ付けされたアセットを検索します。

  1. 左側のメニューの [探索] で [検索] をクリックします。

  2. [Filters] の [タグ] で [Protected data template] のチェックボックスをオンにします。

  3. [customer_details] テーブルをクリックします。

  4. [スキーマと列のタグ] タブをクリックして、指定した列の Protected Data のタグを表示します。

お疲れさまでした

Dataplex 内の Data Catalog を使用してタグ テンプレートを作成し、それを Dataplex アセットに適用してから、そのタグを使用してアセットを検索しました。

Google Cloud トレーニングと認定資格

Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。

マニュアルの最終更新日: 2025 年 5 月 23 日

ラボの最終テスト日: 2025 年 5 月 23 日

Copyright 2025 Google LLC. All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。

始める前に

  1. ラボでは、Google Cloud プロジェクトとリソースを一定の時間利用します
  2. ラボには時間制限があり、一時停止機能はありません。ラボを終了した場合は、最初からやり直す必要があります。
  3. 画面左上の [ラボを開始] をクリックして開始します

このコンテンツは現在ご利用いただけません

利用可能になりましたら、メールでお知らせいたします

ありがとうございます。

利用可能になりましたら、メールでご連絡いたします

1 回に 1 つのラボ

既存のラボをすべて終了して、このラボを開始することを確認してください

シークレット ブラウジングを使用してラボを実行する

このラボの実行には、シークレット モードまたはシークレット ブラウジング ウィンドウを使用してください。これにより、個人アカウントと受講者アカウントの競合を防ぎ、個人アカウントに追加料金が発生することを防ぎます。