チェックポイント
Create a lake, zone, and asset in Dataplex
/ 30
Create a tag template
/ 30
Apply a tag template to Dataplex assets
/ 40
Dataplex アセットのタグ付け
GSP1145
概要
Dataplex は、データレイク、データ ウェアハウス、データマートに分散したデータの一元的な検出、管理、モニタリング、統制を実現し、大規模な分析を支援するインテリジェントなデータ ファブリックです。
Data Catalog は、Dataplex 内のスケーラブルなフルマネージド型メタデータ管理サービスです。Data Catalog を使用することにより、データアセットにタグを付けたり、アクセス可能なアセットを検索したりできます。タグによって特定のデータアセットにカスタム メタデータ フィールドを追加できるため(例: 保護対象データや機密データを含む特定のアセットにタグを付ける)、簡単にアセットを識別して取得できるようになります。また、再利用可能なタグ テンプレートを作成すると、同じタグを別のデータアセットに迅速に割り当てることができます。
このラボでは、Dataplex 内の Data Catalog を使用してタグ テンプレートを作成し、それを Dataplex アセットに適用してから、そのタグを使用してアセットを検索する方法を学習します。
演習内容
- Dataplex API と Data Catalog API を有効にする
- Dataplex でレイク、ゾーン、アセットを作成する
- タグ テンプレートを作成する
- タグ テンプレートを Dataplex アセットに適用する
- タグを使用してアセットを検索する
設定と要件
[ラボを開始] ボタンをクリックする前に
こちらの手順をお読みください。ラボの時間は記録されており、一時停止することはできません。[ラボを開始] をクリックするとスタートするタイマーは、Google Cloud のリソースを利用できる時間を示しています。
このハンズオンラボでは、シミュレーションやデモ環境ではなく、実際のクラウド環境を使ってご自身でラボのアクティビティを行うことができます。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。
このラボを完了するためには、下記が必要です。
- 標準的なインターネット ブラウザ(Chrome を推奨)
- ラボを完了するために十分な時間を確保してください。ラボをいったん開始すると一時停止することはできません。
ラボを開始して Google Cloud コンソールにログインする方法
-
[ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるポップアップでお支払い方法を選択してください。 左側の [ラボの詳細] パネルには、以下が表示されます。
- [Google Cloud コンソールを開く] ボタン
- 残り時間
- このラボで使用する必要がある一時的な認証情報
- このラボを行うために必要なその他の情報(ある場合)
-
[Google Cloud コンソールを開く] をクリックします(Chrome ブラウザを使用している場合は、右クリックして [シークレット ウィンドウでリンクを開く] を選択します)。
ラボでリソースが起動し、別のタブで [ログイン] ページが表示されます。
ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。
注: [アカウントの選択] ダイアログが表示されたら、[別のアカウントを使用] をクリックします。 -
必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。
{{{user_0.username | "Username"}}} [ラボの詳細] パネルでも [ユーザー名] を確認できます。
-
[次へ] をクリックします。
-
以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。
{{{user_0.password | "Password"}}} [ラボの詳細] パネルでも [パスワード] を確認できます。
-
[次へ] をクリックします。
重要: ラボで提供された認証情報を使用する必要があります。Google Cloud アカウントの認証情報は使用しないでください。 注: このラボでご自身の Google Cloud アカウントを使用すると、追加料金が発生する場合があります。 -
その後次のように進みます。
- 利用規約に同意してください。
- 一時的なアカウントなので、復元オプションや 2 要素認証プロセスは設定しないでください。
- 無料トライアルには登録しないでください。
その後、このタブで Google Cloud コンソールが開きます。
Dataplex API と Data Catalog API を有効にする
-
Google Cloud コンソールで、上部の検索バーに「Cloud Dataplex API」と入力します。
-
[マーケットプレイスと API] の下に表示された検索結果の Cloud Dataplex API をクリックします。
-
[有効にする] をクリックします。
-
Google Cloud Data Catalog API についても手順 1~3 を繰り返します。
タスク 1. レイク、ゾーン、アセットを作成する
このタスクでは、顧客の注文情報を保存するための新しい Dataplex レイクを作成し、そのレイクにキュレートされたゾーンを追加してから、事前に作成された BigQuery データセットをそのゾーン内の新しいアセットとしてアタッチします。
レイクを作成する
- Google Cloud コンソールのナビゲーション メニュー()で、[分析] > [Dataplex] に移動します。
「新しい Dataplex エクスペリエンスへようこそ
」というメッセージが表示されたら、[閉じる] をクリックします。
-
[レイクの管理] で [管理] をクリックします。
-
[レイクを作成] をクリックします。
-
必要な情報を入力して新しいレイクを作成します。
プロパティ | 値 |
---|---|
表示名 | Orders Lake |
ID | デフォルト値のままにします。 |
リージョン |
上記以外はデフォルト値のままにします。
- [作成] をクリックします。
レイクが作成されるまで 3 分ほどかかる場合があります。
レイクにゾーンを追加する
-
[管理] タブでレイクの名前をクリックします。
-
[ゾーンを追加] をクリックします。
-
必要な情報を入力して新しいゾーンを作成します。
プロパティ | 値 |
---|---|
表示名 | Customer Curated Zone |
ID | デフォルト値のままにします。 |
タイプ | キュレートされたゾーン |
データのロケーション | リージョン |
上記以外はデフォルト値のままにします。
たとえば、[検出の設定] の下の [メタデータの検出を有効にする] はデフォルトで有効になっており、許可されたユーザーはこのゾーン内のデータを検出できます。
- [作成] をクリックします。
ゾーンが作成されるまで 2 分ほどかかる場合があります。
ゾーンにアセットをアタッチする
-
[ゾーン] タブでゾーンの名前をクリックします。
-
[アセット] タブで [アセットを追加] をクリックします。
-
[アセットを追加] をクリックします。
-
必要な情報を入力して新しいアセットをアタッチします。
プロパティ | 値 |
---|---|
タイプ | BigQuery データセット |
表示名 | Customer Details Dataset |
ID | デフォルト値のままにします。 |
データセット |
|
上記以外はデフォルト値のままにします。
-
[完了] をクリックします。
-
[続行] をクリックします。
-
[検出の設定] で [継承] を選択して、検出の設定をゾーンレベルから継承し、[続行] をクリックします。
-
[送信] をクリックします。
タスク 2. タグ テンプレートを作成する
データのタグ付けを開始するには、まず、タグ テンプレートを 1 つ以上作成する必要があります。タグ テンプレートは、公開タグ テンプレートまたは非公開タグ テンプレートのいずれかです。新しいタグ テンプレートを作成する場合、公開タグ テンプレートを作成するオプションがデフォルトの推奨オプションです。データアセットに必要な表示権限を持つユーザーは、そのデータアセットに関連付けられているすべての公開タグを表示できます。これにより、基盤となるデータにすでに実装されているデータアクセス制御に従いながら、検出のためのシンプルな検索がサポートされます。
このタスクでは、公開タグ テンプレートを作成して、BigQuery テーブルの列に保護対象ステータスのラベルを付けます。公開タグ テンプレートを使用すると、基盤となる BigQuery テーブルの列にアクセスできるユーザーが、列に適用されたタグを表示できます。
-
左側のメニューの [カタログの管理] で [タグ テンプレート] をクリックします。
-
[タグ テンプレートを作成] をクリックします。
-
必要な情報を入力してタグ テンプレートを定義します。
プロパティ | 値 |
---|---|
テンプレートの表示名 | Protected Data Template |
テンプレート ID | デフォルト値のままにします。 |
ロケーション | |
公開設定 | 公開 |
- [フィールドを追加] をクリックし、必要な情報を入力して新しいフィールドをテンプレートに追加します。
プロパティ | 値 |
---|---|
フィールド表示名 | Protected Data Flag |
フィールド ID | デフォルト値のままにします。 |
タイプ | 列挙 |
-
[列挙値] > [Values 1] に「
YES
」と入力します。 -
[値を追加] をクリックし、[Values 2] に「
NO
」と入力します。 -
[完了] をクリックします。
-
[作成] をクリックします。
タスク 3. タグ テンプレートを Dataplex アセットに適用する
タグ テンプレートを作成したら、それを使用して、アクセス可能な任意の数のデータアセットにタグをアタッチできるようになります。
このタスクでは、保護対象データのステータスのラベルを付けたい BigQuery テーブル内の特定の列に、以前作成したタグ テンプレートを適用します。
-
左側のメニューの [探索] で [検索] をクリックします。
-
[Filters] の [システム] で [Dataplex] のチェックボックスをオンにします。
-
[customer_details] テーブルをクリックします。
[customer_details] テーブルが表示されない場合は、数分待ってからページを更新し、Dataplex のアセットリストの更新を待ちます。
-
[タグを付ける] をクリックします。
-
[タグを付ける対象の選択] で次の列のチェックボックスをオンにします。
- zip
- state
- last_name
- country
- latitude
- first_name
- city
- longitude
-
[OK] をクリックします。
-
[タグ テンプレートの選択] で [Protected data template] を選択します。
-
[Protected data flag] で [YES] を選択します。
-
[保存] をクリックします。
タスク 4. タグを使用してアセットを検索する
データアセットにタグを付けたら、Dataplex 内の Data Catalog を使用して、データアセットを検索できるようになります。
このタスクでは、タグ テンプレート「Protected data template」を使用して、タグ付けされたアセットを検索します。
-
左側のメニューの [探索] で [検索] をクリックします。
-
[Filters] の [タグ] で [Protected data template] のチェックボックスをオンにします。
-
[customer_details] テーブルをクリックします。
-
[スキーマと列のタグ] タブをクリックして、指定した列の Protected Data のタグを表示します。
お疲れさまでした
Dataplex 内の Data Catalog を使用してタグ テンプレートを作成し、それを Dataplex アセットに適用してから、そのタグを使用してアセットを検索しました。
Google Cloud トレーニングと認定資格
Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。
マニュアルの最終更新日: 2023 年 9 月 20 日
ラボの最終テスト日: 2023 年 9 月 20 日
Copyright 2024 Google LLC All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。