チェックポイント
Create a lake
/ 20
Add zone to your lake
/ 20
Attach an asset to a zone
/ 40
Delete assets, zones, and lakes
/ 20
Dataplex: Qwik Start - コンソール
GSP1143
概要
Dataplex は、データレイク、データ ウェアハウス、データマートに分散したデータの一元的な検出、管理、モニタリング、統制を実現し、大規模な分析を支援するインテリジェントなデータ ファブリックです。具体的には、Dataplex を使用してデータメッシュ アーキテクチャを構築できます。データメッシュ アーキテクチャとは、ドメインデータ所有者間でデータ所有権を分散する組織的および技術的アプローチです。
Dataplex は、データの移動や複製を必要としない方法でデータを管理します。新しいデータアセットが追加されると、Dataplex は構造化データと非構造化データの両方のメタデータを収集し、すべてのメタデータを安全な統合メタストアに自動的に登録します。その後、データおよびメタデータは Data Catalog や BigQuery などの Google Cloud サービスを通じて評価できます。
このラボでは、Google Cloud コンソールを使用して Dataplex でレイク、ゾーン、アセットを作成および削除し、独自のデータメッシュの構築を開始する方法を学習します。
演習内容
- Dataplex API を有効にする
- レイクを作成する
- ゾーンをレイクに追加する
- アセットをアタッチおよび切断する
- ゾーンとレイクを削除する
設定と要件
[ラボを開始] ボタンをクリックする前に
こちらの手順をお読みください。ラボの時間は記録されており、一時停止することはできません。[ラボを開始] をクリックするとスタートするタイマーは、Google Cloud のリソースを利用できる時間を示しています。
このハンズオンラボでは、シミュレーションやデモ環境ではなく、実際のクラウド環境を使ってご自身でラボのアクティビティを行うことができます。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。
このラボを完了するためには、下記が必要です。
- 標準的なインターネット ブラウザ(Chrome を推奨)
- ラボを完了するために十分な時間を確保してください。ラボをいったん開始すると一時停止することはできません。
ラボを開始して Google Cloud コンソールにログインする方法
-
[ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるポップアップでお支払い方法を選択してください。 左側の [ラボの詳細] パネルには、以下が表示されます。
- [Google Cloud コンソールを開く] ボタン
- 残り時間
- このラボで使用する必要がある一時的な認証情報
- このラボを行うために必要なその他の情報(ある場合)
-
[Google Cloud コンソールを開く] をクリックします(Chrome ブラウザを使用している場合は、右クリックして [シークレット ウィンドウでリンクを開く] を選択します)。
ラボでリソースが起動し、別のタブで [ログイン] ページが表示されます。
ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。
注: [アカウントの選択] ダイアログが表示されたら、[別のアカウントを使用] をクリックします。 -
必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。
{{{user_0.username | "Username"}}} [ラボの詳細] パネルでも [ユーザー名] を確認できます。
-
[次へ] をクリックします。
-
以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。
{{{user_0.password | "Password"}}} [ラボの詳細] パネルでも [パスワード] を確認できます。
-
[次へ] をクリックします。
重要: ラボで提供された認証情報を使用する必要があります。Google Cloud アカウントの認証情報は使用しないでください。 注: このラボでご自身の Google Cloud アカウントを使用すると、追加料金が発生する場合があります。 -
その後次のように進みます。
- 利用規約に同意してください。
- 一時的なアカウントなので、復元オプションや 2 要素認証プロセスは設定しないでください。
- 無料トライアルには登録しないでください。
その後、このタブで Google Cloud コンソールが開きます。
Cloud Dataplex API を有効にする
-
Google Cloud コンソールで、上部の検索バーに「Cloud Dataplex API」と入力します。
-
[マーケットプレイス] の下に表示された検索結果の Cloud Dataplex API をクリックします。
-
[有効にする] をクリックします。
タスク 1. レイクを作成する
Dataplex において、レイクは特定のデータ領域やビジネス ユニットを表す、最上位の組織ドメインです。たとえば、組織内の部門やデータドメインごとにレイクを作成できるため、特定のユーザー グループに対してデータを整理して提供できます。
このタスクでは、レイクを作成して、データメッシュの構築を開始します。
- Google Cloud コンソールのナビゲーション メニュー()で、[分析] > [Dataplex] に移動します。
「新しい Dataplex エクスペリエンスへようこそ
」というメッセージが表示されたら、[閉じる] をクリックします。
-
[レイクの管理] で [管理] をクリックします。
-
[レイクを作成] をクリックします。
-
必要な情報を入力して新しいレイクを作成します。
プロパティ | 値 |
---|---|
表示名 | sensors |
ID | デフォルト値のままにします。 |
リージョン |
上記以外はデフォルト値のままにします。
- [作成] をクリックします。
レイクが作成されるまで 3 分ほどかかる場合があります。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
タスク 2. ゾーンをレイクに追加する
レイクを作成すると、ゾーンをレイクに追加できるようになります。ゾーンはレイク内のサブドメインです。ゾーンを使用するとデータをより細かく分類できます。たとえば、ステージ、使用状況、制限ごとにデータを分類できます。
ゾーンには次の 2 種類があります。
- 未加工ゾーン: 未加工の形式のデータが含まれます(Cloud Storage バケット内のファイルなど)。なお、厳格な型チェックの対象にはなりません。
- キュレート済ゾーン: クリーンアップおよびフォーマットされ、分析の準備が整っているデータが含まれます(BigQuery テーブルなど)。
このタスクでは、Cloud Storage バケット内のファイルを操作するための未加工ゾーンを作成します。
-
[管理] タブでレイクの名前をクリックします。
-
[ゾーンを追加] をクリックします。
-
必要な情報を入力して新しいゾーンを作成します。
プロパティ | 値 |
---|---|
表示名 | temperature raw data |
ID | デフォルト値のままにします。 |
タイプ | 未加工ゾーン |
データのロケーション | リージョン |
上記以外はデフォルト値のままにします。
たとえば、[検出の設定] の下の [メタデータの検出を有効にする] はデフォルトで有効になっており、許可されたユーザーはこのゾーン内のデータを検出できます。
- [作成] をクリックします。
ゾーンが作成されるまで 2 分ほどかかる場合があります。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
タスク 3. アセットをゾーンにアタッチする
Cloud Storage バケットまたは BigQuery データセットに保存されたデータは、アセットとして Dataplex レイク内のゾーンにアタッチできます。
このタスクでは、Google Cloud コンソールで作成した Cloud Storage バケットをアタッチします。
-
[ゾーン] タブでゾーンの名前をクリックします。
-
[アセット] タブで [アセットを追加] をクリックします。
-
[アセットを追加] をクリックします。
-
必要な情報を入力して新しいアセットをアタッチします。
プロパティ | 値 |
---|---|
タイプ | Storage バケット |
表示名 | measurements |
ID | デフォルト値のままにします。 |
上記以外はデフォルト値のままにします。
- [バケット] で [参照] をクリックします。
Dataplex から離れることなく、既存の Cloud Storage バケットをアタッチしたり、新しいバケットを作成したりできます。次の手順では、新しい Cloud Storage バケットを作成し、そのバケットをゾーンにアタッチします。
-
[新しいバケットを作成]()をクリックします。
-
プロジェクト ID をバケット名(
)として指定し、[続行] をクリックします。 -
[ロケーション タイプ] で [リージョン] を選択してから、
を選択します。
その他はデフォルト値のままにします。
- [作成] をクリックします。
「公開アクセスの防止
」というメッセージが表示されたら、[確認] をクリックします。
-
[選択] をクリックして、作成したバケットを選択し、[続行] をクリックします。
-
[検出の設定] で [継承] を選択して、検出の設定をゾーンレベルから継承し、[続行] をクリックします。
-
[送信] をクリックします。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
タスク 4. アセット、ゾーン、レイクを削除する
レイクを削除するには、まずアセットを切断してからゾーンを削除する必要があります。
このタスクでは、ゾーンからアセットを切断し、次にゾーンを削除して、最後にレイクを削除します。
アセットを切断する
-
左側のメニューで [管理] タブをクリックし、レイクの名前をクリックします。
-
[ゾーン] タブでゾーンの名前をクリックします。
-
[アセット] タブで、アセット名の左側にあるチェックボックスをオンにします。
-
[アセットを削除] をクリックします。
-
[削除] をクリックして確定します。
このアクションにより、Cloud Storage バケット内の基盤となるデータが削除されます。これは、Dataplex のレイクを使用して、Cloud Storage バケットをアクセス不可または検出不可にするだけです。
ゾーンを削除する
-
左側のメニューで [管理] タブをクリックし、レイクの名前をクリックします。
-
[ゾーン] タブで、ゾーンの名前の左側にあるチェックボックスをオンにします。
-
[ゾーンを削除] をクリックします。
-
[削除] をクリックして確定します。
レイクを削除する
-
左側のメニューで [管理] タブをクリックし、レイクの名前をクリックします。
-
ページ上部の [削除] をクリックします。
-
テキスト ボックスに「delete」と入力して [削除] をクリックします。
-
[レイクを削除] をクリックして確認します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
お疲れさまでした
Google Cloud コンソールを使用して、Dataplex でレイク、ゾーン、アセットを作成および削除しました。
Google Cloud トレーニングと認定資格
Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。
マニュアルの最終更新日: 2023 年 9 月 20 日
ラボの最終テスト日: 2023 年 9 月 20 日
Copyright 2024 Google LLC All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。