読み込んでいます...
一致する結果は見つかりませんでした。

Google Cloud Skills Boost

Google Cloud コンソールでスキルを試す

Google Cloud Big Data and Machine Learning Fundamentals - 日本語版

700 以上のラボとコースにアクセス

BigQuery の一般公開データセットを使ってみる

ラボ 1時間 universal_currency_alt クレジット: 5 show_chart 入門
info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。
700 以上のラボとコースにアクセス

概要

適切なハードウェアとインフラストラクチャを用意することなく大規模なデータセットを保存してクエリを実行すると、多大な時間と費用がかかってしまう可能性があります。エンタープライズ データ ウェアハウスである Google BigQuery は、Google のインフラストラクチャの処理能力を活用して SQL クエリを超高速で実行し、こうした問題を解決します。ユーザーはデータを BigQuery に読み込むだけです。残りの処理は Google 側で行います。他のユーザーにデータの表示やクエリを許可するなど、ビジネスニーズに基づいてプロジェクトとデータへのアクセスを制御できます。

BigQuery にアクセスするには、Google Cloud コンソールもしくはコマンドライン ツールを使用するか、または Java、.NET、Python などの各種クライアント ライブラリを使って BigQuery REST API を呼び出します。各種サードパーティ製ツールを使用して BigQuery と通信し、データを可視化したり、データを読み込んだりすることも可能です。このラボでは、ウェブ UI を使用して BigQuery にアクセスします。

Google Cloud コンソールの BigQuery ウェブ UI をビジュアル インターフェースとして使用して、クエリの実行、データの読み込み、データのエクスポートなどのタスクを実行できます。このハンズオンラボでは、一般公開データセットのテーブルをクエリする方法と、Google Cloud コンソールを使用して BigQuery にサンプルデータを読み込む方法を学びます。

目標

このラボでは、次のタスクの実行方法について学びます。

  • 一般公開データセットに対してクエリを実行する
  • カスタム テーブルを作成する
  • テーブルにデータを読み込む
  • テーブルに対してクエリを実行する

環境を設定する

ラボの設定

各ラボでは、新しい Google Cloud プロジェクトとリソースセットを一定時間無料で利用できます。

  1. Qwiklabs にシークレット ウィンドウでログインします。

  2. ラボのアクセス時間(例: 1:15:00)に注意し、時間内に完了できるようにしてください。
    一時停止機能はありません。必要な場合はやり直せますが、最初からになります。

  3. 準備ができたら、[ラボを開始] をクリックします。

  4. ラボの認証情報(ユーザー名パスワード)をメモしておきます。この情報は、Google Cloud Console にログインする際に使用します。

  5. [Google Console を開く] をクリックします。

  6. [別のアカウントを使用] をクリックし、このラボの認証情報をコピーしてプロンプトに貼り付けます。
    他の認証情報を使用すると、エラーが発生したり、料金の請求が発生したりします。

  7. 利用規約に同意し、再設定用のリソースページをスキップします。

BigQuery コンソールを開く

  1. Google Cloud Console で、ナビゲーション メニュー > [BigQuery] を選択します。

[Cloud Console の BigQuery へようこそ] メッセージ ボックスが開きます。このメッセージ ボックスにはクイックスタート ガイドへのリンクと、UI の更新情報が表示されます。

  1. [完了] をクリックします。

タスク 1. 一般公開データセットに対してクエリを実行する

このタスクでは、一般公開データセットの USA Names を BigQuery に読み込んでクエリを実行し、1910 年から 2013 年の間に米国で最も多く付けられた名前を特定します。

USA Names データセットを読み込む

  1. [エクスプローラ] ペインで、[検索語句を入力] に usa_names と入力して Enter キーを押します。

  2. [すべてのプロジェクトを検索] をクリックします。

  3. [エクスプローラ] ペインで、bigquery-public-data にカーソルを合わせて スターを付ける」をクリックします。

  4. [検索語句を入力] に bigquery-public-data と入力すると、プロジェクトのすべてのデータセットが表示されます。

注: 新しいプロジェクトの bigquery-public-data が [エクスプローラ] ペインに表示されない場合は、[+ 追加] > [名前を指定してプロジェクトにスターを付ける] > [プロジェクトにスターを付ける] で bigquery-public-data と入力して [スターを付ける] をクリックします。
  1. bigquery-public-data の [ノードを開く] をクリックします。

  2. 一般公開データセットのリストを下にスクロールし、必要に応じて [さらに表示] をクリックしながらスクロールを続け、[usa_names] を探します。

  3. [usa_names] をクリックしてデータセットを展開します。

  4. [usa_1910_2013] をクリックして、このテーブルを開きます。

USA Names データセットに対してクエリを実行する

bigquery-public-data.usa_names.usa_1910_2013 に対してクエリを実行します。このデータセットで新生児の名前と性別を調べて、上位 10 件の名前を降順で表示します。

  1. [クエリ]、[新しいタブ] の順にクリックします。

  2. 以下のクエリをコピーしてクエリエディタのテキストエリアに貼り付け、既存のクエリを置き換えます。

SELECT name, gender, SUM(number) AS total FROM `bigquery-public-data.usa_names.usa_1910_2013` GROUP BY name, gender ORDER BY total DESC LIMIT 10
  1. ウィンドウの右上のクエリ バリデータを確認します。

クエリが有効な場合は、緑色のチェックマーク アイコンが表示されます。クエリが無効な場合は、赤色の感嘆符アイコンが表示されます。クエリが有効な場合は、クエリの実行時に処理されるデータ量も確認できます。これは、クエリ実行のコストを判断するのに役立ちます。

  1. [実行] をクリックします。

クエリエディタの下にクエリ結果が表示されます。[クエリ結果] の上部には、クエリによって処理されたデータ量と経過時間が表示されます。また、時間の下の表にはクエリ結果が表示されます。ヘッダー行には、クエリの GROUP BY で指定した列の名前が含まれています。

タスク 2. カスタム テーブルを作成する

このタスクでは、カスタム テーブルを作成してデータを読み込み、そのテーブルに対してクエリを実行します。

ローカルのパソコンにデータをダウンロードする

ダウンロードするファイルには、米国社会保障局から提供された、人気のある新生児の名前に関する約 7 MB のデータが含まれています。

  1. 新生児の名前の zip ファイルをローカルのパソコンにダウンロードします。 注: 上記リンクからダウンロードできない場合は、操作ガイドの左側のペインにある受講者向けリソースから新生児の名前の zip ファイルをコピーしてください。
  2. パソコン上でファイルを解凍します。
  3. yob2014.txt というファイルを開いて、データの内容を確認します。これは、名前、性別(M または F)、その名前の新生児の数を示す 3 つの列を含むカンマ区切り値(CSV)ファイルです。このファイルにはヘッダー行がありません。
  4. 後で確認できるように、yob2014.txt ファイルの場所をメモします。

タスク 3. データセットを作成する

このタスクでは、テーブルを格納するデータセットを作成し、プロジェクトにデータを追加して、クエリの対象となるデータテーブルを作成します。

データセットは、プロジェクト内のテーブルとビューへのアクセス制御に役立ちます。このラボではテーブルを 1 つしか使用しませんが、テーブルを格納するデータセットは必要です。

  1. Cloud コンソールに戻り、[エクスプローラ] ペインの [検索語句を入力] ボックスから bigquery-public-data を削除します。
注: 名前を指定してプロジェクトにスターを付ける方法を使用した場合は、上にスクロールして検索結果の一番上まで戻ります。
  1. プロジェクト ID(qwiklabs で始まる ID)をクリックします。

  1. プロジェクト ID の横にあるその他アイコンをクリックし、[データセットを作成] をクリックします。

  2. [データセットを作成する] ページで次の操作を行います。

    • [データセット ID] に「babynames」と入力します。
    • [ロケーション タイプ] で [マルチリージョン] をオンにし、[us(米国の複数のリージョン)] を選択します。
    • [デフォルトのテーブルの有効期限] はデフォルト値のままにしておきます。
    • [暗号化] はデフォルト値のままにしておきます。
  3. ペインの下部にある [データセットを作成] をクリックします。

タスク 4. 新しいテーブルにデータを読み込む

このタスクでは、作成したテーブルにデータを読み込みます。

  1. [エクスプローラ] ペインでプロジェクト ID データセットを開きます。

  2. babynames の横にあるその他アイコン、[テーブルを作成] の順にクリックします。

別途指定のない限り、すべての設定にデフォルト値を使用します。

  1. [テーブルの作成] ページで次の操作を行います。

    • [ソース] で [テーブルの作成元] プルダウン メニューから [アップロード] を選択します。
    • [ファイルを選択] で [参照] をクリックし、yob2014.txt ファイルを選択して [開く] をクリックします。
    • [ファイル形式] で、プルダウン メニューから [CSV] を選択します。
    • [テーブル] に「names_2014」と入力します。
    • [スキーマ] セクションで [テキストとして編集] をクリックし、次のスキーマ定義をテキスト ボックスに貼り付けます。
name:string,gender:string,count:integer
  1. [テーブルを作成] をクリックします(ウインドウの下部にあります)。
注: インポート エラーが表示されても、データのインポートは実行されています。エラーをクリアするには、[閉じる] をクリックしてから [キャンセル] をクリックしてインポート ダイアログを終了します。変更が保存されない旨の警告が表示されたら [はい、終了します] をクリックします。

テーブルをプレビューする

  1. [エクスプローラ] ペインで、[babynames] > [names_2014] を選択します。
  2. 詳細ペインで [プレビュー] タブをクリックします。

タスク 5. テーブルに対してクエリを実行する

テーブルにデータが読み込まれたので、クエリを実行できます。手順は前の例とまったく同じです。ただし今回は、一般公開テーブルではなく自分のテーブルに対してクエリを実行します。

  1. クエリエディタで、[SQL クエリを作成] をクリックします。
  2. 次のクエリをコピーして、クエリエディタに貼り付けます。このクエリは、2014 年に米国で人気が高かった男の子の名前、上位 5 つを取得します。
注: '' で囲った部分は大文字と小文字が区別されるため、作成したデータセットとテーブルの名前に正確に一致させてください。 SELECT name, count FROM `babynames.names_2014` WHERE gender = 'M' ORDER BY count DESC LIMIT 5
  1. [実行] をクリックします。結果はクエリ ウィンドウの下に表示されます。

お疲れさまでした

ここでは、まず一般公開データセットに対してクエリを実行しました。次にカスタム テーブルを作成してデータを読み込み、それに対してクエリを実行しました。

ラボを終了する

ラボが完了したら、[ラボを終了] をクリックします。ラボで使用したリソースが Google Cloud Skills Boost から削除され、アカウントの情報も消去されます。

ラボの評価を求めるダイアログが表示されたら、星の数を選択してコメントを入力し、[送信] をクリックします。

星の数は、それぞれ次の評価を表します。

  • 星 1 つ = 非常に不満
  • 星 2 つ = 不満
  • 星 3 つ = どちらともいえない
  • 星 4 つ = 満足
  • 星 5 つ = 非常に満足

フィードバックを送信しない場合は、ダイアログ ボックスを閉じてください。

フィードバックやご提案の送信、修正が必要な箇所をご報告いただく際は、[サポート] タブをご利用ください。

Copyright 2020 Google LLC All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。

前へ 次へ

始める前に

  1. ラボでは、Google Cloud プロジェクトとリソースを一定の時間利用します
  2. ラボには時間制限があり、一時停止機能はありません。ラボを終了した場合は、最初からやり直す必要があります。
  3. 画面左上の [ラボを開始] をクリックして開始します

このコンテンツは現在ご利用いただけません

利用可能になりましたら、メールでお知らせいたします

ありがとうございます。

利用可能になりましたら、メールでご連絡いたします

1 回に 1 つのラボ

既存のラボをすべて終了して、このラボを開始することを確認してください

シークレット ブラウジングを使用してラボを実行する

このラボの実行には、シークレット モードまたはシークレット ブラウジング ウィンドウを使用してください。これにより、個人アカウントと受講者アカウントの競合を防ぎ、個人アカウントに追加料金が発生することを防ぎます。
プレビュー