
始める前に
- ラボでは、Google Cloud プロジェクトとリソースを一定の時間利用します
- ラボには時間制限があり、一時停止機能はありません。ラボを終了した場合は、最初からやり直す必要があります。
- 画面左上の [ラボを開始] をクリックして開始します
このラボでは、2 つの異なる一般公開データセットを分析します。それらに対して別々にクエリを実行したり、それらを組み合わせてクエリを実行したりして、興味深い分析情報を引き出します。
このラボの内容:
これは、BigQuery と SQL に関して一定の経験がある方を対象とした基礎レベルのラボです。
このラボでは、BigQuery で 2 つの一般公開データセット(米国海洋大気庁(NOAA)の気象データとニューヨーク市の自転車レンタルデータ)を使用します。
データ サイエンティストにとって非常に便利な Google Cloud Platform の特徴を体験できます。
最終的に、雨の日にはレンタル自転車の利用が減るかどうかを特定することが目標です。
各ラボでは、新しい Google Cloud プロジェクトとリソースセットを一定時間無料で利用できます。
[ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるポップアップでお支払い方法を選択してください。 左側の [ラボの詳細] パネルには、以下が表示されます。
[Google Cloud コンソールを開く] をクリックします(Chrome ブラウザを使用している場合は、右クリックして [シークレット ウィンドウで開く] を選択します)。
ラボでリソースが起動し、別のタブで [ログイン] ページが表示されます。
ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。
必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。
[ラボの詳細] パネルでもユーザー名を確認できます。
[次へ] をクリックします。
以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。
[ラボの詳細] パネルでもパスワードを確認できます。
[次へ] をクリックします。
その後次のように進みます。
その後、このタブで Google Cloud コンソールが開きます。
このタスクでは、一般公開データセット bigquery-public-data
(具体的には new_york_citibike
データセット)を探索します。citibike_trips
テーブルのスキーマを調べ、クエリを実行してルートの所要時間を分析し、各自転車の合計走行距離を計算します。
[Cloud コンソールの BigQuery へようこそ] メッセージ ボックスが開きます。このメッセージ ボックスにはクイックスタート ガイドへのリンクと、UI の更新情報が表示されます。
[完了] をクリックします。
左側のペインで [+ 追加] > [名前を指定してプロジェクトにスターを付ける] をクリックして、次にポップアップ ウィンドウに「bigquery-public-data」と入力し、最後に [スターを付ける] をクリックします。
BigQuery コンソールの左側のペインに、Qwiklabs プロジェクト ID のプロジェクトと bigquery-public-data プロジェクトの 2 つのプロジェクトが表示されています。
BigQuery コンソールの左側のペインで、[bigquery-public-data] > [new_york_citibike] > [citibike_trips] テーブルを選択します。
テーブル(citibike_trips)のウィンドウで [スキーマ] タブをクリックします。
列名とデータ型を確認します。
青色の + ボタンをクリックして、新しいクエリを作成します。
次のクエリを入力します。
[実行] をクリックします。結果を確認し、このクエリによって何が行われたのかを検討してみましょう。
さらに以下のクエリを実行して、興味深い事実をもう 1 つ特定します。このクエリは、データセット内の各自転車の総移動距離を調べます。ここでは結果を上位 5 件に制限しています。
このタスクでは、ghcn_d
データセットを探索します。ghcnd_2015
テーブルをプレビューし、クエリを実行してニューヨークの気象ステーションから降水量データを取得します。
BigQuery コンソールの左側のペインから、新しく追加した bigquery-public-data
プロジェクトを選択し、[ghcn_d] > [ghcnd_2015] を選択します。
次に [プレビュー] タブをクリックすると、コンソールには次のように表示されます。
列とデータの値を確認します。
このクエリは、ニューヨークにある気象観測所の ID(これは NEW YORK CNTRL PK TWR に対応します)を指定して、そこで観測された 2015 年の各日付の降水量(mm)を取得します。
このタスクでは、new_york_citibike.citibike_trips
データセットと ghcn_d.ghcnd_2015
気象データセットを結合して、雨の日と雨でない日の自転車の平均利用回数を特定し、降雨と自転車レンタルの間の相関関係を分析します。
自転車レンタルのデータを気象データに結合して、雨の日にはレンタル自転車の利用が減るかどうかを調べてみましょう。
自転車レンタルのデータセットと気象のデータセットという、まったくソースの異なる 2 つのデータセットを結合した結果が表示されます。
このクエリの結果から、雨の日にはニューヨーク市のレンタル自転車の利用が 47% 減少することがわかります。
このラボでは、2 つのデータセットに対してアドホック クエリを実行しました。クラスタを設定したりインデックスを作成したりすることなく、データに対するクエリを実行できました。また、2 つのデータセットを組み合わせて、興味深い分析情報を得ることもできました。また、これらをすべて、ブラウザから離れることなく行えました。
BigQuery で非常に興味深いクエリを実行する方法を学習しました。
ラボが完了したら、[ラボを終了] をクリックします。ラボで使用したリソースが Google Cloud Skills Boost から削除され、アカウントの情報も消去されます。
ラボの評価を求めるダイアログが表示されたら、星の数を選択してコメントを入力し、[送信] をクリックします。
星の数は、それぞれ次の評価を表します。
フィードバックを送信しない場合は、ダイアログ ボックスを閉じてください。
フィードバックやご提案の送信、修正が必要な箇所をご報告いただく際は、[サポート] タブをご利用ください。
Copyright 2020 Google LLC All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。
このコンテンツは現在ご利用いただけません
利用可能になりましたら、メールでお知らせいたします
ありがとうございます。
利用可能になりましたら、メールでご連絡いたします
1 回に 1 つのラボ
既存のラボをすべて終了して、このラボを開始することを確認してください