![](https://cdn.qwiklabs.com/assets/labs/start_lab-f45aca49782d4033c3ff688160387ac98c66941d.png)
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create a Cloud SQL instance
/ 30
Whitelist the Cloud Shell instance to access your SQL instance
/ 30
Create a bts database and flights table using the create_table.sql file
/ 40
このラボでは、データを CSV テキスト ファイルから Cloud SQL にインポートし、シンプルなクエリを使用していくつかの基本的なデータ分析を行います。
このラボでは米国運輸統計局のデータセットを使用します。このデータセットには、米国の国内線フライトに関する履歴情報が含まれています。このデータセットはデータ サイエンスの多岐にわたるコンセプトと手法の実証に使用できるもので、「Data Science on Google Cloud Platform」クエストのすべてのラボで使用します。
こちらの手順をお読みください。ラボの時間は記録されており、一時停止することはできません。[ラボを開始] をクリックするとスタートするタイマーは、Google Cloud のリソースを利用できる時間を示しています。
このハンズオンラボでは、シミュレーションやデモ環境ではなく、実際のクラウド環境を使ってご自身でラボのアクティビティを行うことができます。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。
このラボを完了するためには、下記が必要です。
[ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるポップアップでお支払い方法を選択してください。 左側の [ラボの詳細] パネルには、以下が表示されます。
[Google Cloud コンソールを開く] をクリックします(Chrome ブラウザを使用している場合は、右クリックして [シークレット ウィンドウでリンクを開く] を選択します)。
ラボでリソースが起動し、別のタブで [ログイン] ページが表示されます。
ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。
必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。
[ラボの詳細] パネルでも [ユーザー名] を確認できます。
[次へ] をクリックします。
以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。
[ラボの詳細] パネルでも [パスワード] を確認できます。
[次へ] をクリックします。
その後次のように進みます。
その後、このタブで Google Cloud コンソールが開きます。
Cloud Shell は、開発ツールと一緒に読み込まれる仮想マシンです。5 GB の永続ホーム ディレクトリが用意されており、Google Cloud で稼働します。Cloud Shell を使用すると、コマンドラインで Google Cloud リソースにアクセスできます。
接続した時点で認証が完了しており、プロジェクトに各自の PROJECT_ID が設定されます。出力には、このセッションの PROJECT_ID を宣言する次の行が含まれています。
gcloud
は Google Cloud のコマンドライン ツールです。このツールは、Cloud Shell にプリインストールされており、タブ補完がサポートされています。
[承認] をクリックします。
出力は次のようになります。
出力:
出力:
出力例:
gcloud
ドキュメントの全文については、gcloud CLI の概要ガイドをご覧ください。
このラボでは、O'Reilly Media, Inc. の書籍『Data Science on Google Cloud Platform, 2nd Edition』用に作成されたコードサンプルとスクリプトを使用します。この書籍の第 3 章「Creating Compelling Dashboards」の最初の部分で説明されている Google Cloud SQL の構成とデータ インポート タスクを取り上げます。第 2 章で使用されている GitHub のサンプル リポジトリのクローンを Cloud Shell に作成して、そこからこのラボのタスクをすべて実施します。
このコマンドが完了するまでに数分かかります。
[進行状況を確認] をクリックして、実行したタスクを確認します。Cloud SQL インスタンスが正常に作成されている場合は、評価スコアが表示されます。
[進行状況を確認] をクリックして、実行したタスクを確認します。SQL インスタンスにアクセスするために、Cloud Shell が許可リストに正常に登録された場合は、評価スコアが表示されます。
Postgres テーブルにデータをインポートするには、まず適切なスキーマで空のデータベースとテーブルを作成します。
Cloud コンソールのナビゲーション メニュー()で [SQL] をクリックします。
インスタンスの [概要] ページを開くには、インスタンス名の flights
をクリックします。
左側にある SQL のナビゲーション メニューから [データベース] を選択します。
[データベースを作成] をクリックします。
新しいデータベース ダイアログで、データベースに bts
と名前を付けます。
[作成] をクリックします。
インスタンスの概要ページを開くには、SQL のナビゲーション メニューから [概要] を選択します。
上部の [インポート] をクリックします。
Cloud Storage ファイルの欄で、[参照] をクリックします。
バケットのセクションで、バケット名の反対側にある矢印をクリックします。
create_table.sql
のファイルを選択します。
[選択] をクリックします。
[ファイル形式] セクションで、SQL を選択します。
Cloud SQL インスタンスで、bts
データベースを指定します。
[インポート] をクリックして、インポートを開始します。
数秒経ったら、空のテーブルができあがります。
[進行状況を確認] をクリックして、実行したタスクを確認します。create_table.sql ファイルを使用して bts データベースとフライト テーブルが正常に作成された場合は、評価スコアが表示されます。
空のデータベースとテーブルが作成できたので、ここでテーブルに CSV ファイルを読み込みます。バケットで 201501.csv を参照して 1 月のデータを読み込み、形式に CSV を、データベースに bts を、テーブルに flights を指定します。
Cloud SQL のインスタンス ページで、[インポート] をクリックします。
Cloud Storage ファイルの欄で [参照] をクリックし、バケット名の反対側にある矢印をクリックして、201501.csv
をクリックします。
[選択] をクリックします。
ファイル形式は [CSV] を選択します。
bts
データベースを選択し、テーブルには flights
と入力します。
[インポート] をクリックします。
パスワードの入力を求められたら、「Passw0rd
」と入力します。入力した文字が表示されない場合があります。
表示されたプロンプトで、bts データベースに接続します。
パスワードの入力を求められたら、「Passw0rd
」と入力します。
それから、最も交通量が多い 5 つの空港の情報を得るためにクエリを実行します。
データベースが比較的小規模(1 月のみ)であることから、このクエリは高いパフォーマンスを示していますが、さらに月を追加するとデータベースは遅くなります。
リレーショナル データベースは、少量のデータのサブセットを返すアドホック クエリを実行する際の、小型のデータセットに適しています。大規模なデータセットについては、関係のある列のインデックスを作成することで、リレーショナル データベースのパフォーマンスを調整します。一般的に、リレーショナル データベースはトランザクションをサポートし、強整合性を保証するために頻繁に更新されるデータ向けとしては最高の選択肢です。
ですが、以下の場合はリレーショナル データベースは適切ではありません。
これはフライト遅延のユースケースの説明です。このケースでは、リレーショナル データベースではなく、アナリティクス データ ウェアハウスである BigQuery に切り替えます。アナリティクス データ ウェアハウスは SQL の使用が可能で、大型のデータセットやアドホック クエリに対する優れた処理能力を備えています(つまり、列のインデックスを作成する必要はありません)。
このラボでは、テーブルを作成して、Cloud Storage に保存されているテキストデータを Google Cloud SQL にインポートする方法を学びました。
フォローアップ情報:
Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。
マニュアルの最終更新日: 2023 年 11 月 28 日
ラボの最終テスト日: 2023 年 11 月 28 日
Copyright 2024 Google LLC All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。
このコンテンツは現在ご利用いただけません
利用可能になりましたら、メールでお知らせいたします
ありがとうございます。
利用可能になりましたら、メールでご連絡いたします
One lab at a time
Confirm to end all existing labs and start this one