检查点
Query a public dataset (dataset: samples, table: natality)
/ 15
Create a new dataset
/ 30
Load data into your table
/ 40
Query a custom dataset
/ 15
BigQuery:Qwik Start - 控制台
GSP072
概览
如果没有合适的硬件和基础架构,存储和查询大量数据集可能非常耗时且昂贵。BigQuery 是一种企业数据仓库,它借助 Google 基础架构的强大处理能力实现了极其快速的 SQL 查询功能,从而解决了上述问题。您只需将数据迁移至 BigQuery,余下的困难部分由我们负责。您可以根据业务需求控制对项目和数据的访问权限,例如授权其他人来查看或查询您的数据。
您可以通过以下方式访问 BigQuery:使用控制台、使用命令行工具,或使用各种客户端库(例如 Java、.NET 或 Python)调用 BigQuery REST API。您还可以使用各种第三方工具与 BigQuery 交互,例如直观呈现数据或加载数据。
本实操实验将向您介绍如何查询公共表,以及如何将示例数据加载到 BigQuery 中。
您将执行的操作
- 查询公共数据集
- 创建新数据集
- 将数据加载到新表中
- 查询自定义表
设置和要求
点击“开始实验”按钮前的注意事项
请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。
此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。我们会为您提供新的临时凭据,让您可以在实验规定的时间内用来登录和访问 Google Cloud。
为完成此实验,您需要:
- 能够使用标准的互联网浏览器(建议使用 Chrome 浏览器)。
- 完成实验的时间 - 请注意,实验开始后无法暂停。
如何开始实验并登录 Google Cloud 控制台
-
点击开始实验按钮。如果该实验需要付费,系统会打开一个弹出式窗口供您选择付款方式。左侧是实验详细信息面板,其中包含以下各项:
- 打开 Google Cloud 控制台按钮
- 剩余时间
- 进行该实验时必须使用的临时凭据
- 帮助您逐步完成本实验所需的其他信息(如果需要)
-
点击打开 Google Cloud 控制台(如果您使用的是 Chrome 浏览器,请右键点击并选择在无痕式窗口中打开链接)。
该实验会启动资源并打开另一个标签页,显示登录页面。
提示:请将这些标签页安排在不同的窗口中,并将它们并排显示。
注意:如果您看见选择账号对话框,请点击使用其他账号。 -
如有必要,请复制下方的用户名,然后将其粘贴到登录对话框中。
{{{user_0.username | "<用户名>"}}} 您也可以在实验详细信息面板中找到用户名。
-
点击下一步。
-
复制下面的密码,然后将其粘贴到欢迎对话框中。
{{{user_0.password | "<密码>"}}} 您也可以在实验详细信息面板中找到密码。
-
点击下一步。
重要提示:您必须使用实验提供的凭据。请勿使用您的 Google Cloud 账号凭据。 注意:在本次实验中使用您自己的 Google Cloud 账号可能会产生额外费用。 -
继续在后续页面中点击以完成相应操作:
- 接受条款及条件。
- 由于该账号为临时账号,请勿添加账号恢复选项或双重验证。
- 请勿注册免费试用。
片刻之后,系统会在此标签页中打开 Google Cloud 控制台。
激活 Cloud Shell
Cloud Shell 是一种装有开发者工具的虚拟机。它提供了一个永久性的 5GB 主目录,并且在 Google Cloud 上运行。Cloud Shell 提供可用于访问您的 Google Cloud 资源的命令行工具。
- 点击 Google Cloud 控制台顶部的激活 Cloud Shell 。
如果您连接成功,即表示您已通过身份验证,且当前项目会被设为您的 PROJECT_ID 环境变量所指的项目。输出内容中有一行说明了此会话的 PROJECT_ID:
gcloud
是 Google Cloud 的命令行工具。它已预先安装在 Cloud Shell 上,且支持 Tab 自动补全功能。
- (可选)您可以通过此命令列出活跃账号名称:
-
点击授权。
-
现在,输出的内容应如下所示:
输出:
- (可选)您可以通过此命令列出项目 ID:
输出:
输出示例:
gcloud
, in Google Cloud, refer to the gcloud CLI overview guide.
任务 1. 打开 BigQuery
通过 BigQuery 控制台界面,您可以查询表(包括由 BigQuery 提供的公共数据集)。您将运行的查询会访问 BigQuery 提供的公共数据集中的表。系统会使用标准查询语言搜索数据集,并将返回结果限制为 10 条。
打开 BigQuery 控制台
- 在 Google Cloud 控制台中,选择导航菜单 > BigQuery。
您会看到欢迎在 Cloud 控制台中使用 BigQuery 消息框,其中提供了指向快速入门指南和版本说明的链接。
- 点击完成。
BigQuery 控制台即会打开。
任务 2. 查询公共数据集
- 点击编写新查询。复制以下查询并将其粘贴到 BigQuery 查询编辑器中:
该数据样本包含有关美国出生率的信息。
根据查询是否有效,系统会显示绿色或红色对勾。如果查询有效,则在您运行查询后,验证器还会描述要处理的数据量。
此信息有助于确定运行查询的费用。
- 点击运行按钮。
查询结果应类似于以下内容:
验证您已完成的任务
点击检查我的进度,验证您已完成的任务。如果您成功地对公共数据集运行了查询,就会看到一个评估分数。
任务 3. 创建新数据集
如要将自定义数据加载到表中,您需要先创建一个 BigQuery 数据集。
数据集有助于控制对项目中的表和视图的访问权限。本实验仅使用一个表,但您仍需使用一个数据集来保存该表。
- 在探索器窗格中,点击项目 ID 旁边的查看操作 (),然后点击创建数据集。
-
将数据集 ID 设为 babynames。
-
将所有其他字段保留为默认设置。点击创建数据集。
现在您就拥有一个数据集了。
验证您已完成的任务
点击检查我的进度,验证您已完成的任务。如果您已成功创建 BigQuery 数据集,就会看到一个评估分数。
任务 4. 将数据加载到新表中
接下来,您要在 babynames 数据集内创建一个表,然后将数据文件从存储桶加载到这个新表中。
您将使用的自定义数据文件包含约 7 MB 的热门婴儿姓名数据,该文件由美国社会保障管理局提供。
-
在 Cloud 控制台中,选择导航菜单 > BigQuery,以返回 BigQuery 控制台。
-
点击数据集旁边的查看操作 () 前往 babynames 数据集,然后点击创建表。
-
在“创建表”对话框中,设置以下字段,并将所有其他字段保留为默认值:
字段 | 值 |
---|---|
基于以下数据源创建表 | Google Cloud Storage |
从 GCS 存储桶中选择文件 | spls/gsp072/baby-names/yob2014.txt |
文件格式 | CSV |
表 | names_2014 |
架构 > 以文本形式修改 | 滑动以启用该设置,然后在文本框中添加以下内容:name:string,gender:string,count:integer
|
- 点击创建表按钮。
在 BigQuery 中完成创建表和加载数据的操作后,您便会在 babynames
数据集下看到 names_2014
表。
验证您已完成的任务
点击检查我的进度,验证您已完成的任务。如果您已成功地将数据加载到数据集表中,就会看到一个评估分数。
任务 5. 预览表
查看您的表!查看前几行数据。
- 点击左侧面板中的
names_2014
表,然后点击预览。
该表已可用于查询。
任务 6. 查询自定义数据集
对自定义数据运行查询和您之前查询公共数据集的过程相同,只是现在您要查询的是自己的表,而非公共表。
-
在 BigQuery 中,点击顶部的 +(编写新查询)图标。
-
将以下查询粘贴或输入到查询编辑器中。
- 点击运行按钮。该查询会显示您加载到表中的数据所对应年份 (2014) 的最热门的 5 个男孩名。
验证您已完成的任务
点击检查我的进度,验证您已完成的任务。如果您成功地对自定义数据集运行了查询,就会看到一个评估分数。
任务 7. 检验您的掌握情况
我们在下方准备了一道判断题,以加强您对本实验所涉概念的理解。请尽您所能回答。
恭喜!
您成功地使用 BigQuery 查询了公共表,并将示例数据加载到了 BigQuery 中。
后续步骤/了解详情
本实验是 Qwik Starts 系列实验的其中一项。通过这些实验,您可以一窥 Google Cloud 的诸多功能。请在实验目录中搜索“Qwik Starts”,找到您要参与的下一项实验!
Google Cloud 培训和认证
…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。
上次更新手册的时间:2024 年 4 月 19 日
上次测试实验的时间:2024 年 4 月 19 日
版权所有 2024 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。