
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Enable relevant APIs and set IAM roles
/ 15
Create a cloud resource connection
/ 10
Grant IAM permissions to the connection's service account
/ 10
Create the dataset and object table in BigQuery for movie poster images
/ 10
Create the Gemini Remote models in BigQuery
/ 10
Prompt Gemini to provide movie summaries for each poster
/ 20
Generate text embeddings for a subset of the IMDB dataset
/ 25
在本实验中,您将学习如何将 BigQuery 机器学习推理功能与远程模型(Gemini AI 模型)结合使用,以便分析电影海报图片并生成对应的影片摘要,这是概念验证项目的一部分。
BigQuery 是一个 AI 就绪型全托管式数据分析平台,可帮助您充分发掘数据的价值,并支持多引擎、多格式和多云。其主要功能之一是 BigQuery 机器学习推理,该功能允许您使用 GoogleSQL 查询来创建和运行机器学习 (ML) 模型。
Gemini 是 Google DeepMind 开发的一系列生成式 AI 模型,专为多模态应用场景而设计。通过 Gemini API,您可以使用 Gemini Pro Vision 和 Gemini Pro 模型。
对大型数据集执行机器学习或人工智能 (AI) 任务通常涉及大量编程工作,并需要具备机器学习框架方面的知识。这些要求使得解决方案的开发工作只能由公司内一小部分人员来完成,数据分析师虽然了解数据,但欠缺机器学习和编程专业知识,因而爱莫能助。但借助 BigQuery 机器学习推理功能,SQL 专业人员可以使用现有 SQL 工具和技能来构建模型,并通过大语言模型 (LLM) 和 Cloud AI API 来生成结果。
在本实验中,您将学习如何完成以下操作:
请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。
此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。为此,我们会向您提供新的临时凭据,您可以在该实验的规定时间内通过此凭据登录和访问 Google Cloud。
为完成此实验,您需要:
点击开始实验按钮。如果该实验需要付费,系统会打开一个对话框供您选择支付方式。左侧是“实验详细信息”窗格,其中包含以下各项:
点击打开 Google Cloud 控制台(如果您使用的是 Chrome 浏览器,请右键点击并选择在无痕式窗口中打开链接)。
该实验会启动资源并打开另一个标签页,显示“登录”页面。
提示:将这些标签页安排在不同的窗口中,并排显示。
如有必要,请复制下方的用户名,然后将其粘贴到登录对话框中。
您也可以在“实验详细信息”窗格中找到“用户名”。
点击下一步。
复制下面的密码,然后将其粘贴到欢迎对话框中。
您也可以在“实验详细信息”窗格中找到“密码”。
点击下一步。
继续在后续页面中点击以完成相应操作:
片刻之后,系统会在此标签页中打开 Google Cloud 控制台。
在此项任务中,您需要配置实验环境,以便在项目中使用适用于 Gemini 的 Cloud AI Companion API 和 Vertex AI 平台 API。
使用您的实验凭据登录 Google Cloud 控制台,并打开 Cloud Shell 终端窗口。
如需设置项目 ID 和区域环境变量,请在 Cloud Shell 中运行以下命令:
如需将已登录的 Google 用户账号存储到环境变量中,请运行以下命令:
启用适用于 Gemini 的 Cloud AI Companion API 和 Vertex AI API:
如需使用 Gemini,请为您的 Google Cloud Qwiklabs 用户账号授予必要的 IAM 角色:
添加这些角色后,用户即可开始使用 Gemini 助手。
如需验证是否已完成以下目标,请点击检查我的进度:
在此项任务中,您将在 BigQuery 中创建一个 Cloud 资源连接,以便使用 Gemini Pro 和 Gemini Pro Vision 模型。
在 Google Cloud 控制台中,点击导航菜单下的 BigQuery。
在“欢迎”弹出式窗口中点击完成。
如需创建连接,请点击 + 添加,然后点击与外部数据源的连接。
在“连接类型”列表中,选择 Vertex AI 远程模型、远程函数和 BigLake(Cloud 资源)。
在“连接 ID”字段中,输入 gemini_conn 作为连接的名称。
在位置类型部分,选择多区域,然后从下拉菜单中选择美国(多区域)。
对于其他设置,请使用默认值。
点击创建连接。
点击转到连接。
将“连接信息”窗格中的服务账号 ID 复制到一个文本文件中,以便在下个任务中使用。您还会看到,在 BigQuery 探索器中,该连接已添加到您项目下的“外部连接”部分。
点击“检查我的进度”以验证是否完成了以下目标:
在此项任务中,您将通过角色为 Cloud 资源连接的服务账号授予 IAM 权限,使其能够访问 Vertex AI 服务。
在 Google Cloud 控制台中,点击导航菜单下的 IAM 和管理。
点击授予访问权限。
在新的主账号字段中,输入您之前复制的服务账号 ID。
在“选择角色”字段中,输入 Vertex AI,然后选择 Vertex AI User 角色。
点击保存。
这样该服务账号 ID 就拥有了 Vertex AI User 角色。
点击“检查我的进度”以验证是否完成了以下目标:
在此项任务中,您将为项目创建一个数据集,并在其中创建一个对象表来存储海报图片。
在 Google Cloud 控制台中,依次选择导航菜单 () 和 BigQuery。
在探索器面板中,针对
您可以创建数据集来存储数据库对象,包括表和模型。
在创建数据集窗格中,输入以下信息:
字段 | 值 |
---|---|
数据集 ID | gemini_demo |
位置类型 | 选择多区域 |
多区域 | 选择美国 |
对于其他字段,保留默认值。
点击创建数据集。
这将创建 gemini_demo 数据集,并在 BigQuery 探索器中您的项目下列出该数据集。
要创建对象表,可以使用 SQL 查询。
点击 + 以创建新的 SQL 查询。
在查询编辑器中,粘贴下面的查询。
运行该查询。
这会将 movie_posters 对象表添加到 gemini_demo 数据集中,并加载每张电影海报图片的 URI(Cloud Storage 位置)。
在“探索器”中,点击 movie_posters 表,查看架构和详细信息。请查询此表以查看特定记录。
点击“检查我的进度”以验证是否完成了以下目标:
对象表创建完毕后,就可以开始使用它了。在此项任务中,您将在 BigQuery 中创建 Gemini Pro 和 Gemini Pro Vision 模型的远程模型。
点击 + 以创建一个新的 SQL 查询。
在查询编辑器中,粘贴下方的查询并运行。
这将创建 gemini_pro 模型,您会看到它已添加到“模型”部分的 gemini_demo 数据集中。
在“探索器”中,点击 gemini_pro 模型,查看详细信息和架构。
点击 + 以创建一个新的 SQL 查询。
在查询编辑器中,粘贴下方的查询并运行。
这将创建 gemini_pro_vision 模型,您会看到它已添加到“模型”部分的 gemini_demo 数据集中。
在“探索器”中,点击 gemini_pro_vision 模型,查看详细信息和架构。
点击“检查我的进度”以验证是否完成了以下目标:
在此项任务中,您将使用 Gemini(您刚刚创建的 Gemini Pro 和 Vision 模型)来分析电影海报图片,并生成每部影片的摘要。
点击 + 以创建一个新的 SQL 查询。
在查询编辑器中,粘贴下方的查询并运行。
这将会创建 movie_posters_results 表。
在“探索器”中,点击 movie_posters_results 表,查看架构和详细信息。
点击 + 以创建一个新的 SQL 查询。
在查询编辑器中,粘贴下方的查询并运行。
这将显示每张电影海报的行,其中包括 URI(电影海报图片的 Cloud Storage 位置),以及包含 Gemini Pro Vision 模型中的影片名称和影片发行年份的 JSON 结果。
您可以使用下方的查询,以更便于人类阅读的方式检索这些结果。
点击 + 以创建一个新的 SQL 查询。
在查询编辑器中,粘贴下方的查询并运行。
这将会创建 movie_posters_result_formatted 表。
您可以通过下方的查询来查询此表,以查看创建的行。
请注意,URI 列结果保持不变,但 JSON 现已转换为每一行的名称和年份列。
您可以运行以下查询,让 Gemini Pro 提供每张海报对应的影片摘要。
请注意,结果与上一条查询类似,但现在提示列中显示了用于 Gemini 的提示,并且使用此提示的结果也包含在 ml_generate_text_llm_result 字段中,其中包括影片的简短摘要。
点击“检查我的进度”以验证是否完成了以下目标:
在此项任务中,您将使用远程模型生成文本嵌入,以便执行进一步分析。
要生成文本嵌入,您需要使用托管在端点上的 text-multilingual-embedding-002 远程模型,然后才能生成嵌入。
点击 + 以创建一个新的 SQL 查询。
在查询编辑器中,粘贴下方的查询并运行。
这将创建 text_embedding 模型,并显示在探索器中 gemini_demo 数据集的下方。
您需要创建一个表来存储结果。
点击 + 以创建一个新的 SQL 查询。
在查询编辑器中,粘贴下方的查询并运行。
这将创建 movie_poster_results_embeddings 表,其中包含为 gemini_demo.movie_posters_results_formatted 表中的文本内容(URI、影片名称和发行年份)创建嵌入的结果。
您可以使用下面的新查询来查看查询结果:
您可以看到模型生成的每部影片的嵌入(由数字表示的向量)。
您将创建一个新视图,其中仅包含数据集中于 1935 年之前发行的影片。
使用以下 SQL 语句创建并运行一个新查询。
这将生成一个新视图,其中包含 bigquery-public-data.imdb.reviews 表中于 1935 年之前发行的所有影片的影片 ID、片名和发行年份列表。
使用以下 SQL 语句创建并运行一个新查询。
查询的结果是一个表,其中包含 gemini_demo.imdb_movies 表的文本内容的嵌入。
使用以下 SQL 语句创建并运行一个新查询。
该查询使用 VECTOR_SEARCH 函数在 gemini_demo.imdb_movies_embeddings 表中查找 gemini_demo.movie_posters_results_embeddings 表中每一行的最近邻。最近邻是通过余弦距离指标找到的,该指标能够判断两个嵌入项的相似程度。
此查询可用于在 IMDB 数据集中查找与 Gemini Pro Vision 在电影海报中识别的每部影片最相似的影片。例如,您可以使用此查询,在 IMDB 公共数据集中查找与影片“Au Secours!”(由 Gemini Pro Vision 在其中一张电影海报中识别)最为匹配的结果,该公共数据集通过英文片名“Help!”来指代该影片。
创建并运行一个新查询,以便联接 IMDB 公共数据集中提供的有关影片评分的其他信息。
此查询与上一条查询类似。它仍然使用特殊数值表示法(向量嵌入)来查找与给定电影海报相似的影片。不过,它还会从 IMDB 公共数据集内的单独表中,联接每个最近邻影片的平均评分和投票数。
点击“检查我的进度”以验证是否完成了以下目标:
您成功地在 BigQuery 中为海报图片创建了对象表,创建了远程 Gemini 模型,使用这些模型提示 Gemini 分析图片并提供影片摘要,为片名生成了文本嵌入,并使用嵌入将电影海报图片与 IMDB 数据集中的相关片名进行了匹配。
…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。
上次更新手册的时间:2024 年 10 月 4 日
上次测试实验的时间:2024 年 5 月 23 日
版权所有 2025 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。
此内容目前不可用
一旦可用,我们会通过电子邮件告知您
太好了!
一旦可用,我们会通过电子邮件告知您
One lab at a time
Confirm to end all existing labs and start this one