arrow_back

使用 Gemini 实现多模态零售推荐

登录 加入
欢迎加入我们的社区,一起测试和分享您的知识!
done
学习 700 多个动手实验和课程并获得相关技能徽章

使用 Gemini 实现多模态零售推荐

实验 1 小时 universal_currency_alt 5 个积分 show_chart 中级
info 此实验可能会提供 AI 工具来支持您学习。
欢迎加入我们的社区,一起测试和分享您的知识!
done
学习 700 多个动手实验和课程并获得相关技能徽章

GSP1230

Google Cloud 自定进度实验

概览

Gemini 是 Google DeepMind 开发的一系列生成式 AI 模型,专为多模态应用场景而设计。通过 Gemini API,您可以使用 Gemini Pro Vision 和 Gemini Pro 模型。

对于零售公司来说,推荐系统可以提升客户体验,从而提高销售额。在本实验中,您将学习如何使用 Gemini Pro Vision 模型快速创建多模态推荐系统。Gemini Pro Vision 模型可以使用多模态模型提供建议和解释。

在本实验中,您将从一个场景(如客厅)开始,然后使用 Gemini Pro Vision 模型进行视觉理解。您还将研究 Gemini Pro Vision 模型如何从您输入的家具商品清单中推荐一件商品(如椅子)。

Vertex AI Gemini API

Vertex AI Gemini API 提供了与多种 Gemini 模型交互的统一接口。Gemini API 目前支持以下两种模型:

  1. Gemini Pro 模型 (gemini-pro):旨在处理自然语言任务、多轮文本和代码聊天,以及代码生成。
  2. Gemini Pro Vision 模型 (gemini-pro-vision):支持多模态提示。您可以在提示请求中加入文本、图片和视频,并获取文本或代码回答。

您可通过以下方式与 Gemini API 进行交互:

  • 使用 Vertex AI Studio 进行快速测试以及生成命令
  • 使用 cURL 命令
  • 使用 Vertex AI SDK

本实验侧重于运用 Gemini Pro Vision 模型的多模态功能。

如需了解详情,请参阅 Vertex AI 上的生成式 AI 文档。

目标

在本实验中,您将学习如何完成以下操作:

  • 使用 Gemini Pro Vision 模型 (gemini-pro-vision) 进行视觉理解
  • 在为 Gemini Pro Vision 模型输入提示时,将多模态纳入考量
  • 使用 Gemini Pro Vision 模型创建零售推荐应用

设置和要求

点击“开始实验”按钮前的注意事项

请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。

此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。我们会为您提供新的临时凭据,让您可以在实验规定的时间内用来登录和访问 Google Cloud。

为完成此实验,您需要:

  • 能够使用标准的互联网浏览器(建议使用 Chrome 浏览器)。
注意:请使用无痕模式或无痕浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。
  • 完成实验的时间 - 请注意,实验开始后无法暂停。
注意:如果您已有自己的个人 Google Cloud 账号或项目,请不要在此实验中使用,以避免您的账号产生额外的费用。

如何开始实验并登录 Google Cloud 控制台

  1. 点击开始实验按钮。如果该实验需要付费,系统会打开一个弹出式窗口供您选择付款方式。左侧是实验详细信息面板,其中包含以下各项:

    • 打开 Google Cloud 控制台按钮
    • 剩余时间
    • 进行该实验时必须使用的临时凭据
    • 帮助您逐步完成本实验所需的其他信息(如果需要)
  2. 点击打开 Google Cloud 控制台(如果您使用的是 Chrome 浏览器,请右键点击并选择在无痕式窗口中打开链接)。

    该实验会启动资源并打开另一个标签页,显示登录页面。

    提示:请将这些标签页安排在不同的窗口中,并将它们并排显示。

    注意:如果您看见选择账号对话框,请点击使用其他账号
  3. 如有必要,请复制下方的用户名,然后将其粘贴到登录对话框中。

    {{{user_0.username | "<用户名>"}}}

    您也可以在实验详细信息面板中找到用户名

  4. 点击下一步

  5. 复制下面的密码,然后将其粘贴到欢迎对话框中。

    {{{user_0.password | "<密码>"}}}

    您也可以在实验详细信息面板中找到密码

  6. 点击下一步

    重要提示:您必须使用实验提供的凭据。请勿使用您的 Google Cloud 账号凭据。 注意:在本次实验中使用您自己的 Google Cloud 账号可能会产生额外费用。
  7. 继续在后续页面中点击以完成相应操作:

    • 接受条款及条件。
    • 由于该账号为临时账号,请勿添加账号恢复选项或双重验证。
    • 请勿注册免费试用。

片刻之后,系统会在此标签页中打开 Google Cloud 控制台。

注意:如需查看列有 Google Cloud 产品和服务的菜单,请点击左上角的导航菜单导航菜单图标

任务 1. 在 Vertex AI Workbench 中打开笔记本

  1. 在 Google Cloud 控制台的导航菜单中依次点击 Vertex AI > Workbench

  2. 用户管理的笔记本页面上,找到 generative-ai-jupyterlab 笔记本并点击打开 JupyterLab 按钮。

JupyterLab 界面会在新的浏览器标签页中打开。

任务 2. 打开 generative-ai 文件夹

  1. 找到笔记本左侧的 generative-ai 文件夹。

  2. 找到 /gemini/use-cases/retail 文件夹。

  3. 打开 multimodal_retail_recommendations.ipynb 文件。

  4. 运行笔记本的开始使用导入库部分。

    • 对于项目 ID,请使用 ;对于位置,使用
注意:您可以跳过任何标为“仅限 Colab”的笔记本单元。

点击检查我的进度以验证是否完成了以下目标:

安装 Vertex AI SDK for Python 并导入库。

在后续部分中,您将运行多个笔记本单元,了解如何使用 Gemini Pro Vision 模型的多模态功能。

任务 3. 使用 Gemini Pro Vision 模型

Gemini Pro Vision 模型 (gemini-pro-vision) 是一个多模态模型,它支持在文本或聊天提示中添加图片和视频,并向用户提供文本响应。

  1. 在此任务中,您将运行多个笔记本单元,了解如何使用 Gemini Pro Vision 模型,在单个提示中结合使用文本和图片来详细描述图片中的房间。

点击检查我的进度以验证是否完成了以下目标:

使用 Gemini Pro Vision 模型描述房间。

任务 4. 根据内置的知识,生成开放式推荐内容

使用同一张图片,并搭配对房间的描述,您可以要求模型推荐一件适合房间摆放的家具。请注意,在这种情况下,模型可以选择推荐任何家具,而且可以根据其独有的内置知识进行推荐。

  1. 运行多个笔记本单元,了解如何使用同一张图片并搭配对房间的描述,要求 Gemini Pro Vision 模型推荐一件适合房间摆放的家具。

点击检查我的进度以验证是否完成了以下目标:

使用 Gemini Pro Vision 模型推荐一件家具。

任务 5. 根据提供的图片生成建议

您也可以提供一个商品清单供模型选择,而不是放开推荐范围。在此部分,您将下载一些椅子图片,将它们设置为 Gemini 模型的推荐来源选项。这对零售公司来说尤其有用,因为他们希望根据用户房间的类型和有售的商品向用户提供推荐。

  1. 在此任务中,您将运行多个笔记本单元,了解如何使用 Gemini Pro Vision 模型从商品清单中推荐一件家具。

点击检查我的进度以验证是否完成了以下目标:

使用 Gemini Pro Vision 模型从备选清单中推荐一件商品。

恭喜!

恭喜!在本实验中,您已成功探索如何使用 Gemini 构建多模态家具推荐系统。您学习了如何使用 Gemini Pro Vision 模型进行视觉理解,以及如何在为 Gemini Pro Vision 模型输入提示时将多模态纳入考量。本实验展示了如何使用 Gemini 轻松构建多模态家具推荐系统,您也可以在下列场景中使用类似方法:

  • 根据场合或场地图片推荐服装
  • 根据房间和摆设推荐墙纸

后续步骤/了解详情

Google Cloud 培训和认证

…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。

上次更新手册的时间:2024 年 8 月 21 日

上次测试实验的时间:2024 年 8 月 21 日

版权所有 2024 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。

此内容目前不可用

一旦可用,我们会通过电子邮件告知您

太好了!

一旦可用,我们会通过电子邮件告知您