Checkpoints
Generate text from text prompts
/ 10
Streaming
/ 10
Try your own prompts
/ 10
Safety filters
/ 10
Test chat prompts
/ 10
Generate text from local image and text
/ 10
Generate text from text and image(s)
/ 10
Combining multiple images and text prompts for few-shot prompting
/ 10
Generate text from a video file
/ 10
Direct analysis of publicly available web media
/ 10
Introdução à API Gemini da Vertex AI e ao SDK do Python
GSP1209
Informações gerais
Gemini (em inglês) é uma família de modelos de IA generativa desenvolvida pelo Google DeepMind, criada para casos de uso multimodais. A API Gemini dá acesso aos modelos Gemini Pro Vision e Gemini Pro. Neste laboratório, você vai aprender a usar a API Gemini da Vertex AI com o SDK da Vertex AI para Python para interagir com o modelo Gemini 1.0 Pro (gemini-pro
) e com o modelo Gemini 1.0 Pro Vision (gemini-1.0-pro-vision
).
API Gemini da Vertex AI
A API Gemini da Vertex AI tem uma interface unificada para interagir com os modelos Gemini. Há dois modelos disponíveis na API Gemini no momento:
-
Modelo Gemini 1.0 Pro (
gemini-pro
): processa tarefas de linguagem natural, chat de código e texto com várias interações e geração de código. -
Modelo Gemini 1.0 Pro Vision (
gemini-1.0-pro-vision
): dá suporte a comandos multimodais. É possível incluir texto, imagens e vídeo nos comandos e receber respostas de texto ou código.
É possível interagir com a API Gemini usando os seguintes métodos:
- Usar o Vertex AI Studio para testes rápidos e geração de comandos
- Usar comandos cURL
- Usar o SDK da Vertex AI
Esse laboratório tem como foco o uso do SDK da Vertex AI para Python para chamar a API Gemini da Vertex AI.
Consulte a documentação da IA generativa na Vertex AI para saber mais.
Pré-requisitos
Antes de fazer este laboratório, você precisa saber os seguintes conceitos:
- Noções de programação em Python
- Conhecimento básico sobre o funcionamento de APIs
- Execução de código Python em um notebook do Jupyter no Vertex AI Workbench.
Objetivos
Neste laboratório, você vai aprender a:
- Instalar o SDK da Vertex AI para Python
- Usar o modelo Gemini 1.0 Pro (
gemini-1.0-pro
) para gerar texto - Usar o modelo multimodal do Gemini 1.0 Pro Vision (
gemini-1.0-pro-vision
) para gerar texto com base em uma combinação de textos, imagens e vídeos
Configuração e requisitos
Antes de clicar no botão Start Lab
Leia estas instruções. Os laboratórios são cronometrados e não podem ser pausados. O timer é iniciado quando você clica em Começar o laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.
Este laboratório prático permite que você realize as atividades em um ambiente real de nuvem, não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.
Confira os requisitos para concluir o laboratório:
- Acesso a um navegador de Internet padrão (recomendamos o Chrome).
- Tempo para concluir o laboratório---não se esqueça: depois de começar, não será possível pausar o laboratório.
Como iniciar seu laboratório e fazer login no console do Google Cloud
-
Clique no botão Começar o laboratório. Se for preciso pagar, você verá um pop-up para selecionar a forma de pagamento. No painel Detalhes do laboratório à esquerda, você vai encontrar o seguinte:
- O botão Abrir console do Google Cloud
- O tempo restante
- As credenciais temporárias que você vai usar neste laboratório
- Outras informações, se forem necessárias
-
Se você estiver usando o navegador Chrome, clique em Abrir console do Google Cloud ou clique com o botão direito do mouse e selecione Abrir link em uma janela anônima.
O laboratório ativa os recursos e depois abre a página Fazer login em outra guia.
Dica: coloque as guias em janelas separadas lado a lado.
Observação: se aparecer a caixa de diálogo Escolher uma conta, clique em Usar outra conta. -
Se necessário, copie o Nome de usuário abaixo e cole na caixa de diálogo Fazer login.
{{{user_0.username | "Nome de usuário"}}} Você também encontra o Nome de usuário no painel Detalhes do laboratório.
-
Clique em Seguinte.
-
Copie a Senha abaixo e cole na caixa de diálogo de boas-vindas.
{{{user_0.password | "Senha"}}} Você também encontra a Senha no painel Detalhes do laboratório.
-
Clique em Seguinte.
Importante: você precisa usar as credenciais fornecidas no laboratório, e não as da sua conta do Google Cloud. Observação: se você usar sua própria conta do Google Cloud neste laboratório, é possível que receba cobranças adicionais. -
Acesse as próximas páginas:
- Aceite os Termos e Condições.
- Não adicione opções de recuperação nem autenticação de dois fatores (porque essa é uma conta temporária).
- Não se inscreva em testes gratuitos.
Depois de alguns instantes, o console do Google Cloud será aberto nesta guia.
Tarefa 1: abrir o notebook no Vertex AI Workbench
-
No menu de navegação () do console do Google Cloud, clique em Vertex AI > Workbench.
-
Ache a instância
e clique no botão Abrir o JupyterLab.
A interface do JupyterLab para sua instância do Workbench é aberta em uma nova guia do navegador.
Tarefa 2: configurar o notebook
-
Clique no arquivo
. -
Confira as seções Getting Started e Import libraries do notebook.
- Para Project ID, use
, e em Location, use .
- Para Project ID, use
Nas seções a seguir, você vai conferir as células do notebook para entender como usar a API Gemini da Vertex AI com o SDK da Vertex AI para Python.
Tarefa 3: usar o modelo Gemini 1.0 Pro
O modelo Gemini 1.0 Pro (gemini-1.0-pro
) foi projetado para processar tarefas de linguagem natural, chat de código e texto com várias interações e geração de código. Nesta tarefa, confira as células do notebook para saber como usar o modelo Gemini 1.0 Pro para gerar texto com base em comandos.
Gerar texto com base em comandos de texto
Envie um comando de texto para o modelo. O modelo Gemini 1.0 Pro (gemini-1.0-pro
) tem um mecanismo de resposta de streaming. Com essa abordagem, você não precisa esperar pela resposta completa, e pode começar a processar os fragmentos assim que eles estiverem acessíveis.
- Execute a seção Gerar texto com base em comandos de texto. do notebook.
Clique em Verificar meu progresso para conferir os objetivos.
Tarefa 4: usar o modelo Gemini 1.0 Pro Vision
O Gemini 1.0 Pro Vision (gemini-1.0-pro-vision
) é um modelo multimodal que oferece suporte a comandos multimodais. É possível incluir textos, imagens e vídeos nos comandos e receber respostas em texto ou código. Nesta tarefa, confira as células do notebook para saber como usar o modelo Gemini 1.0 Pro Vision para gerar texto usando comandos de texto e imagem e, em seguida, gerar texto com base em um arquivo de vídeo.
Gerar texto com base em imagens e textos locais
- Execute a seção Gerar texto com base em imagens e textos locais do notebook.
Clique em Verificar meu progresso para conferir o objetivo.
Gerar de texto com base em textos, imagens e comandos
-
Execute a seção Gerar texto com base em textos e imagens do notebook.
Gerar texto com base em textos e imagens.
Combinar várias imagens e comandos de texto para comandos few-shot
-
Execute a seção Combinar várias imagens e comandos de texto para comandos few-shot do notebook.
Executar comandos few-shot.
Gerar texto com base em um arquivo de vídeo
-
Execute a seção Gerar texto com base em um arquivo de vídeo do notebook.
Gerar texto com base em um arquivo de vídeo.
Parabéns!
Nesse laboratório, você conheceu melhor o uso da API Gemini da Vertex AI junto com o SDK da Vertex AI para Python interagindo com dois modelos: Gemini 1.0 Pro (gemini-1.0-pro
) Gemini 1.0 Pro Vision (gemini-1.0-pro-vision
). Por meio desses exercícios, você recebeu insights práticos sobre os recursos da API Gemini da Vertex AI e como ela se integra totalmente ao SDK do Python.
Próximas etapas / Saiba mais
- Consulte a documentação da IA generativa na Vertex AI.
- Saiba mais sobre a IA generativa no canal de tecnologia do Google Cloud no YouTube.
- Repositório oficial da IA generativa do Google Cloud (em inglês)
- Exemplos de notebooks do Gemini (em inglês)
Treinamento e certificação do Google Cloud
Esses treinamentos ajudam você a aproveitar as tecnologias do Google Cloud ao máximo. Nossas aulas incluem habilidades técnicas e práticas recomendadas para ajudar você a alcançar rapidamente o nível esperado e continuar sua jornada de aprendizado. Oferecemos treinamentos que vão do nível básico ao avançado, com opções de aulas virtuais, sob demanda e por meio de transmissões ao vivo para que você possa encaixá-las na correria do seu dia a dia. As certificações validam sua experiência e comprovam suas habilidades com as tecnologias do Google Cloud.
Manual atualizado em 31 de maio de 2024
Laboratório testado em 31 de maio de 2024
Copyright 2025 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.