Teste e compartilhe seu conhecimento com nossa comunidade.
done
Tenha acesso a mais de 700 laboratórios, selos de habilidade e cursos

Introdução ao Vector Search e Embeddings

Laboratório 1 hora 30 minutos universal_currency_alt 5 créditos show_chart Intermediário
info Este laboratório pode incorporar ferramentas de IA para ajudar no seu aprendizado.
Teste e compartilhe seu conhecimento com nossa comunidade.
done
Tenha acesso a mais de 700 laboratórios, selos de habilidade e cursos

GSP1202

Laboratórios autoguiados do Google Cloud

Visão geral

O Vector Search pode pesquisar em bilhões de itens semanticamente parecidos ou relacionados semanticamente. Um serviço de correspondência por similaridade vetorial tem muitos casos de uso, como a implementação de mecanismos de recomendação, mecanismos de pesquisa, chatbots e classificação de texto. A correspondência semântica pode ser simplificada em algumas etapas. Primeiro, você precisa gerar representações de embedding de muitos itens (feito fora do Vector Search). Em seguida, você faz o upload dos seus embeddings para o Google Cloud e vincula os dados ao Vector Search. Depois que seus embeddings forem adicionados ao Vector Search, você poderá criar um índice para executar consultas e receber recomendações ou resultados.

O uso de embeddings não se limita a palavras ou texto. É possível gerar embeddings semânticos para vários tipos de dados, incluindo imagens, áudio, vídeo e preferências do usuário. Para gerar um embedding multimodal com a Vertex AI, consulte Usar embeddings multimodais. Neste laboratório, você vai aprender a usar o Embeddings da Vertex AI para texto para criar embeddings de texto e usá-los na criação de um índice de pesquisa vetorial.

Objetivos

Neste laboratório, você realizará as seguintes tarefas:

  • Criar uma instância de notebooks da Vertex AI
  • Clonar e executar o notebook do laboratório
  • Criar embeddings de texto
  • Criar e implantar o índice de pesquisa de vetores
  • Consultar o índice

Configuração e requisitos

Antes de clicar no botão Start Lab

Leia estas instruções. Os laboratórios são cronometrados e não podem ser pausados. O timer é iniciado quando você clica em Começar o laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.

Este laboratório prático permite que você realize as atividades em um ambiente real de nuvem, não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.

Confira os requisitos para concluir o laboratório:

  • Acesso a um navegador de Internet padrão (recomendamos o Chrome).
Observação: para executar este laboratório, use o modo de navegação anônima ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e a conta de estudante, o que poderia causar cobranças extras na sua conta pessoal.
  • Tempo para concluir o laboratório---não se esqueça: depois de começar, não será possível pausar o laboratório.
Observação: não use seu projeto ou conta do Google Cloud neste laboratório para evitar cobranças extras na sua conta.

Como iniciar seu laboratório e fazer login no console do Google Cloud

  1. Clique no botão Começar o laboratório. Se for preciso pagar, você verá um pop-up para selecionar a forma de pagamento. No painel Detalhes do laboratório à esquerda, você vai encontrar o seguinte:

    • O botão Abrir console do Google Cloud
    • O tempo restante
    • As credenciais temporárias que você vai usar neste laboratório
    • Outras informações, se forem necessárias
  2. Se você estiver usando o navegador Chrome, clique em Abrir console do Google Cloud ou clique com o botão direito do mouse e selecione Abrir link em uma janela anônima.

    O laboratório ativa os recursos e depois abre a página Fazer login em outra guia.

    Dica: coloque as guias em janelas separadas lado a lado.

    Observação: se aparecer a caixa de diálogo Escolher uma conta, clique em Usar outra conta.
  3. Se necessário, copie o Nome de usuário abaixo e cole na caixa de diálogo Fazer login.

    {{{user_0.username | "Nome de usuário"}}}

    Você também encontra o Nome de usuário no painel Detalhes do laboratório.

  4. Clique em Seguinte.

  5. Copie a Senha abaixo e cole na caixa de diálogo de boas-vindas.

    {{{user_0.password | "Senha"}}}

    Você também encontra a Senha no painel Detalhes do laboratório.

  6. Clique em Seguinte.

    Importante: você precisa usar as credenciais fornecidas no laboratório, e não as da sua conta do Google Cloud. Observação: se você usar sua própria conta do Google Cloud neste laboratório, é possível que receba cobranças adicionais.
  7. Acesse as próximas páginas:

    • Aceite os Termos e Condições.
    • Não adicione opções de recuperação nem autenticação de dois fatores (porque essa é uma conta temporária).
    • Não se inscreva em testes gratuitos.

Depois de alguns instantes, o console do Google Cloud será aberto nesta guia.

Observação: clique em Menu de navegação no canto superior esquerdo para acessar uma lista de produtos e serviços do Google Cloud. Ícone do menu de navegação

Tarefa 1: criar uma instância do Vertex AI Workbench

  1. No menu de navegação do console do Google Cloud, clique em Vertex AI > Workbench.

  2. Clique em + Criar nova.

  3. Na caixa de diálogo Criar instância, use o nome padrão ou insira um exclusivo para a instância do Vertex AI Workbench. Defina a região como e a zona como . Mantenha a opção padrão no resto das configurações.

  4. Clique em Criar.

  5. Clique em Abrir o JupyterLab.

Clonar e executar o notebook do laboratório

  1. No seu notebook, clique em Terminal.

  2. Execute o seguinte comando para clonar o repositório da IA generativa do Google Cloud:

git clone https://github.com/GoogleCloudPlatform/generative-ai.git

Clique em Verificar meu progresso para conferir o objetivo. Clonar e executar o notebook do laboratório

  1. No painel de navegação à esquerda, navegue até a pasta generative-ai/embeddings e abra o notebook intro-textemb-vectorsearch.ipynb.

  2. No comando Selecionar Kernel, deixe o Python3 como padrão e clique em Selecionar.

  3. Role para baixo até a seção Embeddings de texto em ação e execute as células de configuração.

  4. Ao definir suas variáveis de ambiente, use para o local e para o ID do projeto.

Observação: é possível pular as células do notebook que tenham a indicação Colab only.
  1. Pule a seção Definir permissões do IAM porque sua conta de serviço já tem as permissões necessárias.

Tarefa 2: gerar embeddings

  1. Navegue até a seção Introdução ao Embeddings da Vertex AI para texto e execute as células para criar os embeddings de texto.

  2. Navegue até a seção Introdução ao Vector Search e execute as células.

  3. Salve os embeddings em um arquivo JSON.

  4. Crie um novo bucket do Cloud Storage e copie o arquivo para ele.

Clique em Verificar meu progresso para conferir o objetivo. Introdução ao Vector Search

Tarefa 3: criar e implantar um índice

  1. Navegue até a seção Criar um índice e execute as células para criar e implantar um índice.
Observação: os processos de criar e implantar índice levam de 20 a 30 minutos. Fique à vontade para conferir os seguintes recursos enquanto espera.

Clique em Verificar meu progresso para conferir o objetivo. Criar um índice

Analisar o Vector Search e testar a demonstração

Nesta tarefa, você vai analisar o notebook do Vector Search e testar a demonstração pública. Como a criação e a implantação de índices levam cerca de 30 minutos, você pode experimentar a demonstração pública e analisar o notebook enquanto espera.

Enquanto você espera: experimente a demonstração de pesquisa semântica do Stack Overflow

  1. A demonstração pública do Vector Search está disponível como uma demonstração pública ao vivo. Selecione "STACKOVERFLOW" e insira uma pergunta de programação como uma consulta, para que ele execute uma pesquisa de texto em 8 milhões de perguntas publicadas no Stack Overflow. Experimente a pesquisa semântica de texto com algumas consultas como "Como embaralhar linhas no SQL?" ou perguntas arbitrárias sobre programação.

Enquanto você espera: Introdução ao notebook do Vector Search

  1. No notebook, navegue até a seção Trazendo a IA generativa e os LLMs para os serviços de produção na parte superior e leia os casos de uso e as explicações da pesquisa de vetores.

Tarefa 4: executar uma consulta

  1. Navegue até a seção Executar consulta e execute as células para consultar o índice. Você pode tentar alterar a string na variável test_embeddings para ver resultados diferentes.

Clique em Verificar meu progresso para conferir o objetivo. Consultar o índice

Parabéns!

Parabéns! Neste laboratório, você aprendeu a criar embeddings de texto e usá-los para criar um índice de pesquisa vetorial. Agora você pode começar a usar embeddings de texto nos seus próprios aplicativos.

Próximas etapas/saiba mais

Confira os recursos a seguir para saber mais sobre embeddings de texto e pesquisa vetorial:

Treinamento e certificação do Google Cloud

Esses treinamentos ajudam você a aproveitar as tecnologias do Google Cloud ao máximo. Nossas aulas incluem habilidades técnicas e práticas recomendadas para ajudar você a alcançar rapidamente o nível esperado e continuar sua jornada de aprendizado. Oferecemos treinamentos que vão do nível básico ao avançado, com opções de aulas virtuais, sob demanda e por meio de transmissões ao vivo para que você possa encaixá-las na correria do seu dia a dia. As certificações validam sua experiência e comprovam suas habilidades com as tecnologias do Google Cloud.

Manual atualizado em 4 de abril de 2024

Laboratório testado em 4 de abril de 2024

Copyright 2024 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.

Este conteúdo não está disponível no momento

We will notify you via email when it becomes available

Ótimo!

We will contact you via email if it becomes available