Points de contrôle
Clone and run the lab notebook
/ 25
Get Started with Vector Search
/ 25
Create an Index
/ 25
Query the Index
/ 25
Premiers pas avec Vector Search et les embeddings
GSP1202
Présentation
Vector Search peut effectuer des recherches à partir de milliards d'éléments sémantiquement similaires ou présentant des relations sémantiques. Un service de mise en correspondance des similarités vectorielles offre de nombreux cas d'utilisation tels que l'implémentation de moteurs de recommandations, de moteurs de recherche et de chatbots, et la classification de texte. La mise en correspondance sémantique peut être simplifiée en quelques étapes. Tout d'abord, vous devez générer des embeddings de nombreux éléments (en dehors de Vector Search). Ensuite, vous importez vos embeddings dans Google Cloud, puis vous associez vos données à Vector Search. Une fois vos embeddings ajoutés à Vector Search, vous pouvez créer un index pour exécuter des requêtes afin d'obtenir des recommandations ou des résultats.
L'utilisation d'embeddings ne se limite pas aux mots ou au texte. Vous pouvez générer des embeddings sémantiques pour de nombreux types de données, y compris des images, des sons, des vidéos ou des préférences utilisateur. Pour générer un embedding multimodal avec Vertex AI, consultez Obtenir des embeddings multimodaux. Dans cet atelier, vous allez apprendre à utiliser Vertex AI Embeddings for Text pour créer des embeddings textuels (ou "prolongements textuels") et à vous en servir pour créer un index Vector Search.
Objectifs
Dans cet atelier, vous allez effectuer les tâches suivantes :
- Créer une instance de notebook Vertex AI
- Cloner et exécuter le notebook de l'atelier
- Créer des embeddings textuels
- Créer et déployer un index Vector Search
- Interroger l'index
Préparation
Avant de cliquer sur le bouton "Démarrer l'atelier"
Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.
Cet atelier pratique vous permet de suivre vous-même les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Nous vous fournissons des identifiants temporaires pour vous connecter à Google Cloud le temps de l'atelier.
Pour réaliser cet atelier :
- vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome) ;
- vous disposez d'un temps limité ; une fois l'atelier commencé, vous ne pouvez pas le mettre en pause.
Démarrer l'atelier et se connecter à la console Google Cloud
-
Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, un pop-up s'affiche pour vous permettre de sélectionner un mode de paiement. Sur la gauche, vous trouverez le panneau Détails concernant l'atelier, qui contient les éléments suivants :
- Le bouton Ouvrir la console Google Cloud
- Le temps restant
- Les identifiants temporaires que vous devez utiliser pour cet atelier
- Des informations complémentaires vous permettant d'effectuer l'atelier
-
Cliquez sur Ouvrir la console Google Cloud (ou effectuez un clic droit et sélectionnez Ouvrir le lien dans la fenêtre de navigation privée si vous utilisez le navigateur Chrome).
L'atelier lance les ressources, puis ouvre la page Se connecter dans un nouvel onglet.
Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.
Remarque : Si la boîte de dialogue Sélectionner un compte s'affiche, cliquez sur Utiliser un autre compte. -
Si nécessaire, copiez le nom d'utilisateur ci-dessous et collez-le dans la boîte de dialogue Se connecter.
{{{user_0.username | "Username"}}} Vous trouverez également le nom d'utilisateur dans le panneau Détails concernant l'atelier.
-
Cliquez sur Suivant.
-
Copiez le mot de passe ci-dessous et collez-le dans la boîte de dialogue Bienvenue.
{{{user_0.password | "Password"}}} Vous trouverez également le mot de passe dans le panneau Détails concernant l'atelier.
-
Cliquez sur Suivant.
Important : Vous devez utiliser les identifiants fournis pour l'atelier. Ne saisissez pas ceux de votre compte Google Cloud. Remarque : Si vous utilisez votre propre compte Google Cloud pour cet atelier, des frais supplémentaires peuvent vous être facturés. -
Accédez aux pages suivantes :
- Acceptez les conditions d'utilisation.
- N'ajoutez pas d'options de récupération ni d'authentification à deux facteurs (ce compte est temporaire).
- Ne vous inscrivez pas à des essais gratuits.
Après quelques instants, la console Cloud s'ouvre dans cet onglet.
Tâche 1 : Créer une instance Vertex AI Workbench
-
Dans le menu de navigation de la console Google Cloud, cliquez sur Vertex AI > Workbench.
-
Cliquez sur + Créer.
-
Dans la boîte de dialogue Créer une instance, utilisez le nom par défaut ou saisissez un nom unique pour l'instance Vertex AI Workbench. Définissez la région sur
et la zone sur , et laissez les autres paramètres par défaut. -
Cliquez sur Créer.
-
Cliquez sur Ouvrir JupyterLab.
Cloner et exécuter le notebook de l'atelier
-
Dans votre notebook, cliquez sur le terminal.
-
Exécutez la commande suivante pour cloner le dépôt "Google Cloud Generative AI" :
Cliquez sur Vérifier ma progression pour valider l'objectif.
-
Dans le volet de navigation de gauche, accédez au dossier
generative-ai/embeddings
et ouvrez le notebookintro-textemb-vectorsearch.ipynb
. -
Pour l'invite Select Kernel (Sélectionner le kernel), conservez le paramètre par défaut Python3, puis cliquez sur Select (Sélectionner).
-
Faites défiler vers le bas jusqu'à la section Text Embeddings in Action (Embeddings textuels en action) et exécutez les cellules de configuration.
-
Lors de la configuration des variables d'environnement, utilisez
pour l'emplacement et pour l'ID du projet.
- Ignorez la section Set IAM permissions (Configurer les autorisations IAM), car votre compte de service dispose déjà des autorisations requises.
Tâche 2 : Générer des embeddings
-
Accédez à la section Getting Started with Vertex AI Embeddings for Text (Premiers pas avec Vertex AI Embeddings for Text) et parcourez les cellules pour créer les embeddings textuels.
-
Accédez à la section Getting Started with Vector Search (Premiers pas avec Vector Search) et parcourez les cellules.
-
Enregistrez les embeddings dans un fichier JSON.
-
Créez un bucket Cloud Storage et copiez-y le fichier.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Tâche 3 : Créer et déployer un index
- Accédez à la section Create an Index (Créer un index) et parcourez les cellules pour créer et déployer un index.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Explorer Vector Search et essayer la démo
Dans cette tâche, vous allez explorer le notebook Vector Search et essayer la démo publique. Puisque créer et déployer l'index vous prendra environ 30 minutes, vous pouvez essayer la démo publique et explorer le notebook en attendant.
Pendant que vous patientez : essayer la démo de recherche sémantique Stack Overflow
- La démo publique Vector Search est disponible en ligne. Sélectionnez STACKOVERFLOW et saisissez une question sur le code dans la requête. La démo va alors effectuer une recherche textuelle parmi les 8 millions de questions publiées sur Stack Overflow. Essayez la recherche sémantique de texte avec des requêtes telles que "Comment brasser des lignes dans SQL ?" ou en posant des questions arbitraires de programmation.
Pendant que vous patientez : explorer le notebook Vector Search
- Dans le notebook, accédez à la section Bringing Gen AI and LLMs to production services (Intégrer l'IA générative et les LLM aux services de production) tout en haut, et consultez les cas d'utilisation de Vector Search et les explications fournies.
Tâche 4 : Exécuter une requête
- Accédez à la section Run Query (Exécuter la requête) et parcourez les cellules pour interroger l'index. Essayez de modifier la chaîne dans la variable
test_embeddings
pour obtenir des résultats différents.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Félicitations !
Félicitations ! Dans cet atelier, vous avez appris à créer des embeddings textuels, mais aussi à vous en servir pour créer un index Vector Search. Vous êtes maintenant prêt à utiliser les embeddings textuels dans vos propres applications !
Étapes suivantes et informations supplémentaires
Consultez les ressources suivantes pour en savoir plus sur les embeddings textuels et Vector Search :
- Vertex AI Embeddings for Text : faciliter l'ancrage des LLM
- Présentation de Vertex AI Vector Search
- Tutoriels sur les notebooks Vector Search
Formations et certifications Google Cloud
Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.
Dernière mise à jour du manuel : 4 avril 2024
Dernier test de l'atelier : 4 avril 2024
Copyright 2024 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.