arrow_back

Premiers pas avec Vector Search et les embeddings

Testez vos connaissances et partagez-les avec notre communauté
done
Accédez à plus de 700 ateliers pratiques, badges de compétence et cours

Premiers pas avec Vector Search et les embeddings

Atelier 1 heure 30 minutes universal_currency_alt 5 crédits show_chart Intermédiaire
info Cet atelier peut intégrer des outils d'IA pour vous accompagner dans votre apprentissage.
Testez vos connaissances et partagez-les avec notre communauté
done
Accédez à plus de 700 ateliers pratiques, badges de compétence et cours

GSP1202

Google Cloud – Ateliers adaptés au rythme de chacun

Présentation

Vector Search peut effectuer des recherches à partir de milliards d'éléments sémantiquement similaires ou présentant des relations sémantiques. Un service de mise en correspondance des similarités vectorielles offre de nombreux cas d'utilisation tels que l'implémentation de moteurs de recommandations, de moteurs de recherche et de chatbots, et la classification de texte. La mise en correspondance sémantique peut être simplifiée en quelques étapes. Tout d'abord, vous devez générer des embeddings de nombreux éléments (en dehors de Vector Search). Ensuite, vous importez vos embeddings dans Google Cloud, puis vous associez vos données à Vector Search. Une fois vos embeddings ajoutés à Vector Search, vous pouvez créer un index pour exécuter des requêtes afin d'obtenir des recommandations ou des résultats.

L'utilisation d'embeddings ne se limite pas aux mots ou au texte. Vous pouvez générer des embeddings sémantiques pour de nombreux types de données, y compris des images, des sons, des vidéos ou des préférences utilisateur. Pour générer un embedding multimodal avec Vertex AI, consultez Obtenir des embeddings multimodaux. Dans cet atelier, vous allez apprendre à utiliser Vertex AI Embeddings for Text pour créer des embeddings textuels (ou "prolongements textuels") et à vous en servir pour créer un index Vector Search.

Objectifs

Dans cet atelier, vous allez effectuer les tâches suivantes :

  • Créer une instance de notebook Vertex AI
  • Cloner et exécuter le notebook de l'atelier
  • Créer des embeddings textuels
  • Créer et déployer un index Vector Search
  • Interroger l'index

Préparation

Avant de cliquer sur le bouton "Démarrer l'atelier"

Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.

Cet atelier pratique vous permet de suivre vous-même les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Nous vous fournissons des identifiants temporaires pour vous connecter à Google Cloud le temps de l'atelier.

Pour réaliser cet atelier :

  • vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome) ;
Remarque : Ouvrez une fenêtre de navigateur en mode incognito/navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le temporaire étudiant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.
  • vous disposez d'un temps limité ; une fois l'atelier commencé, vous ne pouvez pas le mettre en pause.
Remarque : Si vous possédez déjà votre propre compte ou projet Google Cloud, veillez à ne pas l'utiliser pour réaliser cet atelier afin d'éviter que des frais supplémentaires ne vous soient facturés.

Démarrer l'atelier et se connecter à la console Google Cloud

  1. Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, un pop-up s'affiche pour vous permettre de sélectionner un mode de paiement. Sur la gauche, vous trouverez le panneau Détails concernant l'atelier, qui contient les éléments suivants :

    • Le bouton Ouvrir la console Google Cloud
    • Le temps restant
    • Les identifiants temporaires que vous devez utiliser pour cet atelier
    • Des informations complémentaires vous permettant d'effectuer l'atelier
  2. Cliquez sur Ouvrir la console Google Cloud (ou effectuez un clic droit et sélectionnez Ouvrir le lien dans la fenêtre de navigation privée si vous utilisez le navigateur Chrome).

    L'atelier lance les ressources, puis ouvre la page Se connecter dans un nouvel onglet.

    Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.

    Remarque : Si la boîte de dialogue Sélectionner un compte s'affiche, cliquez sur Utiliser un autre compte.
  3. Si nécessaire, copiez le nom d'utilisateur ci-dessous et collez-le dans la boîte de dialogue Se connecter.

    {{{user_0.username | "Username"}}}

    Vous trouverez également le nom d'utilisateur dans le panneau Détails concernant l'atelier.

  4. Cliquez sur Suivant.

  5. Copiez le mot de passe ci-dessous et collez-le dans la boîte de dialogue Bienvenue.

    {{{user_0.password | "Password"}}}

    Vous trouverez également le mot de passe dans le panneau Détails concernant l'atelier.

  6. Cliquez sur Suivant.

    Important : Vous devez utiliser les identifiants fournis pour l'atelier. Ne saisissez pas ceux de votre compte Google Cloud. Remarque : Si vous utilisez votre propre compte Google Cloud pour cet atelier, des frais supplémentaires peuvent vous être facturés.
  7. Accédez aux pages suivantes :

    • Acceptez les conditions d'utilisation.
    • N'ajoutez pas d'options de récupération ni d'authentification à deux facteurs (ce compte est temporaire).
    • Ne vous inscrivez pas à des essais gratuits.

Après quelques instants, la console Cloud s'ouvre dans cet onglet.

Remarque : Pour afficher un menu contenant la liste des produits et services Google Cloud, cliquez sur le menu de navigation en haut à gauche. Icône du menu de navigation

Tâche 1 : Créer une instance Vertex AI Workbench

  1. Dans le menu de navigation de la console Google Cloud, cliquez sur Vertex AI > Workbench.

  2. Cliquez sur + Créer.

  3. Dans la boîte de dialogue Créer une instance, utilisez le nom par défaut ou saisissez un nom unique pour l'instance Vertex AI Workbench. Définissez la région sur et la zone sur , et laissez les autres paramètres par défaut.

  4. Cliquez sur Créer.

  5. Cliquez sur Ouvrir JupyterLab.

Cloner et exécuter le notebook de l'atelier

  1. Dans votre notebook, cliquez sur le terminal.

  2. Exécutez la commande suivante pour cloner le dépôt "Google Cloud Generative AI" :

git clone https://github.com/GoogleCloudPlatform/generative-ai.git

Cliquez sur Vérifier ma progression pour valider l'objectif. Cloner et exécuter le notebook de l'atelier

  1. Dans le volet de navigation de gauche, accédez au dossier generative-ai/embeddings et ouvrez le notebook intro-textemb-vectorsearch.ipynb.

  2. Pour l'invite Select Kernel (Sélectionner le kernel), conservez le paramètre par défaut Python3, puis cliquez sur Select (Sélectionner).

  3. Faites défiler vers le bas jusqu'à la section Text Embeddings in Action (Embeddings textuels en action) et exécutez les cellules de configuration.

  4. Lors de la configuration des variables d'environnement, utilisez pour l'emplacement et pour l'ID du projet.

Remarque : Vous pouvez ignorer les cellules du notebook qui portent la mention Colab only (Colab uniquement).
  1. Ignorez la section Set IAM permissions (Configurer les autorisations IAM), car votre compte de service dispose déjà des autorisations requises.

Tâche 2 : Générer des embeddings

  1. Accédez à la section Getting Started with Vertex AI Embeddings for Text (Premiers pas avec Vertex AI Embeddings for Text) et parcourez les cellules pour créer les embeddings textuels.

  2. Accédez à la section Getting Started with Vector Search (Premiers pas avec Vector Search) et parcourez les cellules.

  3. Enregistrez les embeddings dans un fichier JSON.

  4. Créez un bucket Cloud Storage et copiez-y le fichier.

Cliquez sur Vérifier ma progression pour valider l'objectif. Premiers pas avec Vector Search

Tâche 3 : Créer et déployer un index

  1. Accédez à la section Create an Index (Créer un index) et parcourez les cellules pour créer et déployer un index.
Remarque : Créer et déployer l'index prend entre 20 et 30 minutes. N'hésitez pas à consulter les ressources suivantes pendant que vous patientez.

Cliquez sur Vérifier ma progression pour valider l'objectif. Créer un index

Explorer Vector Search et essayer la démo

Dans cette tâche, vous allez explorer le notebook Vector Search et essayer la démo publique. Puisque créer et déployer l'index vous prendra environ 30 minutes, vous pouvez essayer la démo publique et explorer le notebook en attendant.

Pendant que vous patientez : essayer la démo de recherche sémantique Stack Overflow

  1. La démo publique Vector Search est disponible en ligne. Sélectionnez STACKOVERFLOW et saisissez une question sur le code dans la requête. La démo va alors effectuer une recherche textuelle parmi les 8 millions de questions publiées sur Stack Overflow. Essayez la recherche sémantique de texte avec des requêtes telles que "Comment brasser des lignes dans SQL ?" ou en posant des questions arbitraires de programmation.

Pendant que vous patientez : explorer le notebook Vector Search

  1. Dans le notebook, accédez à la section Bringing Gen AI and LLMs to production services (Intégrer l'IA générative et les LLM aux services de production) tout en haut, et consultez les cas d'utilisation de Vector Search et les explications fournies.

Tâche 4 : Exécuter une requête

  1. Accédez à la section Run Query (Exécuter la requête) et parcourez les cellules pour interroger l'index. Essayez de modifier la chaîne dans la variable test_embeddings pour obtenir des résultats différents.

Cliquez sur Vérifier ma progression pour valider l'objectif. Interroger l'index

Félicitations !

Félicitations ! Dans cet atelier, vous avez appris à créer des embeddings textuels, mais aussi à vous en servir pour créer un index Vector Search. Vous êtes maintenant prêt à utiliser les embeddings textuels dans vos propres applications !

Étapes suivantes et informations supplémentaires

Consultez les ressources suivantes pour en savoir plus sur les embeddings textuels et Vector Search :

Formations et certifications Google Cloud

Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.

Dernière mise à jour du manuel : 4 avril 2024

Dernier test de l'atelier : 4 avril 2024

Copyright 2024 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.

Ce contenu n'est pas disponible pour le moment

We will notify you via email when it becomes available

Parfait !

We will contact you via email if it becomes available