
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create an API Key
/ 30
Create your Speech API request
/ 30
Call the Speech API
/ 40
L'API Speech-to-Text permet d'intégrer facilement les technologies de reconnaissance vocale de Google aux applications en développement. Grâce à cette API, vous pouvez envoyer des fichiers audio et en recevoir une transcription.
Dans cet atelier, vous allez apprendre à effectuer les tâches suivantes :
Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.
Cet atelier pratique vous permet de suivre les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Des identifiants temporaires vous sont fournis pour vous permettre de vous connecter à Google Cloud le temps de l'atelier.
Pour réaliser cet atelier :
Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, une boîte de dialogue s'affiche pour vous permettre de sélectionner un mode de paiement. Sur la gauche, vous trouverez le panneau "Détails concernant l'atelier", qui contient les éléments suivants :
Cliquez sur Ouvrir la console Google Cloud (ou effectuez un clic droit et sélectionnez Ouvrir le lien dans la fenêtre de navigation privée si vous utilisez le navigateur Chrome).
L'atelier lance les ressources, puis ouvre la page "Se connecter" dans un nouvel onglet.
Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.
Si nécessaire, copiez le nom d'utilisateur ci-dessous et collez-le dans la boîte de dialogue Se connecter.
Vous trouverez également le nom d'utilisateur dans le panneau "Détails concernant l'atelier".
Cliquez sur Suivant.
Copiez le mot de passe ci-dessous et collez-le dans la boîte de dialogue Bienvenue.
Vous trouverez également le mot de passe dans le panneau "Détails concernant l'atelier".
Cliquez sur Suivant.
Accédez aux pages suivantes :
Après quelques instants, la console Cloud s'ouvre dans cet onglet.
Comme vous allez exécuter la commande curl
pour envoyer une requête à l'API Speech-to-Text, vous devez générer une clé API pour transmettre l'URL de la requête.
Pour créer une clé API, cliquez sur le menu de navigation > API et services > Identifiants.
Cliquez ensuite sur Créer des identifiants.
Dans le menu déroulant, sélectionnez Clé API.
Copiez la clé que vous venez de générer, puis cliquez sur Fermer.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Vous disposez désormais d'une clé API. Enregistrez sa valeur dans une variable d'environnement afin d'éviter de l'insérer à chaque requête.
Pour poursuivre, connectez-vous à l'instance provisionnée pour vous avec SSH.
Dans le menu de navigation, sélectionnez Compute Engine. L'instance linux-instance
doit s'afficher dans la fenêtre Instances de VM.
Cliquez sur le bouton SSH à côté de linux-instance
. Vous êtes redirigé vers un shell interactif.
Dans la ligne de commande, saisissez la commande suivante, en remplaçant <YOUR_API_KEY>
par la clé API générée que vous avez copiée :
Vous resterez dans cette session SSH jusqu'à la fin de l'atelier.
gs://cloud-samples-tests/speech/brooklyn.flac
.
Écoutez le fichier audio avant de l'envoyer à l'API Speech-to-Text.
request.json
dans la ligne de commande SSH. Il vous servira à construire votre requête pour l'API Speech-to-Text :request.json
:nano
, vim
ou emacs
) ou bien gcloud
. Cet atelier fournit des instructions pour nano
.
uri
du fichier audio brut, ajoutez le contenu suivant à votre fichier request.json
:CTRL
+X
, puis sur Y
pour enregistrer. Appuyez ensuite sur Entrée
pour fermer le fichier request.json
.Le corps de la requête a deux objets : config
et audio
.
Dans config
, vous indiquez à l'API Speech-to-Text comment elle doit traiter la requête. Le paramètre encoding
spécifie à l'API le type d'encodage audio utilisé pendant l'envoi du fichier à l'API. FLAC
est le type d'encodage des fichiers .raw. Pour en savoir plus sur les types d'encodage, consultez le guide sur RecognitionConfig.
Vous pouvez ajouter d'autres paramètres à votre objet config
, mais encoding
est le seul obligatoire.
Dans l'objet audio
, l'URI du fichier audio dans Cloud Storage est transmis à l'API.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Vous pouvez maintenant appeler l'API Speech-to-Text.
curl
suivante (dans une seule ligne de commande) :La réponse doit se présenter comme suit :
La valeur transcript
renvoie la transcription que l'API Speech-to-Text a créée à partir de votre fichier audio, tandis que la valeur confidence
indique le niveau de confiance que l'API accorde à sa transcription de votre fichier audio.
Vous remarquerez que vous avez appelé la méthode syncrecognize
dans la requête ci-dessus. L'API Speech-to-Text prend en charge les transcriptions audio synchrones et asynchrones. Dans cet exemple, vous lui avez envoyé un fichier audio complet, mais vous pourriez tout aussi bien vous servir de la méthode syncrecognize
pour réaliser une transcription audio en streaming pendant que l'utilisateur parle.
Vous avez créé une requête API Speech-to-Text, puis appelé l'API Speech-to-Text.
result.json
:Cliquez sur Vérifier ma progression pour valider l'objectif.
Vous avez utilisé l'API Speech-to-Text pour récupérer une transcription d'un fichier audio d'entrée.
Cet atelier fait partie d'une série appelée "Qwik Starts". Les ateliers de cette série sont conçus pour vous donner un aperçu des nombreuses fonctionnalités proposées par Google Cloud. Pour suivre un autre atelier, recherchez "Qwik Starts" dans le catalogue.
Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.
Dernière mise à jour du manuel : 13 février 2024
Dernier test de l'atelier : 13 octobre 2023
Copyright 2025 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.
Ce contenu n'est pas disponible pour le moment
Nous vous préviendrons par e-mail lorsqu'il sera disponible
Parfait !
Nous vous contacterons par e-mail s'il devient disponible
One lab at a time
Confirm to end all existing labs and start this one