Quick tip: Review the prerequisites before you run the lab

Use an Incognito or private browser window to run this lab. This prevents any conflicts between your personal account and the student account, which may cause extra charges incurred to your personal account.

Test and share your knowledge with our community!

done

Get access to over 700 hands-on labs, skill badges, and courses

Speech-to-Text API: Qwik Start

Lab 30 годин universal_currency_alt 1 кредит show_chart Початковий

info This lab may incorporate AI tools to support your learning.

GSP119
Огляд
Налаштування й вимоги
Завдання 1. Створіть ключ API
Завдання 2. Створіть запит до Speech-to-Text API
Завдання 3. Виконайте запит до Speech-to-Text API
Вітаємо!

Test and share your knowledge with our community!

done

Get access to over 700 hands-on labs, skill badges, and courses

GSP119

Огляд

Speech-to-Text API забезпечує зручну інтеграцію технологій розпізнавання мовлення Google із додатками розробників, а також дає змогу надсилати аудіофайли й отримувати із сервісу транскрибований текст.

Завдання курсу

Під час цієї практичної роботи ви навчитеся виконувати наведені нижче дії.

Створювати ключ API
Створювати запит до Speech-to-Text API
Виконувати запит до Speech-to-Text API

Налаштування й вимоги

Перш ніж натиснути кнопку Start Lab (Почати практичну роботу)

Ознайомтеся з наведеними нижче вказівками. На виконання практичного заняття відводиться обмежений час, і його не можна призупинити. Щойно ви натиснете Почати заняття, з’явиться таймер, який показуватиме, скільки часу для роботи з ресурсами Google Cloud у вас залишилося.

Ви зможете виконати практичне заняття в дійсному робочому хмарному середовищі (не в симуляції або демонстраційному середовищі). Для цього на час практичного заняття вам надаються тимчасові облікові дані для реєстрації і входу в Google Cloud.

Для цього практичного заняття потрібно мати:

стандартний вебпереглядач, наприклад Chrome (рекомендовано);

Примітка. Виконуйте практичне заняття в анонімному вікні вебпереглядача (рекомендовано). Так ви уникнете додаткової плати, що може стягуватися з вашого особистого облікового запису внаслідок його помилкового використання замість облікового запису для навчання.

достатню кількість часу, оскільки почавши практичне заняття, ви не зможете призупинити його.

Примітка. Для виконання цього практичного заняття використовуйте лише обліковий запис для навчання, оскільки з іншого облікового запису Google Cloud може стягуватися плата.

Як почати виконувати практичну роботу й увійти в Google Cloud Console

Натисніть кнопку Start Lab (Почати практичне заняття). Якщо за практичне заняття необхідно заплатити, відкриється вікно, де ви зможете обрати спосіб оплати. Ліворуч розміщено панель "Відомості про практичне заняття" з такими компонентами:
- кнопка "Відкрити консоль Google";
- час до закінчення;
- тимчасові облікові дані, які потрібно використовувати для доступу до цього практичного заняття;
- інша інформація, необхідна для виконання цього практичного заняття.
Натисніть Відкрити консоль Google або натисніть правою кнопкою миші й виберіть Відкрити анонімне вікно, якщо ви використовуєте вебпереглядач Chrome.

Завантажаться необхідні ресурси. Потім відкриється нова вкладка зі сторінкою "Увійти".

Порада. Упорядковуйте вкладки в окремих вікнах, розміщуючи їх поруч.
Примітка. Якщо з’явиться вікно Виберіть обліковий запис, натисніть Вибрати інший обліковий запис.
За потреби скопіюйте значення в полі Username (Ім’я користувача) нижче й вставте його у вікні Вхід.
{{{user_0.username | "Username"}}}
Поле "Ім’я користувача" також можна знайти на панелі "Відомості про практичне заняття".
Натисніть Далі.
Скопіюйте значення в полі Password (Пароль) нижче й вставте його у вікні Welcome (Привітання).
{{{user_0.password | "Password"}}}
Поле "Пароль" також можна знайти на панелі "Відомості про практичне заняття".
Натисніть Далі.
Важливо. Обов’язково використовуйте облікові дані, призначені для відповідного практичного заняття. Не використовуйте облікові дані Google Cloud. Примітка. Якщо ввійти у власний обліковий запис Google Cloud, може стягуватися додаткова плата.
Що від вас очікується
- Прийміть Умови використання.
- Не додавайте способи відновлення й двохетапну перевірку (оскільки це тимчасовий обліковий запис).
- Не реєструйте безкоштовні пробні версії.

Через кілька секунд консоль Google Cloud відкриється в новій вкладці.

Примітка. Щоб отримати доступ до продуктів і сервісів Google Cloud, натисніть меню навігації або введіть назву сервісу чи продукту в полі пошуку.

Завдання 1. Створіть ключ API

Оскільки ви надсилатимете запит до Speech-to-Text API за допомогою команди curl, вам потрібно згенерувати ключ API, який передаватиметься в URL-адресі цього запиту.

Для цього натисніть меню навігації > APIs & services (API і сервіси) > Credentials (Облікові дані).
Потім натисніть Create credentials (Створити облікові дані).
У спадному меню виберіть API key (Ключ API).
Скопіюйте щойно згенерований ключ і натисніть Close (Закрити).

Щоб підтвердити виконання завдання, натисніть Check my progress (Підтвердити виконання).

Створіть ключ API

Збережіть отриманий ключ API як змінну середовища, щоб вам не потрібно було вводити його значення в кожному запиті.

Для виконання наступних кроків підключіться через протокол SSH до наданого вам екземпляра.

У меню навігації виберіть Compute Engine. У вікні VM instances (Екземпляри віртуальних машин) з’явиться екземпляр linux-instance.
Натисніть кнопку SSH у рядку з екземпляром linux-instance. Відкриється інтерактивна оболонка.
У командному рядку введіть наведений нижче фрагмент коду, замінивши <YOUR_API_KEY> на згенерований раніше ключ API.

export API_KEY=<YOUR_API_KEY>

Залишайтеся в цьому сеансі SSH до завершення практичної роботи.

Завдання 2. Створіть запит до Speech-to-Text API

Примітка. Скористайтеся попередньо записаним файлом, доступним у Cloud Storage за цим посиланням: gs://cloud-samples-tests/speech/brooklyn.flac. Прослухайте аудіофайл, перш ніж надсилати його до Speech-to-Text API.

Створіть файл request.json у командному рядку SSH. За допомогою цього файлу ви надішлете свій запит до Speech-to-Text API.

touch request.json

Відкрийте файл request.json:

nano request.json

Примітка. Виберіть редактор для командного рядка, у якому вам зручно працювати: Nano, Vim, Emacs або gcloud. У цій практичній роботі надано вказівки для текстового редактора Nano.

Додайте наведений нижче фрагмент коду у файл request.json зі значенням uri для тестового необробленого аудіофайлу.

{ "config": { "encoding":"FLAC", "languageCode": "en-US" }, "audio": { "uri":"gs://cloud-samples-tests/speech/brooklyn.flac" } }

Натисніть Ctrl + X, а потім – Y, щоб зберегти файл request.json, і Enter, щоб закрити його.

У тілі запиту містяться об’єкти config і audio.

В об’єкті config ви вказуєте, як Speech-to-Text API має обробити запит. Параметр encoding надає API інформацію про тип аудіокодування для файлу, який ви надсилаєте. FLAC – це тип кодування для файлів із розширенням .raw. Докладніше про типи кодування можна дізнатися в посібнику з RecognitionConfig.

Ви також можете додати інші параметри в об’єкт config, але лише параметр encoding є обов’язковим.

За допомогою об’єкта audio ви передаєте API параметр uri для аудіофайлу в Cloud Storage.

Щоб підтвердити виконання завдання, натисніть Підтвердити виконання.

Створіть запит до Speech-to-Text API

Час виконати запит до Speech-to-Text API.

Завдання 3. Виконайте запит до Speech-to-Text API

Передайте тіло запиту разом зі змінною середовища ключа API до Speech-to-Text API за допомогою команди curl (в одному командному рядку):

curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \ "https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}"

Вивід виглядатиме приблизно так:

{ "results": [ { "alternatives": [ { "transcript": "how old is the Brooklyn Bridge", "confidence": 0.98267895 } ] } ] }

Значення transcript поверне від Speech-to-Text API транскрибований текст вашого аудіофайлу, а значення confidence указуватиме, наскільки точно транскрибовано цей файл.

У запиті вище ви використовували метод syncrecognize. Speech-to-Text API підтримує синхронне й асинхронне перетворення мовлення на текст. У цьому прикладі ви надіслали окремий аудіофайл, але за допомогою методу syncrecognize можна також виконувати потокове транскрибування мовлення користувача.

Ви створили запит до Speech-to-Text API і виконали його.

Виконайте наведену нижче команду, щоб зберегти відповідь у файлі result.json.

curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \ "https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}" > result.json

Щоб підтвердити виконання завдання, натисніть Підтвердити виконання.

Виконайте запит до Speech-to-Text API

Вітаємо!

Ви отримали транскрибований текст з аудіофайлу за допомогою Speech-to-Text API.

Наступні кроки/Докладніше

Це завдання також входить до низки практичних робіт під назвою Qwik Starts. Вони призначені для ознайомлення з функціями Google Cloud. Такі практичні роботи можна знайти в каталозі за запитом "Qwik Starts".

Навчання й сертифікація Google Cloud

…допомагають ефективно використовувати технології Google Cloud. Наші курси передбачають опанування технічних навичок, а також ознайомлення з рекомендаціями, що допоможуть вам швидко зорієнтуватися й вивчити матеріал. Ми пропонуємо курси різних рівнів – від базового до високого. Ви можете вибрати формат навчання (за запитом, онлайн або офлайн) відповідно до власного розкладу. Пройшовши сертифікацію, ви перевірите й підтвердите свої навички та досвід роботи з технологіями Google Cloud.

Посібник востаннє оновлено 13 лютого 2024 року

Практичну роботу востаннє протестовано 13 жовтня 2023 року

© Google LLC 2025. Усі права захищено. Назва та логотип Google є торговельними марками Google LLC. Усі інші назви компаній і продуктів можуть бути торговельними марками відповідних компаній, з якими вони пов’язані.

Speech-to-Text API: Qwik Start

Speech-to-Text API: Qwik Start

GSP119

Огляд

Завдання курсу

Налаштування й вимоги

Перш ніж натиснути кнопку Start Lab (Почати практичну роботу)

Як почати виконувати практичну роботу й увійти в Google Cloud Console

Завдання 1. Створіть ключ API

Завдання 2. Створіть запит до Speech-to-Text API

Завдання 3. Виконайте запит до Speech-to-Text API

Вітаємо!

Наступні кроки/Докладніше

Навчання й сертифікація Google Cloud

Before you begin

Use private browsing

Sign in to the Console

Use private browsing to run the lab