
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create an API Key
/ 30
Create your Speech API request
/ 30
Call the Speech API
/ 40
Speech-to-Text API забезпечує зручну інтеграцію технологій розпізнавання мовлення Google із додатками розробників, а також дає змогу надсилати аудіофайли й отримувати із сервісу транскрибований текст.
Під час цієї практичної роботи ви навчитеся виконувати наведені нижче дії.
Ознайомтеся з наведеними нижче вказівками. На виконання практичного заняття відводиться обмежений час, і його не можна призупинити. Щойно ви натиснете Почати заняття, з’явиться таймер, який показуватиме, скільки часу для роботи з ресурсами Google Cloud у вас залишилося.
Ви зможете виконати практичне заняття в дійсному робочому хмарному середовищі (не в симуляції або демонстраційному середовищі). Для цього на час практичного заняття вам надаються тимчасові облікові дані для реєстрації і входу в Google Cloud.
Для цього практичного заняття потрібно мати:
Натисніть кнопку Start Lab (Почати практичне заняття). Якщо за практичне заняття необхідно заплатити, відкриється вікно, де ви зможете обрати спосіб оплати. Ліворуч розміщено панель "Відомості про практичне заняття" з такими компонентами:
Натисніть Відкрити консоль Google або натисніть правою кнопкою миші й виберіть Відкрити анонімне вікно, якщо ви використовуєте вебпереглядач Chrome.
Завантажаться необхідні ресурси. Потім відкриється нова вкладка зі сторінкою "Увійти".
Порада. Упорядковуйте вкладки в окремих вікнах, розміщуючи їх поруч.
За потреби скопіюйте значення в полі Username (Ім’я користувача) нижче й вставте його у вікні Вхід.
Поле "Ім’я користувача" також можна знайти на панелі "Відомості про практичне заняття".
Натисніть Далі.
Скопіюйте значення в полі Password (Пароль) нижче й вставте його у вікні Welcome (Привітання).
Поле "Пароль" також можна знайти на панелі "Відомості про практичне заняття".
Натисніть Далі.
Що від вас очікується
Через кілька секунд консоль Google Cloud відкриється в новій вкладці.
Оскільки ви надсилатимете запит до Speech-to-Text API за допомогою команди curl
, вам потрібно згенерувати ключ API, який передаватиметься в URL-адресі цього запиту.
Для цього натисніть меню навігації > APIs & services (API і сервіси) > Credentials (Облікові дані).
Потім натисніть Create credentials (Створити облікові дані).
У спадному меню виберіть API key (Ключ API).
Скопіюйте щойно згенерований ключ і натисніть Close (Закрити).
Щоб підтвердити виконання завдання, натисніть Check my progress (Підтвердити виконання).
Збережіть отриманий ключ API як змінну середовища, щоб вам не потрібно було вводити його значення в кожному запиті.
Для виконання наступних кроків підключіться через протокол SSH до наданого вам екземпляра.
У меню навігації виберіть Compute Engine. У вікні VM instances (Екземпляри віртуальних машин) з’явиться екземпляр linux-instance
.
Натисніть кнопку SSH у рядку з екземпляром linux-instance
. Відкриється інтерактивна оболонка.
У командному рядку введіть наведений нижче фрагмент коду, замінивши <YOUR_API_KEY>
на згенерований раніше ключ API.
Залишайтеся в цьому сеансі SSH до завершення практичної роботи.
gs://cloud-samples-tests/speech/brooklyn.flac
.
Прослухайте аудіофайл, перш ніж надсилати його до Speech-to-Text API.
request.json
у командному рядку SSH. За допомогою цього файлу ви надішлете свій запит до Speech-to-Text API.request.json
:Nano
, Vim
, Emacs
або gcloud
. У цій практичній роботі надано вказівки для текстового редактора Nano
.
request.json
зі значенням uri
для тестового необробленого аудіофайлу.Ctrl
+ X
, а потім – Y
, щоб зберегти файл request.json
, і Enter
, щоб закрити його.У тілі запиту містяться об’єкти config
і audio
.
В об’єкті config
ви вказуєте, як Speech-to-Text API має обробити запит. Параметр encoding
надає API інформацію про тип аудіокодування для файлу, який ви надсилаєте. FLAC
– це тип кодування для файлів із розширенням .raw. Докладніше про типи кодування можна дізнатися в посібнику з RecognitionConfig.
Ви також можете додати інші параметри в об’єкт config
, але лише параметр encoding
є обов’язковим.
За допомогою об’єкта audio
ви передаєте API параметр uri для аудіофайлу в Cloud Storage.
Щоб підтвердити виконання завдання, натисніть Підтвердити виконання.
Час виконати запит до Speech-to-Text API.
curl
(в одному командному рядку):Вивід виглядатиме приблизно так:
Значення transcript
поверне від Speech-to-Text API транскрибований текст вашого аудіофайлу, а значення confidence
указуватиме, наскільки точно транскрибовано цей файл.
У запиті вище ви використовували метод syncrecognize
. Speech-to-Text API підтримує синхронне й асинхронне перетворення мовлення на текст. У цьому прикладі ви надіслали окремий аудіофайл, але за допомогою методу syncrecognize
можна також виконувати потокове транскрибування мовлення користувача.
Ви створили запит до Speech-to-Text API і виконали його.
result.json
.Щоб підтвердити виконання завдання, натисніть Підтвердити виконання.
Ви отримали транскрибований текст з аудіофайлу за допомогою Speech-to-Text API.
Це завдання також входить до низки практичних робіт під назвою Qwik Starts. Вони призначені для ознайомлення з функціями Google Cloud. Такі практичні роботи можна знайти в каталозі за запитом "Qwik Starts".
…допомагають ефективно використовувати технології Google Cloud. Наші курси передбачають опанування технічних навичок, а також ознайомлення з рекомендаціями, що допоможуть вам швидко зорієнтуватися й вивчити матеріал. Ми пропонуємо курси різних рівнів – від базового до високого. Ви можете вибрати формат навчання (за запитом, онлайн або офлайн) відповідно до власного розкладу. Пройшовши сертифікацію, ви перевірите й підтвердите свої навички та досвід роботи з технологіями Google Cloud.
Посібник востаннє оновлено 13 лютого 2024 року
Практичну роботу востаннє протестовано 13 жовтня 2023 року
© Google LLC 2025. Усі права захищено. Назва та логотип Google є торговельними марками Google LLC. Усі інші назви компаній і продуктів можуть бути торговельними марками відповідних компаній, з якими вони пов’язані.
This content is not currently available
We will notify you via email when it becomes available
Great!
We will contact you via email if it becomes available
One lab at a time
Confirm to end all existing labs and start this one