Checkpoint
Create an API Key
/ 30
Create your Speech API request
/ 30
Call the Speech API
/ 40
Speech-to-Text API: Qwik Start
GSP119
Ringkasan
Speech-to-Text API memungkinkan integrasi teknologi pengenalan ucapan Google ke dalam aplikasi developer dengan mudah. Dengan Speech-to-Text API, Anda dapat mengirim audio dan menerima transkripsi teks dari layanan.
Yang akan Anda pelajari
Di lab ini, Anda akan mempelajari cara:
- Membuat Kunci API
- Membuat permintaan Speech-to-Text API
- Memanggil Speech-to-Text API
Penyiapan dan persyaratan
Sebelum mengklik tombol Mulai Lab
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer, yang dimulai saat Anda mengklik Start Lab, akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab praktik ini dapat Anda gunakan untuk melakukan sendiri aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
- Akses ke browser internet standar (disarankan browser Chrome).
- Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Cara memulai lab dan login ke Google Cloud Console
-
Klik tombol Start Lab. Jika Anda perlu membayar lab, jendela pop-up akan terbuka untuk memilih metode pembayaran. Di sebelah kiri adalah panel Lab Details dengan info berikut:
- Tombol Open Google Cloud console
- Waktu tersisa
- Kredensial sementara yang harus Anda gunakan untuk lab ini
- Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
-
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account. -
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}} Anda juga dapat menemukan Username di panel Lab Details.
-
Klik Next.
-
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}} Anda juga dapat menemukan Password di panel Lab Details.
-
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda. Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan. -
Klik halaman berikutnya:
- Setujui persyaratan dan ketentuan.
- Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
- Jangan mendaftar uji coba gratis.
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Tugas 1. Membuat Kunci API
Karena curl
akan digunakan untuk mengirim permintaan ke Speech-to-Text API, Anda harus membuat kunci API untuk meneruskan URL permintaan kami.
-
Untuk membuat kunci API, klik Navigation menu > APIs & services > Credentials.
-
Kemudian klik Create credentials.
-
Di menu drop-down, pilih API key.
-
Salin kunci yang baru saja Anda buat dan klik Close.
Klik Check my progress untuk memverifikasi tujuan.
Setelah memiliki kunci API, simpan kunci sebagai variabel lingkungan untuk menghindari keharusan memasukkan nilai kunci API pada setiap permintaan.
Untuk melakukan langkah selanjutnya, hubungkan ke instance yang disediakan untuk Anda menggunakan SSH.
-
Di Navigation menu, pilih Compute Engine. Anda akan melihat
linux-instance
yang tercantum di jendela VM instances. -
Klik tombol SSH yang sesuai dengan
linux-instance
. Anda akan diarahkan ke shell interaktif. -
Di command line, masukkan baris berikut, dengan mengganti
<YOUR_API_KEY>
dengan kunci API yang baru saja Anda salin dari kunci yang dibuat sebelumnya:
Anda akan tetap berada pada sesi SSH ini hingga akhir lab.
Tugas 2. Membuat permintaan Speech-to-Text API
gs://cloud-samples-tests/speech/brooklyn.flac
.
Dengarkan file audio sebelum mengirimnya ke Speech-to-Text API.
- Buat
request.json
di command line SSH. Anda akan menggunakannya untuk membuat permintaan ke Speech-to-Text API:
- Buka
request.json
:
nano
, vim
, emacs
) atau gcloud
. Lab ini akan memberikan petunjuk penggunaan nano
.
- Tambahkan baris berikut ini ke file
request.json
Anda, menggunakan nilaiuri
dari sampel file audio raw:
- Tekan
control
+x
laluy
untuk menyimpan dan tekanEnter
untuk menutup filerequest.json
.
Bagian isi permintaan memiliki objek config
dan audio
.
Dalam config
, Anda memberi tahu Speech-to-Text API cara memproses permintaan tersebut. Parameter encoding
memberi tahu API jenis encoding audio yang Anda gunakan ketika file sedang dikirim ke API. FLAC
adalah jenis encoding untuk file .raw. Pelajari lebih lanjut jenis encoding di Panduan RecognitionConfig.
Ada parameter lain yang dapat Anda tambahkan ke objek config
Anda, tetapi cukup encoding
saja yang diperlukan.
Pada objek audio
, Anda meneruskan uri file audio ke API di Cloud Storage.
Klik Check my progress untuk memverifikasi tujuan.
Sekarang Anda siap untuk memanggil Speech-to-Text API.
Tugas 3. Memanggil Speech-to-Text API
- Teruskan isi permintaan Anda beserta variabel lingkungan kunci API ke Speech-to-Text API dengan perintah
curl
berikut (semua dalam satu command line tunggal):
Respons Anda akan terlihat seperti ini:
Nilai transcript
akan menampilkan transkripsi teks Speech-to-Text API dari file audio Anda, dan nilai confidence
menunjukkan tingkat keyakinan API dalam mentranskripsikan audio Anda secara akurat.
Akan terlihat bahwa Anda memanggil metode syncrecognize
pada permintaan di atas. Speech-to-Text API mendukung transkripsi speech to text sinkron dan asinkron. Dalam contoh ini Anda mengirimkan file audio lengkap, tetapi Anda juga dapat menggunakan metode syncrecognize
untuk menjalankan streaming transkripsi speech to text selagi pengguna masih berbicara.
Anda telah membuat permintaan Speech-to-Text API, lalu memanggil Speech-to-Text API.
- Jalankan perintah berikut untuk menyimpan respons di file
result.json
:
Klik Check my progress untuk memverifikasi tujuan.
Selamat!
Anda telah menggunakan Speech-to-Text API untuk mengambil transkrip dari file audio input.
Langkah berikutnya/Pelajari lebih lanjut
Lab ini juga merupakan bagian dari rangkaian lab yang disebut Qwik Start. Lab ini dirancang agar Anda dapat mencoba berbagai fitur yang tersedia dengan Google Cloud. Telusuri "Qwik Start" di katalog lab untuk menemukan lab berikutnya yang ingin Anda ikuti.
Sertifikasi dan pelatihan Google Cloud
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui pada 13 Februari 2024
Lab Terakhir Diuji pada 13 Oktober 2023
Hak cipta 2024 Google LLC Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.