arrow_back

Speech-to-Text API: Qwik Start

Login Gabung
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Speech-to-Text API: Qwik Start

Lab 30 menit universal_currency_alt 1 Kredit show_chart Pengantar
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP119

Lab Mandiri Google Cloud

Ringkasan

Speech-to-Text API memungkinkan integrasi teknologi pengenalan ucapan Google ke dalam aplikasi developer dengan mudah. Dengan Speech-to-Text API, Anda dapat mengirim audio dan menerima transkripsi teks dari layanan.

Yang akan Anda pelajari

Di lab ini, Anda akan mempelajari cara:

  • Membuat Kunci API
  • Membuat permintaan Speech-to-Text API
  • Memanggil Speech-to-Text API

Penyiapan dan persyaratan

Sebelum mengklik tombol Mulai Lab

Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer, yang dimulai saat Anda mengklik Start Lab, akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.

Lab praktik ini dapat Anda gunakan untuk melakukan sendiri aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.

Untuk menyelesaikan lab ini, Anda memerlukan:

  • Akses ke browser internet standar (disarankan browser Chrome).
Catatan: Gunakan jendela Samaran atau browser pribadi untuk menjalankan lab ini. Hal ini akan mencegah konflik antara akun pribadi Anda dan akun Siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.
  • Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Catatan: Jika Anda sudah memiliki project atau akun pribadi Google Cloud, jangan menggunakannya untuk lab ini agar terhindar dari tagihan ekstra pada akun Anda.

Cara memulai lab dan login ke Google Cloud Console

  1. Klik tombol Start Lab. Jika Anda perlu membayar lab, jendela pop-up akan terbuka untuk memilih metode pembayaran. Di sebelah kiri adalah panel Lab Details dengan berikut ini:

    • Tombol Open Google Console
    • Waktu tersisa
    • Kredensial sementara yang harus Anda gunakan untuk lab ini
    • Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
  2. Klik Open Google Console. Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Login.

    Tips: Atur tab di jendela terpisah secara berdampingan.

    Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account.
  3. Jika perlu, salin Username dari panel Lab Details dan tempel ke dialog Sign in. Klik Next.

  4. Salin Password dari panel Lab Details dan tempel ke dialog Welcome. Klik Next.

    Penting: Anda harus menggunakan kredensial dari panel sebelah kiri. Jangan menggunakan kredensial Google Cloud Skills Boost. Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan.
  5. Klik halaman berikutnya:

    • Setujui persyaratan dan ketentuan.
    • Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
    • Jangan daftar uji coba gratis.

Setelah beberapa saat, Cloud Console akan terbuka di tab ini.

Catatan: Anda dapat melihat menu dengan daftar Produk dan Layanan Google Cloud dengan mengklik Menu navigasi di kiri atas. Ikon menu navigasi

Tugas 1. Membuat Kunci API

Karena curl akan digunakan untuk mengirim permintaan ke Speech-to-Text API, Anda harus membuat kunci API untuk meneruskan URL permintaan kami.

  1. Untuk membuat kunci API, klik Navigation menu > APIs & services > Credentials.

  2. Kemudian klik Create credentials.

  3. Di menu drop-down, pilih API key.

  4. Salin kunci yang baru saja Anda buat dan klik Close.

Klik Check my progress untuk memverifikasi tujuan.

Membuat Kunci API

Setelah memiliki kunci API, simpan kunci sebagai variabel lingkungan untuk menghindari keharusan memasukkan nilai kunci API pada setiap permintaan.

Untuk melakukan langkah selanjutnya, hubungkan ke instance yang disediakan untuk Anda menggunakan SSH.

  1. Di Navigation menu, pilih Compute Engine. Anda akan melihat linux-instance yang tercantum di jendela VM instances.

  2. Klik tombol SSH yang sesuai dengan linux-instance. Anda akan diarahkan ke shell interaktif.

  3. Di command line, masukkan baris berikut, dengan mengganti <YOUR_API_KEY> dengan kunci API yang baru saja Anda salin dari kunci yang dibuat sebelumnya:

export API_KEY=<YOUR_API_KEY>

Anda akan tetap berada pada sesi SSH ini hingga akhir lab.

Tugas 2. Membuat permintaan Speech-to-Text API

Catatan: Anda akan menggunakan file rekaman bawaan yang tersedia di Cloud Storage: gs://cloud-samples-tests/speech/brooklyn.flac. Dengarkan file audio sebelum mengirimnya ke Speech-to-Text API.
  1. Buat request.json di command line SSH. Anda akan menggunakannya untuk membuat permintaan ke Speech-to-Text API:
touch request.json
  1. Buka request.json:
nano request.json Catatan: Anda dapat menggunakan editor command line pilihan Anda (nano, vim, emacs) atau gcloud. Lab ini akan memberikan petunjuk penggunaan nano.
  1. Tambahkan baris berikut ini ke file request.json Anda, menggunakan nilai uri dari sampel file audio raw:
{ "config": { "encoding":"FLAC", "languageCode": "en-US" }, "audio": { "uri":"gs://cloud-samples-tests/speech/brooklyn.flac" } }
  1. Tekan control + x lalu y untuk menyimpan dan tekan Enter untuk menutup file request.json.

Bagian isi permintaan memiliki objek config dan audio.

Dalam config, Anda memberi tahu Speech-to-Text API cara memproses permintaan tersebut. Parameter encoding memberi tahu API jenis encoding audio yang Anda gunakan ketika file sedang dikirim ke API. FLAC adalah jenis encoding untuk file .raw. Pelajari lebih lanjut jenis encoding di Panduan RecognitionConfig.

Ada parameter lain yang dapat Anda tambahkan ke objek config Anda, tetapi cukup encoding saja yang diperlukan.

Pada objek audio, Anda meneruskan uri file audio ke API di Cloud Storage.

Klik Check my progress untuk memverifikasi tujuan.

Membuat permintaan Speech-to-Text API

Sekarang Anda siap untuk memanggil Speech-to-Text API.

Tugas 3. Memanggil Speech-to-Text API

  1. Teruskan isi permintaan Anda beserta variabel lingkungan kunci API ke Speech-to-Text API dengan perintah curl berikut (semua dalam satu command line tunggal):
curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \ "https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}"

Respons Anda akan terlihat seperti ini:

{ "results": [ { "alternatives": [ { "transcript": "how old is the Brooklyn Bridge", "confidence": 0.98267895 } ] } ] }

Nilai transcript akan menampilkan transkripsi teks Speech-to-Text API dari file audio Anda, dan nilai confidence menunjukkan tingkat keyakinan API dalam mentranskripsikan audio Anda secara akurat.

Akan terlihat bahwa Anda memanggil metode syncrecognize pada permintaan di atas. Speech-to-Text API mendukung transkripsi speech to text sinkron dan asinkron. Dalam contoh ini Anda mengirimkan file audio lengkap, tetapi Anda juga dapat menggunakan metode syncrecognize untuk menjalankan streaming transkripsi speech to text selagi pengguna masih berbicara.

Anda telah membuat permintaan Speech-to-Text API, lalu memanggil Speech-to-Text API.

  1. Jalankan perintah berikut untuk menyimpan respons di file result.json:
curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \ "https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}" > result.json

Klik Check my progress untuk memverifikasi tujuan.

Memanggil Speech-to-Text API

Selamat!

Anda telah menggunakan Speech-to-Text API untuk mengambil transkrip dari file audio input.

Langkah berikutnya/Pelajari lebih lanjut

Lab ini juga merupakan bagian dari rangkaian lab yang disebut Qwik Start. Lab ini dirancang agar Anda dapat mencoba berbagai fitur yang tersedia dengan Google Cloud. Telusuri "Qwik Start" di katalog lab untuk menemukan lab berikutnya yang ingin Anda ikuti.

Sertifikasi dan pelatihan Google Cloud

...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.

Manual Terakhir Diperbarui pada 13 Februari 2024

Lab Terakhir Diuji pada 13 Oktober 2023

Hak cipta 2024 Google LLC Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.