Speech-to-Text API memungkinkan Anda mentranskripsikan file ucapan audio menjadi file teks dalam lebih dari 80 bahasa.
Di lab ini, Anda akan mengirim file audio ke Speech API untuk membuat transkripsinya.
Yang akan Anda pelajari
Di lab ini, Anda akan mempelajari hal berikut:
Membuat permintaan Speech-to-Text API dan memanggil API dengan curl
Memanggil Speech-to-Text API dengan file audio dalam bahasa lain
Penyiapan dan persyaratan
Sebelum mengklik tombol Start Lab
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer yang dimulai saat Anda mengklik Start Lab akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab interaktif ini dapat Anda gunakan untuk melakukan aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
Akses ke browser internet standar (disarankan browser Chrome).
Catatan: Gunakan jendela Samaran (direkomendasikan) atau browser pribadi untuk menjalankan lab ini. Hal ini akan mencegah konflik antara akun pribadi Anda dan akun siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.
Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Catatan: Hanya gunakan akun siswa untuk lab ini. Jika Anda menggunakan akun Google Cloud yang berbeda, Anda mungkin akan dikenai tagihan ke akun tersebut.
Cara memulai lab dan login ke Google Cloud Console
Klik tombol Start Lab. Jika Anda perlu membayar lab, dialog akan terbuka untuk memilih metode pembayaran.
Di sebelah kiri ada panel Lab Details yang berisi hal-hal berikut:
Tombol Open Google Cloud console
Waktu tersisa
Kredensial sementara yang harus Anda gunakan untuk lab ini
Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account.
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}}
Anda juga dapat menemukan Username di panel Lab Details.
Klik Next.
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}}
Anda juga dapat menemukan Password di panel Lab Details.
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda.
Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan.
Klik halaman berikutnya:
Setujui persyaratan dan ketentuan.
Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
Jangan mendaftar uji coba gratis.
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Catatan: Untuk mengakses produk dan layanan Google Cloud, klik Navigation menu atau ketik nama layanan atau produk di kolom Search.
Tugas 1. Membuat Kunci API
Karena Anda menggunakan curl untuk mengirim permintaan ke Speech-to-Text API, Anda harus membuat Kunci API untuk meneruskan URL permintaan.
Untuk membuat Kunci API, di Navigation menu () klik APIs & services > Credentials.
Klik Create credentials, lalu pilih API key.
Salin dan catat kunci yang baru saja Anda buat untuk digunakan nanti di lab ini.
Klik Close.
Klik Check my progress untuk memverifikasi tujuan.
Membuat Kunci API
Sekarang, simpan kunci di variabel lingkungan agar Anda tidak perlu memasukkan nilai Kunci API Anda dalam setiap permintaan.
Untuk melakukan langkah selanjutnya, hubungkan ke linux-instance yang disediakan untuk Anda melalui SSH:
Di Navigation menu (), klik Compute Engine > VM Instances.
Perhatikan VM linux-instance dalam daftar VM instances. Anda dapat melihat detail VM di sebelah kanan nama VM.
Klik SSH di sebelah kanan nama VM linux-instance.
Shell interaktif akan terbuka. Gunakan shell ini untuk menjalankan operasi selanjutnya.
Dalam shell (SSH), jalankan perintah berikut dan ganti <your_api_key> dengan kunci yang baru saja Anda salin:
export API_KEY=<YOUR_API_KEY>
Tugas 2. Membuat permintaan API
Catatan: Lab ini menggunakan file yang telah direkam sebelumnya yang tersedia di Cloud Storage: gs://cloud-samples-data/speech/brooklyn_bridge.flac. Sebelum mengirimkannya ke Speech-to-Text API, Anda dapat memproses file ini.
Buat permintaan ke API dalam file request.json: Buat file request.json:
touch request.json
Buka file menggunakan editor command line pilihan Anda (nano, vim, emacs) atau gcloud, lalu tambahkan baris berikut ke file request.json, menggunakan nilai uri dari sampel file audio mentah:
Bagian isi permintaan memiliki objek config dan audio.
Dalam config, Anda memberi tahu Speech-to-Text API cara memproses permintaan tersebut:
Parameter encoding memberi tahu API jenis encoding audio yang Anda gunakan ketika file sedang dikirim ke API. FLAC adalah jenis encoding untuk file .raw (Pelajari lebih lanjut jenis encoding dari referensi RecognitionConfig).
languageCode secara default disetel ke dalam bahasa Inggris jika tidak disebutkan dalam permintaan.
Ada parameter lain yang dapat Anda tambahkan ke objek config, tetapi hanya encoding yang diperlukan.
Dalam objek audio, teruskan uri file audio yang tersimpan di Cloud Storage untuk lab ini ke API.
Klik Check my progress untuk memverifikasi tujuan.
Membuat permintaan Speech API
Sekarang Anda siap untuk memanggil Speech-to-Text API.
Tugas 3. Memanggil Speech-to-Text API
Teruskan isi permintaan Anda beserta variabel lingkungan Kunci API ke API dengan perintah curl berikut (semua dalam satu command line):
Respons Anda tersimpan dalam file bernama result.json.
Untuk melihat isi file, Anda dapat menggunakan:
cat result.json
Respons yang ditampilkan oleh perintah curl akan terlihat seperti ini:
{
"results": [
{
"alternatives": [
{
"transcript": "how old is the Brooklyn Bridge",
"confidence": 0.98216057
}
],
"resultEndTime": "1.770s",
"languageCode": "en-us"
}
],
"totalBilledTime": "15s"
}
Nilai transcript menampilkan transkripsi teks Speech API dari file audio Anda, dan nilai confidence menunjukkan tingkat keyakinan API dalam mentranskripsikan audio Anda secara akurat.
Perhatikan bahwa Anda memanggil metode syncrecognize pada permintaan di atas. Speech-to-Text API mendukung transkripsi speech to text sinkron dan asinkron.
Contoh ini menggunakan file audio lengkap, tetapi Anda juga dapat menggunakan metode syncrecognize untuk melakukan streaming transkripsi speech to text saat pengguna sedang berbicara.
Klik Check my progress untuk memverifikasi tujuan.
Memanggil Speech API untuk bahasa Inggris
Tugas 4. Transkripsi Speech-to-Text dalam berbagai bahasa
Apakah Anda menguasai lebih dari satu bahasa? Speech-to-Text API mendukung transkripsi speech to text ke dalam lebih dari 100 bahasa.
Anda dapat mengubah parameter language_code di request.json. Anda dapat menemukan daftar bahasa yang didukung di Panduan dukungan bahasa.
Coba file audio dalam bahasa Prancis - (untuk pratinjaunya, dengarkan di sini).
Edit request.json Anda, lalu ubah kontennya menjadi berikut:
Panggil Speech-to-Text dengan menjalankan perintah curl lagi.
Lihat hasilnya:
cat result.json
Anda akan melihat respons berikut:
{
"results": [
{
"alternatives": [
{
"transcript": "maître corbeau sur un arbre perché Tenait dans son bec un fromage maître Renard par l'odeur alléché lui tint à peu près ce langage et bonjour monsieur du corbeau",
"confidence": 0.93855613
}
],
"resultEndTime": "12.630s",
"languageCode": "fr-fr"
}
],
"totalBilledTime": "15s"
}
Ini adalah penggalan kalimat dari dongeng anak-anak Prancis populer karangan Jean de la Fontaine. Jika mempunyai file audio dalam bahasa lain, Anda dapat menambahkannya ke Cloud Storage dan mengubah parameter languageCode dalam permintaan Anda.
Catatan: Batas penggunaan dan pembatasan API pada Cloud Speech-to-Text didokumentasikan dalam Kuota dan batas resource.
Memanggil Speech API untuk bahasa Prancis
Selamat!
Anda berhasil melakukan transkripsi speech to text dengan Speech API. Anda menggunakan Cloud Storage URI untuk meneruskan file audio ke API dan Anda juga meninjau opsi untuk mengirimkan konten audio secara langsung sebagai string berenkode base64.
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui pada 04 November 2024
Lab Terakhir Diuji pada 04 November 2024
Hak cipta 2025 Google LLC. Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.
Lab membuat project dan resource Google Cloud untuk jangka waktu tertentu
Lab memiliki batas waktu dan tidak memiliki fitur jeda. Jika lab diakhiri, Anda harus memulainya lagi dari awal.
Di kiri atas layar, klik Start lab untuk memulai
Gunakan penjelajahan rahasia
Salin Nama Pengguna dan Sandi yang diberikan untuk lab tersebut
Klik Open console dalam mode pribadi
Login ke Konsol
Login menggunakan kredensial lab Anda. Menggunakan kredensial lain mungkin menyebabkan error atau dikenai biaya.
Setujui persyaratan, dan lewati halaman resource pemulihan
Jangan klik End lab kecuali jika Anda sudah menyelesaikan lab atau ingin mengulanginya, karena tindakan ini akan menghapus pekerjaan Anda dan menghapus project
Konten ini tidak tersedia untuk saat ini
Kami akan memberi tahu Anda melalui email saat konten tersedia
Bagus!
Kami akan menghubungi Anda melalui email saat konten tersedia
Satu lab dalam satu waktu
Konfirmasi untuk mengakhiri semua lab yang ada dan memulai lab ini
Gunakan penjelajahan rahasia untuk menjalankan lab
Gunakan jendela Samaran atau browser pribadi untuk menjalankan lab ini. Langkah ini akan mencegah konflik antara akun pribadi Anda dan akun Siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.
Dengan Cloud Speech API, Anda dapat membuat transkripsi speech to text dari file audio ke dalam lebih dari 80 bahasa. Dalam lab interaktif ini, Anda akan merekam file audio Anda sendiri dan mengirimkannya ke Speech API untuk dibuat transkripsinya.