Dapatkan akses ke 700+ lab dan kursus

Transkripsi Speech to Text Menggunakan Cloud Speech API

Lab 30 menit universal_currency_alt 1 Kredit show_chart Pengantar

info Lab ini mungkin menggabungkan alat AI untuk mendukung pembelajaran Anda.

GSP048
Ringkasan
Penyiapan dan persyaratan
Tugas 1. Membuat Kunci API
Tugas 2. Membuat permintaan API
Tugas 3. Memanggil Speech-to-Text API
Tugas 4. Transkripsi Speech-to-Text dalam berbagai bahasa
Selamat!

Dapatkan akses ke 700+ lab dan kursus

GSP048

Ringkasan

Speech-to-Text API memungkinkan Anda mentranskripsikan file ucapan audio menjadi file teks dalam lebih dari 80 bahasa.

Di lab ini, Anda akan mengirim file audio ke Speech API untuk membuat transkripsinya.

Yang akan Anda pelajari

Di lab ini, Anda akan mempelajari hal berikut:

Membuat permintaan Speech-to-Text API dan memanggil API dengan curl
Memanggil Speech-to-Text API dengan file audio dalam bahasa lain

Penyiapan dan persyaratan

Sebelum mengklik tombol Start Lab

Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer yang dimulai saat Anda mengklik Start Lab akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.

Lab interaktif ini dapat Anda gunakan untuk melakukan aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.

Untuk menyelesaikan lab ini, Anda memerlukan:

Akses ke browser internet standar (disarankan browser Chrome).

Catatan: Gunakan jendela Samaran (direkomendasikan) atau browser pribadi untuk menjalankan lab ini. Hal ini akan mencegah konflik antara akun pribadi Anda dan akun siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.

Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.

Catatan: Hanya gunakan akun siswa untuk lab ini. Jika Anda menggunakan akun Google Cloud yang berbeda, Anda mungkin akan dikenai tagihan ke akun tersebut.

Cara memulai lab dan login ke Google Cloud Console

Klik tombol Start Lab. Jika Anda perlu membayar lab, dialog akan terbuka untuk memilih metode pembayaran. Di sebelah kiri ada panel Lab Details yang berisi hal-hal berikut:
- Tombol Open Google Cloud console
- Waktu tersisa
- Kredensial sementara yang harus Anda gunakan untuk lab ini
- Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).

Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.

Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account.
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}}
Anda juga dapat menemukan Username di panel Lab Details.
Klik Next.
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}}
Anda juga dapat menemukan Password di panel Lab Details.
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda. Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan.
Klik halaman berikutnya:
- Setujui persyaratan dan ketentuan.
- Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
- Jangan mendaftar uji coba gratis.

Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.

Catatan: Untuk mengakses produk dan layanan Google Cloud, klik Navigation menu atau ketik nama layanan atau produk di kolom Search.

Tugas 1. Membuat Kunci API

Karena Anda menggunakan curl untuk mengirim permintaan ke Speech-to-Text API, Anda harus membuat Kunci API untuk meneruskan URL permintaan.

Untuk membuat Kunci API, di Navigation menu () klik APIs & services > Credentials.
Klik Create credentials, lalu pilih API key.
Salin dan catat kunci yang baru saja Anda buat untuk digunakan nanti di lab ini.
Klik Close.

Klik Check my progress untuk memverifikasi tujuan.

Membuat Kunci API

Sekarang, simpan kunci di variabel lingkungan agar Anda tidak perlu memasukkan nilai Kunci API Anda dalam setiap permintaan.

Untuk melakukan langkah selanjutnya, hubungkan ke linux-instance yang disediakan untuk Anda melalui SSH:

Di Navigation menu (), klik Compute Engine > VM Instances.

Perhatikan VM linux-instance dalam daftar VM instances. Anda dapat melihat detail VM di sebelah kanan nama VM.

Klik SSH di sebelah kanan nama VM linux-instance.

Shell interaktif akan terbuka. Gunakan shell ini untuk menjalankan operasi selanjutnya.

Dalam shell (SSH), jalankan perintah berikut dan ganti <your_api_key> dengan kunci yang baru saja Anda salin:

export API_KEY=<YOUR_API_KEY>

Tugas 2. Membuat permintaan API

Catatan: Lab ini menggunakan file yang telah direkam sebelumnya yang tersedia di Cloud Storage: gs://cloud-samples-data/speech/brooklyn_bridge.flac. Sebelum mengirimkannya ke Speech-to-Text API, Anda dapat memproses file ini.

Buat permintaan ke API dalam file request.json: Buat file request.json:

touch request.json

Buka file menggunakan editor command line pilihan Anda (nano, vim, emacs) atau gcloud, lalu tambahkan baris berikut ke file request.json, menggunakan nilai uri dari sampel file audio mentah:

{ "config": { "encoding":"FLAC", "languageCode": "en-US" }, "audio": { "uri":"gs://cloud-samples-data/speech/brooklyn_bridge.flac" } }

Simpan file sesuai kebutuhan.

Bagian isi permintaan memiliki objek config dan audio.

Dalam config, Anda memberi tahu Speech-to-Text API cara memproses permintaan tersebut:

Parameter encoding memberi tahu API jenis encoding audio yang Anda gunakan ketika file sedang dikirim ke API. FLAC adalah jenis encoding untuk file .raw (Pelajari lebih lanjut jenis encoding dari referensi RecognitionConfig).
languageCode secara default disetel ke dalam bahasa Inggris jika tidak disebutkan dalam permintaan.

Ada parameter lain yang dapat Anda tambahkan ke objek config, tetapi hanya encoding yang diperlukan.

Dalam objek audio, teruskan uri file audio yang tersimpan di Cloud Storage untuk lab ini ke API.

Klik Check my progress untuk memverifikasi tujuan.

Membuat permintaan Speech API

Sekarang Anda siap untuk memanggil Speech-to-Text API.

Tugas 3. Memanggil Speech-to-Text API

Teruskan isi permintaan Anda beserta variabel lingkungan Kunci API ke API dengan perintah curl berikut (semua dalam satu command line):

curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \ "https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}" > result.json

Respons Anda tersimpan dalam file bernama result.json.

Untuk melihat isi file, Anda dapat menggunakan:

cat result.json

Respons yang ditampilkan oleh perintah curl akan terlihat seperti ini:

{ "results": [ { "alternatives": [ { "transcript": "how old is the Brooklyn Bridge", "confidence": 0.98216057 } ], "resultEndTime": "1.770s", "languageCode": "en-us" } ], "totalBilledTime": "15s" }

Nilai transcript menampilkan transkripsi teks Speech API dari file audio Anda, dan nilai confidence menunjukkan tingkat keyakinan API dalam mentranskripsikan audio Anda secara akurat.

Perhatikan bahwa Anda memanggil metode syncrecognize pada permintaan di atas. Speech-to-Text API mendukung transkripsi speech to text sinkron dan asinkron.

Contoh ini menggunakan file audio lengkap, tetapi Anda juga dapat menggunakan metode syncrecognize untuk melakukan streaming transkripsi speech to text saat pengguna sedang berbicara.

Klik Check my progress untuk memverifikasi tujuan.

Memanggil Speech API untuk bahasa Inggris

Tugas 4. Transkripsi Speech-to-Text dalam berbagai bahasa

Apakah Anda menguasai lebih dari satu bahasa? Speech-to-Text API mendukung transkripsi speech to text ke dalam lebih dari 100 bahasa.

Anda dapat mengubah parameter language_code di request.json. Anda dapat menemukan daftar bahasa yang didukung di Panduan dukungan bahasa.

Coba file audio dalam bahasa Prancis - (untuk pratinjaunya, dengarkan di sini).

Edit request.json Anda, lalu ubah kontennya menjadi berikut:

{ "config": { "encoding":"FLAC", "languageCode": "fr" }, "audio": { "uri":"gs://cloud-samples-data/speech/corbeau_renard.flac" } }

Panggil Speech-to-Text dengan menjalankan perintah curl lagi.
Lihat hasilnya:

cat result.json

Anda akan melihat respons berikut:

{ "results": [ { "alternatives": [ { "transcript": "maître corbeau sur un arbre perché Tenait dans son bec un fromage maître Renard par l'odeur alléché lui tint à peu près ce langage et bonjour monsieur du corbeau", "confidence": 0.93855613 } ], "resultEndTime": "12.630s", "languageCode": "fr-fr" } ], "totalBilledTime": "15s" }

Ini adalah penggalan kalimat dari dongeng anak-anak Prancis populer karangan Jean de la Fontaine. Jika mempunyai file audio dalam bahasa lain, Anda dapat menambahkannya ke Cloud Storage dan mengubah parameter languageCode dalam permintaan Anda.

Catatan: Batas penggunaan dan pembatasan API pada Cloud Speech-to-Text didokumentasikan dalam Kuota dan batas resource.

Memanggil Speech API untuk bahasa Prancis

Selamat!

Anda berhasil melakukan transkripsi speech to text dengan Speech API. Anda menggunakan Cloud Storage URI untuk meneruskan file audio ke API dan Anda juga meninjau opsi untuk mengirimkan konten audio secara langsung sebagai string berenkode base64.

Langkah berikutnya/Pelajari lebih lanjut

Lihat tutorial ini dalam dokumentasi.
Coba Cloud Vision API dan Natural Language API.

Sertifikasi dan pelatihan Google Cloud

...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.

Manual Terakhir Diperbarui pada 04 November 2024

Lab Terakhir Diuji pada 04 November 2024

Hak cipta 2025 Google LLC. Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.

Transkripsi Speech to Text Menggunakan Cloud Speech API

Transkripsi Speech to Text Menggunakan Cloud Speech API

GSP048

Ringkasan

Yang akan Anda pelajari

Penyiapan dan persyaratan

Sebelum mengklik tombol Start Lab

Cara memulai lab dan login ke Google Cloud Console

Tugas 1. Membuat Kunci API

Tugas 2. Membuat permintaan API

Tugas 3. Memanggil Speech-to-Text API

Tugas 4. Transkripsi Speech-to-Text dalam berbagai bahasa

Selamat!

Langkah berikutnya/Pelajari lebih lanjut

Sertifikasi dan pelatihan Google Cloud

Sebelum memulai

Gunakan penjelajahan rahasia

Login ke Konsol

Gunakan penjelajahan rahasia untuk menjalankan lab