Checkpoint
Create an API Key
/ 30
Create your Speech API request
/ 30
Call the Speech API for English language
/ 20
Call the Speech API for French language
/ 20
Transkripsi Speech to Text Menggunakan Cloud Speech API
GSP048
Ringkasan
Speech-to-Text API memungkinkan Anda mentranskripsikan file ucapan audio menjadi file teks dalam lebih dari 80 bahasa.
Di lab ini, Anda akan mengirim file audio ke Speech API untuk membuat transkripsinya.
Yang akan Anda pelajari
Di lab ini, Anda akan mempelajari hal berikut:
- Membuat permintaan Speech-to-Text API dan memanggil API dengan
curl
- Memanggil Speech-to-Text API dengan file audio dalam bahasa lain
Penyiapan dan persyaratan
Sebelum mengklik tombol Mulai Lab
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer, yang dimulai saat Anda mengklik Start Lab, akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab praktik ini dapat Anda gunakan untuk melakukan sendiri aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
- Akses ke browser internet standar (disarankan browser Chrome).
- Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Cara memulai lab dan login ke Google Cloud Console
-
Klik tombol Start Lab. Jika Anda perlu membayar lab, jendela pop-up akan terbuka untuk memilih metode pembayaran. Di sebelah kiri adalah panel Lab Details dengan info berikut:
- Tombol Open Google Cloud console
- Waktu tersisa
- Kredensial sementara yang harus Anda gunakan untuk lab ini
- Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
-
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account. -
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}} Anda juga dapat menemukan Username di panel Lab Details.
-
Klik Next.
-
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}} Anda juga dapat menemukan Password di panel Lab Details.
-
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda. Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan. -
Klik halaman berikutnya:
- Setujui persyaratan dan ketentuan.
- Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
- Jangan mendaftar uji coba gratis.
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Tugas 1. Membuat Kunci API
Karena Anda menggunakan curl
untuk mengirim permintaan ke Speech-to-Text API, Anda harus membuat Kunci API untuk meneruskan URL permintaan.
-
Untuk membuat Kunci API, di Navigation menu () klik APIs & services > Credentials.
-
Klik Create credentials, lalu pilih API key.
-
Salin dan catat kunci yang baru saja Anda buat untuk digunakan nanti di lab ini.
-
Klik Close.
Klik Check my progress untuk memverifikasi tujuan.
Sekarang, simpan kunci di variabel lingkungan agar Anda tidak perlu memasukkan nilai Kunci API Anda dalam setiap permintaan.
- Untuk melakukan langkah selanjutnya, hubungkan ke linux-instance yang disediakan untuk Anda melalui SSH:
Di Navigation menu (), klik Compute Engine > VM Instances.
Perhatikan VM linux-instance dalam daftar VM instances. Anda dapat melihat detail VM di sebelah kanan nama VM.
- Klik SSH di sebelah kanan nama VM linux-instance.
Shell interaktif akan terbuka. Gunakan shell ini untuk menjalankan operasi selanjutnya.
- Dalam shell (SSH), jalankan perintah berikut dan ganti
<your_api_key>
dengan kunci yang baru saja Anda salin:
Tugas 2. Membuat permintaan API
gs://cloud-samples-data/speech/brooklyn_bridge.flac
. Sebelum mengirimkannya ke Speech-to-Text API, Anda dapat memproses file ini.
- Buat permintaan ke API dalam file
request.json
: Buat filerequest.json
:
- Buka file menggunakan editor command line pilihan Anda (
nano
,vim
,emacs
) ataugcloud
, lalu tambahkan baris berikut ke filerequest.json
, menggunakan nilaiuri
dari sampel file audio mentah:
- Simpan file sesuai kebutuhan.
Bagian isi permintaan memiliki objek config
dan audio
.
Dalam config
, Anda memberi tahu Speech-to-Text API cara memproses permintaan tersebut:
- Parameter
encoding
memberi tahu API jenis encoding audio yang Anda gunakan ketika file sedang dikirim ke API.FLAC
adalah jenis encoding untuk file .raw (Pelajari lebih lanjut jenis encoding dari referensi RecognitionConfig). -
languageCode
secara default disetel ke dalam bahasa Inggris jika tidak disebutkan dalam permintaan.
Ada parameter lain yang dapat Anda tambahkan ke objek config
, tetapi hanya encoding
yang diperlukan.
Dalam objek audio
, teruskan uri file audio yang tersimpan di Cloud Storage untuk lab ini ke API.
Klik Check my progress untuk memverifikasi tujuan.
Sekarang Anda siap untuk memanggil Speech-to-Text API.
Tugas 3. Memanggil Speech-to-Text API
- Teruskan isi permintaan Anda beserta variabel lingkungan Kunci API ke API dengan perintah
curl
berikut (semua dalam satu command line):
Respons Anda tersimpan dalam file bernama result.json.
- Untuk melihat isi file, Anda dapat menggunakan:
Respons yang ditampilkan oleh perintah curl
akan terlihat seperti ini:
Nilai transcript
menampilkan transkripsi teks Speech API dari file audio Anda, dan nilai confidence
menunjukkan tingkat keyakinan API dalam mentranskripsikan audio Anda secara akurat.
Perhatikan bahwa Anda memanggil metode syncrecognize
pada permintaan di atas. Speech-to-Text API mendukung transkripsi speech to text sinkron dan asinkron.
Contoh ini menggunakan file audio lengkap, tetapi Anda juga dapat menggunakan metode syncrecognize
untuk melakukan streaming transkripsi speech to text saat pengguna sedang berbicara.
Klik Check my progress untuk memverifikasi tujuan.
Tugas 4. Transkripsi Speech-to-Text dalam berbagai bahasa
Apakah Anda menguasai lebih dari satu bahasa? Speech-to-Text API mendukung transkripsi speech to text ke dalam lebih dari 100 bahasa.
Anda dapat mengubah parameter language_code
di request.json
. Anda dapat menemukan daftar bahasa yang didukung di Panduan dukungan bahasa.
Coba file audio dalam bahasa Prancis - (untuk pratinjaunya, dengarkan di sini).
- Edit
request.json
Anda, lalu ubah kontennya menjadi berikut:
-
Panggil Speech-to-Text dengan menjalankan perintah
curl
lagi. -
Lihat hasilnya:
Anda akan melihat respons berikut:
Ini adalah penggalan kalimat dari dongeng anak-anak Prancis populer karangan Jean de la Fontaine. Jika mempunyai file audio dalam bahasa lain, Anda dapat menambahkannya ke Cloud Storage dan mengubah parameter languageCode
dalam permintaan Anda.
Selamat!
Anda berhasil melakukan transkripsi speech to text dengan Speech API. Anda meneruskan Cloud Storage URI dari file audio Anda ke API dan meninjau alternatif penerusan string berenkode base64 dari konten audio.
Menyelesaikan Quest Anda
Lab mandiri ini merupakan bagian dari Quest Intro to ML: Language Processing dan Language, Speech, Text & Translation with Google Cloud APIs. Quest adalah serangkaian lab terkait yang membentuk jalur pembelajaran. Dengan menyelesaikan Quest, Anda mendapatkan badge sebagai pengakuan atas pencapaian Anda. Anda dapat menunjukkan satu atau beberapa badge kepada orang lain secara publik dan menautkannya di resume online atau akun media sosial Anda. Daftarkan diri Anda dalam Quest apa pun yang berisi lab ini dan segera dapatkan kredit penyelesaian. Lihat katalog Google Cloud Skills Boost untuk melihat semua Quest yang tersedia.
Ikuti lab berikutnya
Lanjutkan Quest Anda dengan Mengukur dan Meningkatkan Akurasi Ucapan atau coba salah satu dari berikut ini:
- Menerjemahkan Teks dengan Cloud Translation API
- Mengklasifikasikan Teks ke dalam Beberapa Kategori dengan Natural Language API
Langkah berikutnya/Pelajari lebih lanjut
- Lihat tutorial ini dalam dokumentasi.
- Coba Cloud Vision API dan Natural Language API.
Sertifikasi dan pelatihan Google Cloud
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui pada 20 September 2023
Lab Terakhir Diuji pada 20 September 2023
Hak cipta 2024 Google LLC Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.