Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you restart it, you'll have to start from the beginning.
- On the top left of your screen, click Start lab to begin
Create an API Key
/ 30
Create your Speech API request
/ 30
Call the Speech API for English language
/ 20
Call the Speech API for French language
/ 20
Speech-to-Text API memungkinkan Anda mentranskripsikan file ucapan audio menjadi file teks dalam lebih dari 80 bahasa.
Di lab ini, Anda akan mengirim file audio ke Speech API untuk membuat transkripsinya.
Di lab ini, Anda akan mempelajari hal berikut:
curl
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer, yang dimulai saat Anda mengklik Start Lab, akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab praktik ini dapat Anda gunakan untuk melakukan sendiri aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
Klik tombol Start Lab. Jika Anda perlu membayar lab, jendela pop-up akan terbuka untuk memilih metode pembayaran. Di sebelah kiri adalah panel Lab Details dengan info berikut:
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
Anda juga dapat menemukan Username di panel Lab Details.
Klik Next.
Salin Password di bawah dan tempel ke dialog Welcome.
Anda juga dapat menemukan Password di panel Lab Details.
Klik Next.
Klik halaman berikutnya:
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Karena Anda menggunakan curl
untuk mengirim permintaan ke Speech-to-Text API, Anda harus membuat Kunci API untuk meneruskan URL permintaan.
Untuk membuat Kunci API, di Navigation menu () klik APIs & services > Credentials.
Klik Create credentials, lalu pilih API key.
Salin dan catat kunci yang baru saja Anda buat untuk digunakan nanti di lab ini.
Klik Close.
Klik Check my progress untuk memverifikasi tujuan.
Sekarang, simpan kunci di variabel lingkungan agar Anda tidak perlu memasukkan nilai Kunci API Anda dalam setiap permintaan.
Di Navigation menu (), klik Compute Engine > VM Instances.
Perhatikan VM linux-instance dalam daftar VM instances. Anda dapat melihat detail VM di sebelah kanan nama VM.
Shell interaktif akan terbuka. Gunakan shell ini untuk menjalankan operasi selanjutnya.
<your_api_key>
dengan kunci yang baru saja Anda salin:gs://cloud-samples-data/speech/brooklyn_bridge.flac
. Sebelum mengirimkannya ke Speech-to-Text API, Anda dapat memproses file ini.
request.json
: Buat file request.json
:nano
, vim
, emacs
) atau gcloud
, lalu tambahkan baris berikut ke file request.json
, menggunakan nilai uri
dari sampel file audio mentah:Bagian isi permintaan memiliki objek config
dan audio
.
Dalam config
, Anda memberi tahu Speech-to-Text API cara memproses permintaan tersebut:
encoding
memberi tahu API jenis encoding audio yang Anda gunakan ketika file sedang dikirim ke API. FLAC
adalah jenis encoding untuk file .raw (Pelajari lebih lanjut jenis encoding dari referensi RecognitionConfig).languageCode
secara default disetel ke dalam bahasa Inggris jika tidak disebutkan dalam permintaan.Ada parameter lain yang dapat Anda tambahkan ke objek config
, tetapi hanya encoding
yang diperlukan.
Dalam objek audio
, teruskan uri file audio yang tersimpan di Cloud Storage untuk lab ini ke API.
Klik Check my progress untuk memverifikasi tujuan.
Sekarang Anda siap untuk memanggil Speech-to-Text API.
curl
berikut (semua dalam satu command line):Respons Anda tersimpan dalam file bernama result.json.
Respons yang ditampilkan oleh perintah curl
akan terlihat seperti ini:
Nilai transcript
menampilkan transkripsi teks Speech API dari file audio Anda, dan nilai confidence
menunjukkan tingkat keyakinan API dalam mentranskripsikan audio Anda secara akurat.
Perhatikan bahwa Anda memanggil metode syncrecognize
pada permintaan di atas. Speech-to-Text API mendukung transkripsi speech to text sinkron dan asinkron.
Contoh ini menggunakan file audio lengkap, tetapi Anda juga dapat menggunakan metode syncrecognize
untuk melakukan streaming transkripsi speech to text saat pengguna sedang berbicara.
Klik Check my progress untuk memverifikasi tujuan.
Apakah Anda menguasai lebih dari satu bahasa? Speech-to-Text API mendukung transkripsi speech to text ke dalam lebih dari 100 bahasa.
Anda dapat mengubah parameter language_code
di request.json
. Anda dapat menemukan daftar bahasa yang didukung di Panduan dukungan bahasa.
Coba file audio dalam bahasa Prancis - (untuk pratinjaunya, dengarkan di sini).
request.json
Anda, lalu ubah kontennya menjadi berikut:Panggil Speech-to-Text dengan menjalankan perintah curl
lagi.
Lihat hasilnya:
Anda akan melihat respons berikut:
Ini adalah penggalan kalimat dari dongeng anak-anak Prancis populer karangan Jean de la Fontaine. Jika mempunyai file audio dalam bahasa lain, Anda dapat menambahkannya ke Cloud Storage dan mengubah parameter languageCode
dalam permintaan Anda.
Anda berhasil melakukan transkripsi speech to text dengan Speech API. Anda meneruskan Cloud Storage URI dari file audio Anda ke API dan meninjau alternatif penerusan string berenkode base64 dari konten audio.
Lab mandiri ini merupakan bagian dari Quest Intro to ML: Language Processing dan Language, Speech, Text & Translation with Google Cloud APIs. Quest adalah serangkaian lab terkait yang membentuk jalur pembelajaran. Dengan menyelesaikan Quest, Anda mendapatkan badge sebagai pengakuan atas pencapaian Anda. Anda dapat menunjukkan satu atau beberapa badge kepada orang lain secara publik dan menautkannya di resume online atau akun media sosial Anda. Daftarkan diri Anda dalam Quest apa pun yang berisi lab ini dan segera dapatkan kredit penyelesaian. Lihat katalog Google Cloud Skills Boost untuk melihat semua Quest yang tersedia.
Lanjutkan Quest Anda dengan Mengukur dan Meningkatkan Akurasi Ucapan atau coba salah satu dari berikut ini:
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui pada 20 September 2023
Lab Terakhir Diuji pada 20 September 2023
Hak cipta 2025 Google LLC Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.