Checkpoints
Create an API Key
/ 30
Create your Speech API request
/ 30
Call the Speech API
/ 40
Speech-to-Text API: Qwik Start
GSP119
Genel bakış
Speech-to-Text API, Google konuşma tanıma teknolojilerinin geliştirici uygulamalarına kolayca entegre edilmesini sağlar. Speech-to-Text API, hizmete ses gönderip transkript almanıza olanak tanır.
Neler öğreneceksiniz?
Bu laboratuvarda şunları öğreneceksiniz:
- API anahtarı oluşturma
- Speech-to-Text API isteği oluşturma
- Speech-to-Text API'yi çağırma
Kurulum ve şartlar
Laboratuvarı Başlat düğmesini tıklamadan önce
Buradaki talimatları okuyun. Laboratuvarlar süreli olduğundan duraklatılamaz. Laboratuvarı Başlat'ı tıkladığınızda başlayan zamanlayıcı, Google Cloud kaynaklarının ne süreyle kullanımınıza açık durumda kalacağını gösterir.
Bu uygulamalı laboratuvarı kullanarak, laboratuvar etkinliklerini gerçek bir bulut ortamında (Simülasyon veya demo ortamında değil.) gerçekleştirebilirsiniz. Bu olanağın sunulabilmesi için size yeni, geçici kimlik bilgileri verilir. Bu kimlik bilgilerini laboratuvar süresince Google Cloud'da oturum açmak ve Google Cloud'a erişmek için kullanırsınız.
Bu laboratuvarı tamamlamak için şunlar gerekir:
- Standart bir internet tarayıcısına erişim (Chrome Tarayıcı önerilir).
- Laboratuvarı tamamlamak için yeterli süre. (Laboratuvarlar, başlatıldıktan sonra duraklatılamaz)
Laboratuvarınızı başlatma ve Google Cloud Console'da oturum açma
-
Laboratuvarı Başlat düğmesini tıklayın. Laboratuvar için ödeme yapmanız gerekiyorsa ödeme yöntemini seçebileceğiniz bir pop-up açılır. Soldaki Laboratuvar Ayrıntıları panelinde şunlar yer alır:
- Google Cloud Console'u aç düğmesi
- Kalan süre
- Bu laboratuvarda kullanmanız gereken geçici kimlik bilgileri
- Bu laboratuvarda ilerlemek için gerekebilecek diğer bilgiler
-
Google Cloud Console'u aç'ı tıklayın (veya Chrome Tarayıcı'yı kullanıyorsanız sağ tıklayıp Bağlantıyı gizli pencerede aç'ı seçin).
Laboratuvar, kaynakları çalıştırır ve sonra Oturum açın sayfasını gösteren başka bir sekme açar.
İpucu: Sekmeleri ayrı pencerelerde, yan yana açın.
Not: Hesap seçin iletişim kutusunu görürseniz Başka bir hesap kullan'ı tıklayın. -
Gerekirse aşağıdaki kullanıcı adını kopyalayıp Oturum açın iletişim kutusuna yapıştırın.
{{{user_0.username | "Username"}}} Kullanıcı adını Laboratuvar ayrıntıları panelinde de bulabilirsiniz.
-
İleri'yi tıklayın.
-
Aşağıdaki şifreyi kopyalayıp Hoş geldiniz iletişim kutusuna yapıştırın.
{{{user_0.password | "Password"}}} Şifreyi Laboratuvar ayrıntıları panelinde de bulabilirsiniz.
-
İleri'yi tıklayın.
Önemli: Laboratuvarın sizinle paylaştığı giriş bilgilerini kullanmanız gerekir. Google Cloud hesabınızın kimlik bilgilerini kullanmayın. Not: Bu laboratuvarda kendi Google Cloud hesabınızı kullanabilmek için ek ücret ödemeniz gerekebilir. -
Sonraki sayfalarda ilgili düğmeleri tıklayarak ilerleyin:
- Şartları ve koşulları kabul edin.
- Geçici bir hesap kullandığınızdan kurtarma seçenekleri veya iki faktörlü kimlik doğrulama eklemeyin.
- Ücretsiz denemelere kaydolmayın.
Birkaç saniye sonra Google Cloud Console bu sekmede açılır.
1. görev: API anahtarı oluşturma
Speech-to-Text API'ye istek göndermek için curl
kullanacağınızdan istek URL'sini iletmek için bir API anahtarı oluşturmanız gerekecektir.
-
API oluşturmak için Gezinme menüsü > API'ler ve hizmetler > Kimlik bilgileri'ni tıklayın.
-
Ardından, Kimlik bilgileri oluştur'u tıklayın.
-
Açılır menüden API anahtarı'nı seçin.
-
Oluşturduğunuz anahtarı kopyalayıp Kapat'ı tıklayın.
Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın.
Artık bir API anahtarınız var. Şimdi bu anahtarı bir ortam değişkeni olarak kaydedip her istekte API anahtarınızın değerini ekleme zahmetinden kurtulabilirsiniz.
Sonraki adımları gerçekleştirmek için sağlanan örneğe bağlanın. Bunun için SSH'yi kullanın.
-
Gezinme menüsünden, Compute Engine'i seçin. Sanal makine örnekleri penceresinde
linux-instance
örneği gösterilir. -
linux-instance
örneğinin yanındaki SSH düğmesini tıklayın. Etkileşimli bir kabuğa yönlendirileceksiniz. -
Aşağıdaki kodu,
<API_ANAHTARINIZ>
bölümünü az önce kopyaladığınız API anahtarıyla değiştirerek komut satırına girin:
Laboratuvarın geri kalan bölümünde SSH oturumunda kalın.
2. görev: Speech-to-Text API isteğinizi oluşturma
gs://cloud-samples-tests/speech/brooklyn.flac
.
Speech-to-Text API'ye göndermeden önce ses dosyasını dinleyin.
- SSH komut satırında
request.json
dosyasını oluşturun. Speech-to-Text API'ye yönelik isteğinizi oluşturmak için bu dosyayı kullanacaksınız:
-
request.json
dosyasını açın:
nano
, vim
, emacs
) veya gcloud
'u kullanabilirsiniz. Bu laboratuvarda, nano
ile ilgili talimatlar sağlanmaktadır.
- Örnek RAW ses dosyasının
uri
değerini kullanarak aşağıdaki kodurequest.json
dosyanıza ekleyin:
-
Control
+x
, ardındany
tuşuna basarakrequest.json
dosyasını kaydedin veEnter
tuşuna basarak dosyayı kapatın.
İsteğin gövdesinde bir config
ve audio
nesnesi bulunur.
config
'de, Speech-to-Text API'nin isteği nasıl işleyeceğini belirtirsiniz. encoding
parametresi, dosya API'ye gönderilirken kullanılan ses kodlama türünü API'ye bildirir. FLAC
, .raw dosyaları için kullanılan kodlama türüdür. Kodlama türleri hakkında daha fazla bilgiye RecognitionConfig Kılavuzu'ndan ulaşabilirsiniz.
config
nesnenize ekleyebileceğiniz başka parametreler de vardır ancak yalnızca encoding
parametresi zorunludur.
audio
nesnesinde, Cloud Storage'daki ses dosyasının URI'sını API'ye iletirsiniz.
Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın.
Artık Speech-to-Text API'yi çağırmaya hazırsınız.
3. görev: Speech-to-Text API'yi çağırma
- Aşağıdaki
curl
komutunu kullanarak isteğinizin gövdesini, API anahtarı ortam değişkeniyle birlikte Speech-to-Text API'ye iletin (hepsi tek bir komut satırında):
Yanıtınızın görünümü aşağıdaki gibi olacaktır:
transcript
değeri, Speech-to-Text API'nin ses dosyanızla ilişkili olarak ürettiği transkripti döndürür. confidence
değeri ise API'nin, ses dosyanızın transkriptinin doğruluğundan ne kadar emin olduğunu gösterir.
Yukarıdaki istekte syncrecognize
yöntemini çağırdığınızı fark etmişsinizdir. Speech-to-Text API hem eşzamanlı hem de eşzamansız sesle yazma transkriptini destekler. Bu örnekte, ses dosyasının tamamını gönderdiniz ancak syncrecognize
yöntemini, kullanıcı konuşmaya devam ederken canlı sesle yazma transkripti üretmek için de kullanabilirsiniz.
Speech-to-Text API isteği oluşturdunuz, ardından Speech-to-Text API'yi çağırdınız.
- Yanıtı bir
result.json
dosyasına kaydetmek için aşağıdaki komutu çalıştırın:
Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın.
Tebrikler!
Giriş ses dosyasının transkriptini almak için Speech-to-Text API'yi kullandınız.
Sonraki adımlar/Daha fazla bilgi
Bu laboratuvar, Qwik Starts laboratuvar serisinin de bir parçasıdır. Bu laboratuvarlar, Google Cloud'daki pek çok özelliği biraz olsun tanıtabilmek için tasarlamıştır. Katılabileceğiniz bir sonraki laboratuvarı bulmak için laboratuvar kataloğunda "Qwik Starts" araması yapın.
Google Cloud eğitimi ve sertifikası
...Google Cloud teknolojilerinden en iyi şekilde yararlanmanıza yardımcı olur. Derslerimizde teknik becerilere odaklanırken en iyi uygulamalara da yer veriyoruz. Gerekli yetkinlik seviyesine hızlıca ulaşmanız ve öğrenim maceranızı sürdürebilmeniz için sizlere yardımcı olmayı amaçlıyoruz. Temel kavramlardan ileri seviyeye kadar farklı eğitim programlarımız mevcut. Ayrıca, yoğun gündeminize uyması için talep üzerine sağlanan, canlı ve sanal eğitim alternatiflerimiz de var. Sertifikasyonlar ise Google Cloud teknolojilerindeki becerilerinizi ve uzmanlığınızı doğrulamanıza ve kanıtlamanıza yardımcı oluyor.
Kılavuzun Son Güncellenme Tarihi: 13 Şubat 2024
Laboratuvarın Son Test Edilme Tarihi: 13 Ekim 2023
Telif Hakkı 2024 Google LLC Tüm hakları saklıdır. Google ve Google logosu, Google LLC şirketinin ticari markalarıdır. Diğer tüm şirket ve ürün adları ilişkili oldukları şirketlerin ticari markaları olabilir.