arrow_back

Speech-to-Text API: Qwik Start

Sign in Join
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Speech-to-Text API: Qwik Start

Lab 30 minutes universal_currency_alt 1 Credit show_chart Introductory
info This lab may incorporate AI tools to support your learning.
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP119

Google Cloud Rehbersiz Laboratuvarları

Genel bakış

Speech-to-Text API, Google konuşma tanıma teknolojilerinin geliştirici uygulamalarına kolayca entegre edilmesini sağlar. Speech-to-Text API, hizmete ses gönderip transkript almanıza olanak tanır.

Neler öğreneceksiniz?

Bu laboratuvarda şunları öğreneceksiniz:

  • API anahtarı oluşturma
  • Speech-to-Text API isteği oluşturma
  • Speech-to-Text API'yi çağırma

Kurulum ve şartlar

Laboratuvarı Başlat düğmesini tıklamadan önce

Buradaki talimatları okuyun. Laboratuvarlar süreli olduğundan duraklatılamaz. Laboratuvarı Başlat'ı tıkladığınızda başlayan zamanlayıcı, Google Cloud kaynaklarının ne süreyle kullanımınıza açık durumda kalacağını gösterir.

Bu uygulamalı laboratuvarı kullanarak, laboratuvar etkinliklerini gerçek bir bulut ortamında (Simülasyon veya demo ortamında değil.) gerçekleştirebilirsiniz. Bu olanağın sunulabilmesi için size yeni, geçici kimlik bilgileri verilir. Bu kimlik bilgilerini laboratuvar süresince Google Cloud'da oturum açmak ve Google Cloud'a erişmek için kullanırsınız.

Bu laboratuvarı tamamlamak için şunlar gerekir:

  • Standart bir internet tarayıcısına erişim (Chrome Tarayıcı önerilir).
Not: Bu laboratuvarı çalıştırmak için tarayıcıyı gizli pencerede açın. Aksi takdirde, kişisel hesabınızla öğrenci hesabınız arasında oluşabilecek çakışmalar nedeniyle kişisel hesabınızdan ek ücret alınabilir.
  • Laboratuvarı tamamlamak için yeterli süre. (Laboratuvarlar, başlatıldıktan sonra duraklatılamaz)
Not: Kişisel bir Google Cloud hesabınız veya projeniz varsa bu laboratuvarda kullanmayın. Aksi takdirde hesabınızdan ek ücret alınabilir.

Laboratuvarınızı başlatma ve Google Cloud Console'da oturum açma

  1. Laboratuvarı Başlat düğmesini tıklayın. Laboratuvar için ödeme yapmanız gerekiyorsa ödeme yöntemini seçebileceğiniz bir pop-up açılır. Soldaki Laboratuvar Ayrıntıları panelinde şunlar yer alır:

    • Google Cloud Console'u aç düğmesi
    • Kalan süre
    • Bu laboratuvarda kullanmanız gereken geçici kimlik bilgileri
    • Bu laboratuvarda ilerlemek için gerekebilecek diğer bilgiler
  2. Google Cloud Console'u aç'ı tıklayın (veya Chrome Tarayıcı'yı kullanıyorsanız sağ tıklayıp Bağlantıyı gizli pencerede aç'ı seçin).

    Laboratuvar, kaynakları çalıştırır ve sonra Oturum açın sayfasını gösteren başka bir sekme açar.

    İpucu: Sekmeleri ayrı pencerelerde, yan yana açın.

    Not: Hesap seçin iletişim kutusunu görürseniz Başka bir hesap kullan'ı tıklayın.
  3. Gerekirse aşağıdaki kullanıcı adını kopyalayıp Oturum açın iletişim kutusuna yapıştırın.

    {{{user_0.username | "Username"}}}

    Kullanıcı adını Laboratuvar ayrıntıları panelinde de bulabilirsiniz.

  4. İleri'yi tıklayın.

  5. Aşağıdaki şifreyi kopyalayıp Hoş geldiniz iletişim kutusuna yapıştırın.

    {{{user_0.password | "Password"}}}

    Şifreyi Laboratuvar ayrıntıları panelinde de bulabilirsiniz.

  6. İleri'yi tıklayın.

    Önemli: Laboratuvarın sizinle paylaştığı giriş bilgilerini kullanmanız gerekir. Google Cloud hesabınızın kimlik bilgilerini kullanmayın. Not: Bu laboratuvarda kendi Google Cloud hesabınızı kullanabilmek için ek ücret ödemeniz gerekebilir.
  7. Sonraki sayfalarda ilgili düğmeleri tıklayarak ilerleyin:

    • Şartları ve koşulları kabul edin.
    • Geçici bir hesap kullandığınızdan kurtarma seçenekleri veya iki faktörlü kimlik doğrulama eklemeyin.
    • Ücretsiz denemelere kaydolmayın.

Birkaç saniye sonra Google Cloud Console bu sekmede açılır.

Not: Google Cloud ürün ve hizmetlerinin listelendiği menüyü görmek için sol üstteki Gezinme menüsü'nü tıklayın. Gezinme menüsü simgesi

1. görev: API anahtarı oluşturma

Speech-to-Text API'ye istek göndermek için curl kullanacağınızdan istek URL'sini iletmek için bir API anahtarı oluşturmanız gerekecektir.

  1. API oluşturmak için Gezinme menüsü > API'ler ve hizmetler > Kimlik bilgileri'ni tıklayın.

  2. Ardından, Kimlik bilgileri oluştur'u tıklayın.

  3. Açılır menüden API anahtarı'nı seçin.

  4. Oluşturduğunuz anahtarı kopyalayıp Kapat'ı tıklayın.

Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın.

API anahtarı oluşturma

Artık bir API anahtarınız var. Şimdi bu anahtarı bir ortam değişkeni olarak kaydedip her istekte API anahtarınızın değerini ekleme zahmetinden kurtulabilirsiniz.

Sonraki adımları gerçekleştirmek için sağlanan örneğe bağlanın. Bunun için SSH'yi kullanın.

  1. Gezinme menüsünden, Compute Engine'i seçin. Sanal makine örnekleri penceresinde linux-instance örneği gösterilir.

  2. linux-instance örneğinin yanındaki SSH düğmesini tıklayın. Etkileşimli bir kabuğa yönlendirileceksiniz.

  3. Aşağıdaki kodu, <API_ANAHTARINIZ> bölümünü az önce kopyaladığınız API anahtarıyla değiştirerek komut satırına girin:

export API_KEY=<API_ANAHTARINIZ>

Laboratuvarın geri kalan bölümünde SSH oturumunda kalın.

2. görev: Speech-to-Text API isteğinizi oluşturma

Not: Cloud Storage'da mevcut olan önceden kaydedilmiş bir dosyayı kullanacaksınız: gs://cloud-samples-tests/speech/brooklyn.flac. Speech-to-Text API'ye göndermeden önce ses dosyasını dinleyin.
  1. SSH komut satırında request.json dosyasını oluşturun. Speech-to-Text API'ye yönelik isteğinizi oluşturmak için bu dosyayı kullanacaksınız:
touch request.json
  1. request.json dosyasını açın:
nano request.json Not: Tercih ettiğiniz komut satırı düzenleyiciyi (nano, vim, emacs) veya gcloud'u kullanabilirsiniz. Bu laboratuvarda, nano ile ilgili talimatlar sağlanmaktadır.
  1. Örnek RAW ses dosyasının uri değerini kullanarak aşağıdaki kodu request.json dosyanıza ekleyin:
{ "config": { "encoding":"FLAC", "languageCode": "en-US" }, "audio": { "uri":"gs://cloud-samples-tests/speech/brooklyn.flac" } }
  1. Control + x, ardından y tuşuna basarak request.json dosyasını kaydedin ve Enter tuşuna basarak dosyayı kapatın.

İsteğin gövdesinde bir config ve audio nesnesi bulunur.

config'de, Speech-to-Text API'nin isteği nasıl işleyeceğini belirtirsiniz. encoding parametresi, dosya API'ye gönderilirken kullanılan ses kodlama türünü API'ye bildirir. FLAC, .raw dosyaları için kullanılan kodlama türüdür. Kodlama türleri hakkında daha fazla bilgiye RecognitionConfig Kılavuzu'ndan ulaşabilirsiniz.

config nesnenize ekleyebileceğiniz başka parametreler de vardır ancak yalnızca encoding parametresi zorunludur.

audio nesnesinde, Cloud Storage'daki ses dosyasının URI'sını API'ye iletirsiniz.

Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın.

Speech-to-Text API isteğinizi oluşturma

Artık Speech-to-Text API'yi çağırmaya hazırsınız.

3. görev: Speech-to-Text API'yi çağırma

  1. Aşağıdaki curl komutunu kullanarak isteğinizin gövdesini, API anahtarı ortam değişkeniyle birlikte Speech-to-Text API'ye iletin (hepsi tek bir komut satırında):
curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \ "https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}"

Yanıtınızın görünümü aşağıdaki gibi olacaktır:

{ "results": [ { "alternatives": [ { "transcript": "how old is the Brooklyn Bridge", "confidence": 0.98267895 } ] } ] }

transcript değeri, Speech-to-Text API'nin ses dosyanızla ilişkili olarak ürettiği transkripti döndürür. confidence değeri ise API'nin, ses dosyanızın transkriptinin doğruluğundan ne kadar emin olduğunu gösterir.

Yukarıdaki istekte syncrecognize yöntemini çağırdığınızı fark etmişsinizdir. Speech-to-Text API hem eşzamanlı hem de eşzamansız sesle yazma transkriptini destekler. Bu örnekte, ses dosyasının tamamını gönderdiniz ancak syncrecognize yöntemini, kullanıcı konuşmaya devam ederken canlı sesle yazma transkripti üretmek için de kullanabilirsiniz.

Speech-to-Text API isteği oluşturdunuz, ardından Speech-to-Text API'yi çağırdınız.

  1. Yanıtı bir result.json dosyasına kaydetmek için aşağıdaki komutu çalıştırın:
curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \ "https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}" > result.json

Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın.

Speech-to-Text API'yi çağırma

Tebrikler!

Giriş ses dosyasının transkriptini almak için Speech-to-Text API'yi kullandınız.

Sonraki adımlar/Daha fazla bilgi

Bu laboratuvar, Qwik Starts laboratuvar serisinin de bir parçasıdır. Bu laboratuvarlar, Google Cloud'daki pek çok özelliği biraz olsun tanıtabilmek için tasarlamıştır. Katılabileceğiniz bir sonraki laboratuvarı bulmak için laboratuvar kataloğunda "Qwik Starts" araması yapın.

Google Cloud eğitimi ve sertifikası

...Google Cloud teknolojilerinden en iyi şekilde yararlanmanıza yardımcı olur. Derslerimizde teknik becerilere odaklanırken en iyi uygulamalara da yer veriyoruz. Gerekli yetkinlik seviyesine hızlıca ulaşmanız ve öğrenim maceranızı sürdürebilmeniz için sizlere yardımcı olmayı amaçlıyoruz. Temel kavramlardan ileri seviyeye kadar farklı eğitim programlarımız mevcut. Ayrıca, yoğun gündeminize uyması için talep üzerine sağlanan, canlı ve sanal eğitim alternatiflerimiz de var. Sertifikasyonlar ise Google Cloud teknolojilerindeki becerilerinizi ve uzmanlığınızı doğrulamanıza ve kanıtlamanıza yardımcı oluyor.

Kılavuzun Son Güncellenme Tarihi: 13 Şubat 2024

Laboratuvarın Son Test Edilme Tarihi: 13 Ekim 2023

Telif Hakkı 2024 Google LLC Tüm hakları saklıdır. Google ve Google logosu, Google LLC şirketinin ticari markalarıdır. Diğer tüm şirket ve ürün adları ilişkili oldukları şirketlerin ticari markaları olabilir.

This content is not currently available

We will notify you via email when it becomes available

Great!

We will contact you via email if it becomes available