arrow_back

Gemini ile çok formatlılık

Sign in Join
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Gemini ile çok formatlılık

Lab 1 hour universal_currency_alt 5 Credits show_chart Intermediate
info This lab may incorporate AI tools to support your learning.
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP1210

Google Cloud Rehbersiz Laboratuvarları

Genel Bakış

Google DeepMind tarafından geliştirilen Gemini, çok formatlı kullanım alanları için tasarlanmış bir üretken yapay zeka modeli ailesidir. Gemini API ile, Gemini Pro Vision ve Gemini Pro modellerine erişebilirsiniz. Bu laboratuvarda, Gemini'ın çok formatlı çeşitli kullanım alanları gösterilmektedir. Metin, resim ve video istemlerinden metin oluşturmak için Vertex AI Gemini API'yi nasıl kullanacağınızı bu laboratuvarda öğreneceksiniz.

Çok formatlılık

Yalnızca metin içeren büyük dil modellerine kıyasla, Gemini Pro Vision'ın çok formatlılığından birçok yeni kullanım alanında yararlanabilirsiniz.

Metin ve resimlerin giriş olarak kullanıldığı örnek kullanım alanları:

  • Fotoğraflardaki nesneleri algılama
  • Ekranları ve arayüzleri anlama
  • Çizimleri ve soyutlamaları anlama
  • Grafikleri ve diyagramları anlama
  • Kullanıcı tercihlerine göre resim önerisi alma
  • Resimleri benzerlikler, anormallikler veya farklılıklar açısından karşılaştırma

Metin ve videoların giriş olarak kullanıldığı örnek kullanım alanları:

  • Video açıklaması oluşturma
  • Videodaki nesnelerin etiketlerini ayıklama
  • Videonun öne çıkan anlarını/mesajlarını ayıklama

Hedefler

Bu laboratuvardaki hedefleriniz:

  • Metin, resim ve video istemlerinden metin oluşturmak için Vertex AI Gemini API'yi kullanın.

Kurulum ve şartlar

Laboratuvarı Başlat düğmesini tıklamadan önce

Buradaki talimatları okuyun. Laboratuvarlar süreli olduğundan duraklatılamaz. Laboratuvarı Başlat'ı tıkladığınızda başlayan zamanlayıcı, Google Cloud kaynaklarının ne süreyle kullanımınıza açık durumda kalacağını gösterir.

Bu uygulamalı laboratuvarı kullanarak, laboratuvar etkinliklerini gerçek bir bulut ortamında (Simülasyon veya demo ortamında değil.) gerçekleştirebilirsiniz. Bu olanağın sunulabilmesi için size yeni, geçici kimlik bilgileri verilir. Bu kimlik bilgilerini laboratuvar süresince Google Cloud'da oturum açmak ve Google Cloud'a erişmek için kullanırsınız.

Bu laboratuvarı tamamlamak için şunlar gerekir:

  • Standart bir internet tarayıcısına erişim (Chrome Tarayıcı önerilir).
Not: Bu laboratuvarı çalıştırmak için tarayıcıyı gizli pencerede açın. Aksi takdirde, kişisel hesabınızla öğrenci hesabınız arasında oluşabilecek çakışmalar nedeniyle kişisel hesabınızdan ek ücret alınabilir.
  • Laboratuvarı tamamlamak için yeterli süre. (Laboratuvarlar, başlatıldıktan sonra duraklatılamaz)
Not: Kişisel bir Google Cloud hesabınız veya projeniz varsa bu laboratuvarda kullanmayın. Aksi takdirde hesabınızdan ek ücret alınabilir.

Laboratuvarınızı başlatma ve Google Cloud Console'da oturum açma

  1. Laboratuvarı Başlat düğmesini tıklayın. Laboratuvar için ödeme yapmanız gerekiyorsa ödeme yöntemini seçebileceğiniz bir pop-up açılır. Soldaki Laboratuvar Ayrıntıları panelinde şunlar yer alır:

    • Google Cloud Console'u aç düğmesi
    • Kalan süre
    • Bu laboratuvarda kullanmanız gereken geçici kimlik bilgileri
    • Bu laboratuvarda ilerlemek için gerekebilecek diğer bilgiler
  2. Google Cloud Console'u aç'ı tıklayın (veya Chrome Tarayıcı'yı kullanıyorsanız sağ tıklayıp Bağlantıyı gizli pencerede aç'ı seçin).

    Laboratuvar, kaynakları çalıştırır ve sonra Oturum açın sayfasını gösteren başka bir sekme açar.

    İpucu: Sekmeleri ayrı pencerelerde, yan yana açın.

    Not: Hesap seçin iletişim kutusunu görürseniz Başka bir hesap kullan'ı tıklayın.
  3. Gerekirse aşağıdaki kullanıcı adını kopyalayıp Oturum açın iletişim kutusuna yapıştırın.

    {{{user_0.username | "Username"}}}

    Kullanıcı adını Laboratuvar ayrıntıları panelinde de bulabilirsiniz.

  4. İleri'yi tıklayın.

  5. Aşağıdaki şifreyi kopyalayıp Hoş geldiniz iletişim kutusuna yapıştırın.

    {{{user_0.password | "Password"}}}

    Şifreyi Laboratuvar ayrıntıları panelinde de bulabilirsiniz.

  6. İleri'yi tıklayın.

    Önemli: Laboratuvarın sizinle paylaştığı giriş bilgilerini kullanmanız gerekir. Google Cloud hesabınızın kimlik bilgilerini kullanmayın. Not: Bu laboratuvarda kendi Google Cloud hesabınızı kullanabilmek için ek ücret ödemeniz gerekebilir.
  7. Sonraki sayfalarda ilgili düğmeleri tıklayarak ilerleyin:

    • Şartları ve koşulları kabul edin.
    • Geçici bir hesap kullandığınızdan kurtarma seçenekleri veya iki faktörlü kimlik doğrulama eklemeyin.
    • Ücretsiz denemelere kaydolmayın.

Birkaç saniye sonra Google Cloud Console bu sekmede açılır.

Not: Google Cloud ürün ve hizmetlerinin listelendiği menüyü görmek için sol üstteki Gezinme menüsü'nü tıklayın. Gezinme menüsü simgesi

Önerilen tüm API'leri etkinleştirin

  1. Google Cloud Console'un gezinme menüsünde Vertex AI'ı tıklayın.

  2. Enable All Recommended APIs'ı (Önerilen Tüm API'leri Etkinleştir) tıklayın.

1. görev: Not defterini Vertex AI Workbench'te açın

  1. Google Cloud Console'un gezinme menüsünden Vertex AI > Workbench'i tıklayın.

  2. örneğini bulun ve JupyterLab'i aç düğmesini tıklayın.

Workbench örneğinizin JupyterLab arayüzü yeni bir tarayıcı sekmesinde açılır.

2. Görev: Not defterini ayarlayın

  1. dosyasını tıklayın.

  2. Select Kernel (Çekirdek Seç) iletişim kutusunda, kullanılabilir çekirdekler listesinden Python 3'ü seçin.

  3. Not defterinin Getting Started (Başlangıç) ve Import libraries (Kitaplıkları içe aktarma) bölümlerini inceleyin.

    • Project ID (Proje kimliği) için , Location (Konum) için değişkenlerini kullanın.
Not: Colab only (Yalnızca Colab) olarak belirtilen not defteri hücrelerini atlayabilirsiniz.

İlerleyen bölümlerde, Python için Vertex AI SDK ile Vertex AI Gemini API'yi nasıl kullanacağınızı öğrenmek için not defteri hücrelerini çalıştıracaksınız.

3. görev: Gemini Pro Vision modelini kullanın

Gemini Pro Vision (gemini-pro-vision), çok formatları istemleri destekleyen bir çok formatlı modeldir. İstem isteklerinize metin, resim ve video ekleyip metin veya kod yanıtları alabilirsiniz.

Bu görevde, Gemini Pro Vision modelinin nasıl kullanıldığını görmek için not defteri hücrelerini çalıştırın. Hedeflere ulaştıkça ilerleme durumunuzu kontrol etmek için buraya dönün.

Birden fazla resim kullanarak resim yorumlama

Gemini, birden fazla resmi yorumlayabilir. Bu örnekte, meyvelerin resmini ve fiyat listesini referans alarak market alışverişinin toplam maliyetini hesaplamak için Gemini'ı kullanacaksınız.

Not defterinin Birden fazla resim kullanarak resim yorumlama bölümünü inceleyin.

Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın. Birden fazla resim kullanarak resim yorumlama

Ekranları ve arayüzleri anlama

Gemini; cihaz ekranlarından, kullanıcı arayüzlerinden, ekran görüntülerinden, simgelerden ve düzenlerden de bilgi ayıklayabilir. Bu örnekte, bir fırından bilgi ayıklayarak kullanıcıların kullanıcı arayüzünde gezinmesine ve farklı dillerde yanıt vermesine yardımcı olmak için Gemini'ı kullanacaksınız:

Not defterinin Ekranları ve arayüzleri anlama bölümünü inceleyin.

Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın. Ekranları ve arayüzleri anlama

Teknik diyagramlarda varlık ilişkilerini anlama

Gemini, diyagramları anlamasını ve optimizasyon veya kod oluşturma gibi uygulanabilir adımlar atmasını sağlayan çok formatlı özelliklere sahiptir. Bu örnekte, Gemini'ın bir varlık ilişkisi (ER) diyagramını nasıl çözebileceğini, tablolar arasındaki ilişkileri nasıl anlayabileceğini, BigQuery gibi belirli bir ortamda optimizasyonla ilgili gereksinimleri nasıl belirleyebileceğini ve hatta ilgili kodu nasıl oluşturabileceğini göreceksiniz.

Not defterinin Teknik diyagramlarda varlık ilişkilerini anlama bölümünü inceleyin.

Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın. Teknik diyagramlarda varlık ilişkilerini anlama

Birden fazla resme dayalı öneriler

Gemini, resim karşılaştırması yapabilir ve öneriler sunabilir. Bu özellik, e-ticaret ve perakende gibi sektörlerde yararlı olabilir. Bu örnekte, oval bir yüze en uygun gözlük modelini önermek için Gemini'ı kullanacaksınız.

Not defterinin Birden fazla resme dayalı öneriler bölümünü inceleyin.

Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın. Birden fazla resme dayalı öneriler

Benzerlikler ve farklılıklar

Gemini, resimleri karşılaştırabilir ve nesneler arasındaki benzerlikleri veya farklılıkları belirleyebilir. Bu örnekte, aynı konumun iki ayrı resmini karşılaştırmak ve bunlar arasındaki farkları tanımlamak için Gemini'ı kullanacaksınız.

Not defterinin Benzerlikler ve farklılıklar bölümüne göz atın.

Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın. Benzerlikler ve farklılıklar

Video açıklaması oluşturma

Gemini, video açıklaması oluşturabilir. Bu örnekte, Akdeniz sahilinde çekilmiş bir videonun açıklamasını oluşturmak için Gemini'ı kullanacaksınız.

Not defterinin Video açıklaması oluşturma bölümünü inceleyin.

Videodaki nesnelerin etiketlerini ayıklama

Gemini, videodaki etiketleri de ayıklayabilir. Bu örnekte, fotoğraf çekimi videosundaki nesnelerin etiketlerini ayıklamak ve hashtag'ler oluşturmak için Gemini'ı kullanacaksınız.

Not defterinin Videodaki nesnelerin etiketlerini ayıklama bölümünü inceleyin.

Videolarla ilgili daha fazla soru sorma

Gemini, videolarla ilgili soruları yanıtlayabilir. Bu örnekte, videoyla ilgili soruları yanıtlyıp JSON yanıtı döndürmek için Gemini'ı kullanacaksınız.

Not defterinin Video hakkında daha fazla soru sorma bölümünü inceleyin.

Video dışında ek bilgilere ulaşma

Gemini, video dışındaki ek bilgilere de ulaşabilir. Bu örnekte, videoyla ilgili ek bilgilere (ör. tren rotası hakkında belirli sorular sorma) ulaşmak için Gemini'ı kullanacaksınız.

Not defterinin Video dışında ek bilgilere ulaşma bölümünü inceleyin.

Tebrikler!

Artık laboratuvarı tamamladınız. Bu laboratuvarda, metin ve resim istemlerinden metin oluşturmak için Vertex AI Gemini API'yi nasıl kullanacağınızı öğrendiniz.

Sonraki adımlar / Daha fazla bilgi

Google Cloud eğitimi ve sertifikası

...Google Cloud teknolojilerinden en iyi şekilde yararlanmanıza yardımcı olur. Derslerimizde teknik becerilere odaklanırken en iyi uygulamalara da yer veriyoruz. Gerekli yetkinlik seviyesine hızlıca ulaşmanız ve öğrenim maceranızı sürdürebilmeniz için sizlere yardımcı olmayı amaçlıyoruz. Temel kavramlardan ileri seviyeye kadar farklı eğitim programlarımız mevcut. Ayrıca, yoğun gündeminize uyması için talep üzerine sağlanan, canlı ve sanal eğitim alternatiflerimiz de var. Sertifikasyonlar ise Google Cloud teknolojilerindeki becerilerinizi ve uzmanlığınızı doğrulamanıza ve kanıtlamanıza yardımcı oluyor.

Kılavuzun Son Güncellenme Tarihi: 8 Ekim 2024

Laboratuvarın Son Test Edilme Tarihi: 8 Ekim 2024

Telif Hakkı 2024 Google LLC Tüm hakları saklıdır. Google ve Google logosu, Google LLC şirketinin ticari markalarıdır. Diğer tüm şirket ve ürün adları ilişkili oldukları şirketlerin ticari markaları olabilir.

This content is not currently available

We will notify you via email when it becomes available

Great!

We will contact you via email if it becomes available