Checkpoints
Image understanding across multiple images
/ 20
Understanding Screens and Interfaces
/ 20
Understanding entity relationships in technical diagrams
/ 20
Recommendations based on multiple images
/ 20
Similarity/Differences
/ 20
Gemini ile çok formatlılık
GSP1210
Genel Bakış
Google DeepMind tarafından geliştirilen Gemini, çok formatlı kullanım alanları için tasarlanmış bir üretken yapay zeka modeli ailesidir. Gemini API ile, Gemini Pro Vision ve Gemini Pro modellerine erişebilirsiniz. Bu laboratuvarda, Gemini'ın çok formatlı çeşitli kullanım alanları gösterilmektedir. Metin, resim ve video istemlerinden metin oluşturmak için Vertex AI Gemini API'yi nasıl kullanacağınızı bu laboratuvarda öğreneceksiniz.
Çok formatlılık
Yalnızca metin içeren büyük dil modellerine kıyasla, Gemini Pro Vision'ın çok formatlılığından birçok yeni kullanım alanında yararlanabilirsiniz.
Metin ve resimlerin giriş olarak kullanıldığı örnek kullanım alanları:
- Fotoğraflardaki nesneleri algılama
- Ekranları ve arayüzleri anlama
- Çizimleri ve soyutlamaları anlama
- Grafikleri ve diyagramları anlama
- Kullanıcı tercihlerine göre resim önerisi alma
- Resimleri benzerlikler, anormallikler veya farklılıklar açısından karşılaştırma
Metin ve videoların giriş olarak kullanıldığı örnek kullanım alanları:
- Video açıklaması oluşturma
- Videodaki nesnelerin etiketlerini ayıklama
- Videonun öne çıkan anlarını/mesajlarını ayıklama
Hedefler
Bu laboratuvardaki hedefleriniz:
- Metin, resim ve video istemlerinden metin oluşturmak için Vertex AI Gemini API'yi kullanın.
Kurulum ve şartlar
Laboratuvarı Başlat düğmesini tıklamadan önce
Buradaki talimatları okuyun. Laboratuvarlar süreli olduğundan duraklatılamaz. Laboratuvarı Başlat'ı tıkladığınızda başlayan zamanlayıcı, Google Cloud kaynaklarının ne süreyle kullanımınıza açık durumda kalacağını gösterir.
Bu uygulamalı laboratuvarı kullanarak, laboratuvar etkinliklerini gerçek bir bulut ortamında (Simülasyon veya demo ortamında değil.) gerçekleştirebilirsiniz. Bu olanağın sunulabilmesi için size yeni, geçici kimlik bilgileri verilir. Bu kimlik bilgilerini laboratuvar süresince Google Cloud'da oturum açmak ve Google Cloud'a erişmek için kullanırsınız.
Bu laboratuvarı tamamlamak için şunlar gerekir:
- Standart bir internet tarayıcısına erişim (Chrome Tarayıcı önerilir).
- Laboratuvarı tamamlamak için yeterli süre. (Laboratuvarlar, başlatıldıktan sonra duraklatılamaz)
Laboratuvarınızı başlatma ve Google Cloud Console'da oturum açma
-
Laboratuvarı Başlat düğmesini tıklayın. Laboratuvar için ödeme yapmanız gerekiyorsa ödeme yöntemini seçebileceğiniz bir pop-up açılır. Soldaki Laboratuvar Ayrıntıları panelinde şunlar yer alır:
- Google Cloud Console'u aç düğmesi
- Kalan süre
- Bu laboratuvarda kullanmanız gereken geçici kimlik bilgileri
- Bu laboratuvarda ilerlemek için gerekebilecek diğer bilgiler
-
Google Cloud Console'u aç'ı tıklayın (veya Chrome Tarayıcı'yı kullanıyorsanız sağ tıklayıp Bağlantıyı gizli pencerede aç'ı seçin).
Laboratuvar, kaynakları çalıştırır ve sonra Oturum açın sayfasını gösteren başka bir sekme açar.
İpucu: Sekmeleri ayrı pencerelerde, yan yana açın.
Not: Hesap seçin iletişim kutusunu görürseniz Başka bir hesap kullan'ı tıklayın. -
Gerekirse aşağıdaki kullanıcı adını kopyalayıp Oturum açın iletişim kutusuna yapıştırın.
{{{user_0.username | "Username"}}} Kullanıcı adını Laboratuvar ayrıntıları panelinde de bulabilirsiniz.
-
İleri'yi tıklayın.
-
Aşağıdaki şifreyi kopyalayıp Hoş geldiniz iletişim kutusuna yapıştırın.
{{{user_0.password | "Password"}}} Şifreyi Laboratuvar ayrıntıları panelinde de bulabilirsiniz.
-
İleri'yi tıklayın.
Önemli: Laboratuvarın sizinle paylaştığı giriş bilgilerini kullanmanız gerekir. Google Cloud hesabınızın kimlik bilgilerini kullanmayın. Not: Bu laboratuvarda kendi Google Cloud hesabınızı kullanabilmek için ek ücret ödemeniz gerekebilir. -
Sonraki sayfalarda ilgili düğmeleri tıklayarak ilerleyin:
- Şartları ve koşulları kabul edin.
- Geçici bir hesap kullandığınızdan kurtarma seçenekleri veya iki faktörlü kimlik doğrulama eklemeyin.
- Ücretsiz denemelere kaydolmayın.
Birkaç saniye sonra Google Cloud Console bu sekmede açılır.
Önerilen tüm API'leri etkinleştirin
-
Google Cloud Console'un gezinme menüsünde Vertex AI'ı tıklayın.
-
Enable All Recommended APIs'ı (Önerilen Tüm API'leri Etkinleştir) tıklayın.
1. görev: Not defterini Vertex AI Workbench'te açın
-
Google Cloud Console'un gezinme menüsünden Vertex AI > Workbench'i tıklayın.
-
örneğini bulun ve JupyterLab'i aç düğmesini tıklayın.
Workbench örneğinizin JupyterLab arayüzü yeni bir tarayıcı sekmesinde açılır.
2. Görev: Not defterini ayarlayın
-
dosyasını tıklayın. -
Select Kernel (Çekirdek Seç) iletişim kutusunda, kullanılabilir çekirdekler listesinden Python 3'ü seçin.
-
Not defterinin Getting Started (Başlangıç) ve Import libraries (Kitaplıkları içe aktarma) bölümlerini inceleyin.
-
Project ID (Proje kimliği) için
, Location (Konum) için değişkenlerini kullanın.
-
Project ID (Proje kimliği) için
İlerleyen bölümlerde, Python için Vertex AI SDK ile Vertex AI Gemini API'yi nasıl kullanacağınızı öğrenmek için not defteri hücrelerini çalıştıracaksınız.
3. görev: Gemini Pro Vision modelini kullanın
Gemini Pro Vision (gemini-pro-vision), çok formatları istemleri destekleyen bir çok formatlı modeldir. İstem isteklerinize metin, resim ve video ekleyip metin veya kod yanıtları alabilirsiniz.
Bu görevde, Gemini Pro Vision modelinin nasıl kullanıldığını görmek için not defteri hücrelerini çalıştırın. Hedeflere ulaştıkça ilerleme durumunuzu kontrol etmek için buraya dönün.
Birden fazla resim kullanarak resim yorumlama
Gemini, birden fazla resmi yorumlayabilir. Bu örnekte, meyvelerin resmini ve fiyat listesini referans alarak market alışverişinin toplam maliyetini hesaplamak için Gemini'ı kullanacaksınız.
Not defterinin Birden fazla resim kullanarak resim yorumlama bölümünü inceleyin.
Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın.
Ekranları ve arayüzleri anlama
Gemini; cihaz ekranlarından, kullanıcı arayüzlerinden, ekran görüntülerinden, simgelerden ve düzenlerden de bilgi ayıklayabilir. Bu örnekte, bir fırından bilgi ayıklayarak kullanıcıların kullanıcı arayüzünde gezinmesine ve farklı dillerde yanıt vermesine yardımcı olmak için Gemini'ı kullanacaksınız:
Not defterinin Ekranları ve arayüzleri anlama bölümünü inceleyin.
Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın.
Teknik diyagramlarda varlık ilişkilerini anlama
Gemini, diyagramları anlamasını ve optimizasyon veya kod oluşturma gibi uygulanabilir adımlar atmasını sağlayan çok formatlı özelliklere sahiptir. Bu örnekte, Gemini'ın bir varlık ilişkisi (ER) diyagramını nasıl çözebileceğini, tablolar arasındaki ilişkileri nasıl anlayabileceğini, BigQuery gibi belirli bir ortamda optimizasyonla ilgili gereksinimleri nasıl belirleyebileceğini ve hatta ilgili kodu nasıl oluşturabileceğini göreceksiniz.
Not defterinin Teknik diyagramlarda varlık ilişkilerini anlama bölümünü inceleyin.
Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın.
Birden fazla resme dayalı öneriler
Gemini, resim karşılaştırması yapabilir ve öneriler sunabilir. Bu özellik, e-ticaret ve perakende gibi sektörlerde yararlı olabilir. Bu örnekte, oval bir yüze en uygun gözlük modelini önermek için Gemini'ı kullanacaksınız.
Not defterinin Birden fazla resme dayalı öneriler bölümünü inceleyin.
Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın.
Benzerlikler ve farklılıklar
Gemini, resimleri karşılaştırabilir ve nesneler arasındaki benzerlikleri veya farklılıkları belirleyebilir. Bu örnekte, aynı konumun iki ayrı resmini karşılaştırmak ve bunlar arasındaki farkları tanımlamak için Gemini'ı kullanacaksınız.
Not defterinin Benzerlikler ve farklılıklar bölümüne göz atın.
Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın.
Video açıklaması oluşturma
Gemini, video açıklaması oluşturabilir. Bu örnekte, Akdeniz sahilinde çekilmiş bir videonun açıklamasını oluşturmak için Gemini'ı kullanacaksınız.
Not defterinin Video açıklaması oluşturma bölümünü inceleyin.
Videodaki nesnelerin etiketlerini ayıklama
Gemini, videodaki etiketleri de ayıklayabilir. Bu örnekte, fotoğraf çekimi videosundaki nesnelerin etiketlerini ayıklamak ve hashtag'ler oluşturmak için Gemini'ı kullanacaksınız.
Not defterinin Videodaki nesnelerin etiketlerini ayıklama bölümünü inceleyin.
Videolarla ilgili daha fazla soru sorma
Gemini, videolarla ilgili soruları yanıtlayabilir. Bu örnekte, videoyla ilgili soruları yanıtlyıp JSON yanıtı döndürmek için Gemini'ı kullanacaksınız.
Not defterinin Video hakkında daha fazla soru sorma bölümünü inceleyin.
Video dışında ek bilgilere ulaşma
Gemini, video dışındaki ek bilgilere de ulaşabilir. Bu örnekte, videoyla ilgili ek bilgilere (ör. tren rotası hakkında belirli sorular sorma) ulaşmak için Gemini'ı kullanacaksınız.
Not defterinin Video dışında ek bilgilere ulaşma bölümünü inceleyin.
Tebrikler!
Artık laboratuvarı tamamladınız. Bu laboratuvarda, metin ve resim istemlerinden metin oluşturmak için Vertex AI Gemini API'yi nasıl kullanacağınızı öğrendiniz.
Sonraki adımlar / Daha fazla bilgi
- Vertex AI'da üretken yapay zeka belgelerine göz atın.
- Google Cloud Tech YouTube kanalında üretken yapay zeka hakkında daha fazla bilgi edinin.
- Google Cloud Üretken Yapay Zeka resmi deposu
- Örnek Gemini not defterleri
Google Cloud eğitimi ve sertifikası
...Google Cloud teknolojilerinden en iyi şekilde yararlanmanıza yardımcı olur. Derslerimizde teknik becerilere odaklanırken en iyi uygulamalara da yer veriyoruz. Gerekli yetkinlik seviyesine hızlıca ulaşmanız ve öğrenim maceranızı sürdürebilmeniz için sizlere yardımcı olmayı amaçlıyoruz. Temel kavramlardan ileri seviyeye kadar farklı eğitim programlarımız mevcut. Ayrıca, yoğun gündeminize uyması için talep üzerine sağlanan, canlı ve sanal eğitim alternatiflerimiz de var. Sertifikasyonlar ise Google Cloud teknolojilerindeki becerilerinizi ve uzmanlığınızı doğrulamanıza ve kanıtlamanıza yardımcı oluyor.
Kılavuzun Son Güncellenme Tarihi: 8 Ekim 2024
Laboratuvarın Son Test Edilme Tarihi: 8 Ekim 2024
Telif Hakkı 2024 Google LLC Tüm hakları saklıdır. Google ve Google logosu, Google LLC şirketinin ticari markalarıdır. Diğer tüm şirket ve ürün adları ilişkili oldukları şirketlerin ticari markaları olabilir.