Checkpoints
Create a Vertex AI Workbench instance
/ 50
Copy the sample code
/ 50
Pekiştirmeli Öğrenme: Qwik Start
GSP691
Genel bakış
Makine öğrenimi araştırmalarının diğer pek çok alanında olduğu gibi pekiştirmeli öğrenme (RL) de baş döndürücü bir hızla gelişiyor. Diğer araştırma alanlarına benzer şekilde, araştırmacılar teknoloji harikası sonuçlar elde etmek için derin öğrenmeden yararlanıyor.
Bu laboratuvarda, OpenAI Gym'in sağladığı örnekten modellenen basit bir oyun geliştirerek pekiştirmeli öğrenmenin temel kavramlarını öğreneceksiniz.
Neler öğreneceksiniz?
Bu laboratuvardaki hedefleriniz:
- Pekiştirmeli öğrenmenin temel kavramlarını öğrenme
- AI Platform Tensorflow 2.1 Notebook oluşturma
- GitHub'daki "training-data-analyst" deposunda bulunan örnek depoyu klonlama
- Not defterindeki adımları okuma, anlama ve çalıştırma
Kurulum ve şartlar
Laboratuvarı Başlat düğmesini tıklamadan önce
Buradaki talimatları okuyun. Laboratuvarlar süreli olduğundan duraklatılamaz. Laboratuvarı Başlat'ı tıkladığınızda başlayan zamanlayıcı, Google Cloud kaynaklarının ne süreyle kullanımınıza açık durumda kalacağını gösterir.
Bu uygulamalı laboratuvarı kullanarak, laboratuvar etkinliklerini gerçek bir bulut ortamında (Simülasyon veya demo ortamında değil.) gerçekleştirebilirsiniz. Bu olanağın sunulabilmesi için size yeni, geçici kimlik bilgileri verilir. Bu kimlik bilgilerini laboratuvar süresince Google Cloud'da oturum açmak ve Google Cloud'a erişmek için kullanırsınız.
Bu laboratuvarı tamamlamak için şunlar gerekir:
- Standart bir internet tarayıcısına erişim (Chrome Tarayıcı önerilir).
- Laboratuvarı tamamlamak için yeterli süre. (Laboratuvarlar, başlatıldıktan sonra duraklatılamaz)
Laboratuvarınızı başlatma ve Google Cloud Console'da oturum açma
-
Laboratuvarı Başlat düğmesini tıklayın. Laboratuvar için ödeme yapmanız gerekiyorsa ödeme yöntemini seçebileceğiniz bir pop-up açılır. Soldaki Laboratuvar Ayrıntıları panelinde şunlar yer alır:
- Google Cloud Console'u aç düğmesi
- Kalan süre
- Bu laboratuvarda kullanmanız gereken geçici kimlik bilgileri
- Bu laboratuvarda ilerlemek için gerekebilecek diğer bilgiler
-
Google Cloud Console'u aç'ı tıklayın (veya Chrome Tarayıcı'yı kullanıyorsanız sağ tıklayıp Bağlantıyı gizli pencerede aç'ı seçin).
Laboratuvar, kaynakları çalıştırır ve sonra Oturum açın sayfasını gösteren başka bir sekme açar.
İpucu: Sekmeleri ayrı pencerelerde, yan yana açın.
Not: Hesap seçin iletişim kutusunu görürseniz Başka bir hesap kullan'ı tıklayın. -
Gerekirse aşağıdaki kullanıcı adını kopyalayıp Oturum açın iletişim kutusuna yapıştırın.
{{{user_0.username | "Username"}}} Kullanıcı adını Laboratuvar ayrıntıları panelinde de bulabilirsiniz.
-
İleri'yi tıklayın.
-
Aşağıdaki şifreyi kopyalayıp Hoş geldiniz iletişim kutusuna yapıştırın.
{{{user_0.password | "Password"}}} Şifreyi Laboratuvar ayrıntıları panelinde de bulabilirsiniz.
-
İleri'yi tıklayın.
Önemli: Laboratuvarın sizinle paylaştığı giriş bilgilerini kullanmanız gerekir. Google Cloud hesabınızın kimlik bilgilerini kullanmayın. Not: Bu laboratuvarda kendi Google Cloud hesabınızı kullanabilmek için ek ücret ödemeniz gerekebilir. -
Sonraki sayfalarda ilgili düğmeleri tıklayarak ilerleyin:
- Şartları ve koşulları kabul edin.
- Geçici bir hesap kullandığınızdan kurtarma seçenekleri veya iki faktörlü kimlik doğrulama eklemeyin.
- Ücretsiz denemelere kaydolmayın.
Birkaç saniye sonra Google Cloud Console bu sekmede açılır.
1. görev: Pekiştirmeli öğrenmeye giriş
Pekiştirmeli öğrenme (RL) bir makine öğrenimi yöntemidir. Bu yöntemde bir aracı, belirtilen bir hedefi en yüksek düzeye çıkarmak (ödül) amacıyla belirli bir adım sırasını takip ederek çeşitli işlemler gerçekleştirir. Daha geleneksel, gözetimli öğrenim tekniklerinin aksine, her veri noktası etiketlenmez ve aracının yalnızca "seyrek" ödüllere erişimi vardır.
RL'nin geçmişi 1950'lere kadar uzanıyor ve şu an kullanılabilecek çok sayıda RL algoritması mevcut. Bununla birlikte, kolayca uygulamaya alınabilen ancak güçten de ödün vermeyen iki derin RL algoritması özellikle dikkat çekiyor: Deep Q-network (DQN) ve Deep Deterministic Policy Gradient (DDPG). Bu bölümde, bu algoritmaları ve bunları temel alan diğer algoritma çeşitlerini kısaca tanıtacağız.
Pekiştirmeli öğrenme problemiyle ilişkili kavramsal süreç şeması
Deep Q-network (DQN), 2015'te Google Deepmind grubu tarafından bu Nature raporuyla tanıtıldı. Derin öğrenmenin görüntü tanıma alanında gösterdiği başarıdan cesaret alan yazarlar, derin sinir ağlarını Q-Learning'e dahil edip algoritmalarını çok büyük bir gözlem alanı sunan Atari Game Engine Simulator'da test etti.
Derin sinir ağı, belli bir giriş durumunda, çıkış Q değerlerini veya belli bir işlemin arzu edilebilirliğini tahmin eden bir işlev kestirim aracı olarak çalışır. Buna uygun şekilde DQN, değer tabanlı bir yöntemdir: Eğitim algoritmasında DQN, Q değerlerini Bellman denklemine göre günceller ve hareketli bir hedefi tutturmanın güçlüğünden kaçınmak adına, hedef değerlerin bir tahmini olarak işlev gören ikinci bir derin sinir ağını sürece dahil eder.
Biraz daha pratik bir bakış açısıyla aşağıdaki model; kaynak dosyalarını, kabuk komutunu ve Google Cloud'da RL işinin çalıştırılacağı uç noktayı vurgular:
2. görev: Ortamınızı ayarlama
-
Google Cloud konsolunun gezinme menüsünde () Vertex AI > Dashboard'u (Vertex AI > Kontrol paneli) tıklayın.
-
Enable All Recommended APIs'ı (Önerilen Tüm API'leri Etkinleştir) tıklayın.
3. görev: Vertex AI Notebook'u kullanıma sunma
Vertex AI Workbench not defteri oluşturup başlatmak için:
-
Gezinme menüsünde Vertex AI > Workbench'i tıklayın.
-
Workbench sayfasında (henüz etkinleştirilmemişse), Notebooks API'yi etkinleştir'i tıklayın.
-
Kullanıcı tarafından yönetilen not defterleri sekmesini, ardından Yeni oluştur'u tıklayın.
-
Not defterine bir ad verin.
-
Bölge'yi
ve Alt bölge'yi olarak ayarlayın. -
Yeni örnek menüsünde, Ortam'ın altında en son sürüm olan TensorFlow Enterprise 2.11'i seçin.
-
Örnek özelliklerini düzenlemek için Gelişmiş seçenekler'i tıklayın.
-
Makine türü'nü tıklayın ve Makine türü olarak e2-standard-2'yi seçin.
-
Geri kalan alanları varsayılan değerlerde bırakıp Oluştur'u tıklayın.
Birkaç dakika sonra Workbench sayfasında örneğiniz ve JupyterLab'i aç seçeneği görünür.
- JupyterLab'i yeni sekmede açmak için JupyterLab'i aç'ı tıklayın. Beatrix jupyterlab'in derlemeye dahil edilmesi gerektiğine dair bir mesaj alırsanız mesajı görmezden gelin.
Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın.
4. görev: Örnek kodu klonlama
JupyterLab örneğinizdeki training-data-analyst
deposunu klonlamak için:
- JupyterLab'de terminal simgesini tıklayarak yeni bir terminal açın.
- Komut satırı isteminde şu komutu yazıp ENTER'a basın:
- Depoyu klonladığınızı onaylamak için soldaki panelde
training-data-analyst
klasörünü çift tıklayarak içeriklerini görüntüleyin.
- Soldaki menüden training-data-analyst> quests > rl > early_rl > early_rl.ipynb'yi seçin. Bunu yaptığınızda yeni bir sekme açılır.
Hedefi doğrulamak için İlerleme durumumu kontrol et'i tıklayın.
5. görev: Not defterindeki kodu çalıştırma
Yeni sekmeniz aşağıdakine benzer bir görünümde olacaktır:
-
Aşağıdaki not defterini baştan sona okuyun ve tüm kod bloklarını üst karakter + Enter tuşlarına basarak çalıştırın.
-
Not defterindeki talimatları tamamladıktan sonra buraya dönün.
Tebrikler!
Bu laboratuvarda, pekiştirmeli öğrenmenin (RL) temel ilkelerini öğrendiniz. Bir Jupyterlab örneği oluşturup örnek bir depoyu klonladınız ve bir not defterindeki kodu çalıştırarak pekiştirmeli öğrenmenin temel kavramlarıyla ilgili uygulamalı alıştırmalar yaptınız. Artık bu serideki diğer laboratuvarlara katılmaya hazırsınız.
Görevinizi tamamlama
Bu yönlendirmesiz öğrenim laboratuvarı, Temel: Veri, ML, AI adlı Qwiklabs görevinin bir parçasıdır. Görevler, bir öğrenme rotasını oluşturan birbiriyle bağlantılı laboratuvar dizilerini ifade eder. Bu göreve kaydolun ve bu laboratuvara katıldıysanız tamamlama kredisini anında kazanın.
Google Cloud eğitimi ve sertifikası
...Google Cloud teknolojilerinden en iyi şekilde yararlanmanıza yardımcı olur. Derslerimizde teknik becerilere odaklanırken en iyi uygulamalara da yer veriyoruz. Gerekli yetkinlik seviyesine hızlıca ulaşmanız ve öğrenim maceranızı sürdürebilmeniz için sizlere yardımcı olmayı amaçlıyoruz. Temel kavramlardan ileri seviyeye kadar farklı eğitim programlarımız mevcut. Ayrıca, yoğun gündeminize uyması için talep üzerine sağlanan, canlı ve sanal eğitim alternatiflerimiz de var. Sertifikasyonlar ise Google Cloud teknolojilerindeki becerilerinizi ve uzmanlığınızı doğrulamanıza ve kanıtlamanıza yardımcı oluyor.
Kılavuzun Son Güncellenme Tarihi: 27 Eylül 2023
Laboratuvarın Son Test Edilme Tarihi: 27 Eylül 2023
Telif Hakkı 2024 Google LLC Tüm hakları saklıdır. Google ve Google logosu, Google LLC şirketinin ticari markalarıdır. Diğer tüm şirket ve ürün adları ilişkili oldukları şirketlerin ticari markaları olabilir.