
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create a Dataproc cluster
/ 50
Submit a job
/ 30
Update a cluster
/ 20
Dataproc; Apache Spark ve Apache Hadoop kümelerini daha basit ve daha uygun maliyetli şekilde çalıştırmak için sunulan hızlı, kullanımı kolay ve tümüyle yönetilen bir bulut hizmetidir. Eskiden saatler, hatta günler süren işlemler, birkaç saniyede veya dakikalar içinde tamamlanır. Dataproc kümelerini hızla oluşturup dilediğiniz zaman yeniden boyutlandırabilirsiniz. Bu sayede, kümelerinize sığmayan ardışık veri düzenleri konusunda endişelenmeniz gerekmez.
Bu laboratuvarda, Dataproc kümesi oluşturmak, kümede basit bir Apache Spark işi çalıştırmak ve ardından kümedeki çalışanların sayısını değiştirmek için Google Cloud konsolunun nasıl kullanılacağı anlatılmaktadır.
Bu laboratuvarda şunları öğreneceksiniz:
Buradaki talimatları okuyun. Laboratuvarlar süreli olduğundan duraklatılamaz. Start Lab'i (Laboratuvarı başlat) tıkladığınızda başlayan zamanlayıcı, Google Cloud kaynaklarının ne süreyle kullanımınıza açık durumda kalacağını gösterir.
Bu uygulamalı laboratuvarı kullanarak, laboratuvar etkinliklerini simülasyon veya demo ortamı yerine gerçek bir bulut ortamında gerçekleştirebilirsiniz. Bunu yapabilmeniz için size yeni, geçici kimlik bilgileri verilir. Bu kimlik bilgilerini laboratuvar süresince Google Cloud'da oturum açmak ve Google Cloud'a erişmek için kullanabilirsiniz.
Bu laboratuvarı tamamlamak için gerekenler:
Laboratuvarı Başlat düğmesini tıklayın. Laboratuvar için ödeme yapmanız gerekiyorsa ödeme yöntemini seçebileceğiniz bir iletişim kutusu açılır. Soldaki "Laboratuvar ayrıntıları" panelinde şunlar yer alır:
Google Cloud Console'u aç'ı tıklayın (veya Chrome Tarayıcı'yı kullanıyorsanız sağ tıklayıp Bağlantıyı gizli pencerede aç'ı seçin).
Laboratuvar, kaynakları çalıştırır ve sonra "Oturum aç" sayfasını gösteren başka bir sekme açar.
İpucu: Sekmeleri ayrı pencerelerde, yan yana açın.
Gerekirse aşağıdaki kullanıcı adını kopyalayıp Oturum açın iletişim kutusuna yapıştırın.
Kullanıcı adını "Laboratuvar ayrıntıları" panelinde de bulabilirsiniz.
İleri'yi tıklayın.
Aşağıdaki şifreyi kopyalayıp Hoş geldiniz iletişim kutusuna yapıştırın.
Şifreyi "Laboratuvar ayrıntıları" panelinde de bulabilirsiniz.
İleri'yi tıklayın.
Sonraki sayfalarda ilgili düğmeleri tıklayarak ilerleyin:
Birkaç saniye sonra Google Cloud konsolu bu sekmede açılır.
Google Cloud'da Dataproc kümesi oluşturabilmek için Cloud Dataproc API'nin etkinleştirilmiş olması gereklidir. API'nin etkinleştirildiğini doğrulamak için:
Gezinme menüsü > API'ler ve Hizmetler > Kitaplık'ı tıklayın:
API ve Hizmet Arayın iletişim kutusuna Cloud Dataproc yazın. Konsoldaki arama sonuçlarında Cloud Dataproc API gösterilir.
API'nin durumunu görüntülemek için Cloud Dataproc API'yi tıklayın. API etkinleştirilmemişse Enable (Etkinleştir) düğmesini tıklayın.
API etkinleştirildikten sonra laboratuvar talimatlarını uygulayın.
Küme oluşturmak için gerekli olan depolama alanı iznini hizmet hesabına atamak için:
Gezinme menüsü > IAM & Admin > IAM (IAM ve Yönetici > IAM) bölümüne gidin.
compute@developer.gserviceaccount.com
hizmet hesabındaki kalem simgesini tıklayın.
+ ADD ANOTHER ROLE (BAŞKA ROL EKLE) düğmesini tıkladıktan sonra Storage Admin (Depolama Yöneticisi) rolünü seçin.
Storage Admin (Depolama Yöneticisi) rolünü seçtikten sonra Save'i (Kaydet) tıklayın.
Cloud Platform Console'da gezinme menüsü > Dataproc > Kümeler'i seçip Küme oluştur'u tıklayın.
Compute Engine'de küme için Oluştur'u tıklayın.
Kümeniz için aşağıdaki alanları ayarlayıp diğer tüm alanlar için varsayılan değerleri kabul edin:
Alan | Değer |
---|---|
Ad | example-cluster |
Bölge | |
Zone (Alt bölge) | |
Machine Series (Manager Node) [Makine serisi (yönetici düğümü)] | E2 |
Machine Type (Manager Node) [Makine türü (yönetici düğümü)] | e2-standard-2 |
Primary disk size (Manager Nodes) [Birincil disk boyutu (yönetici düğümleri)] | 30 GB |
Number of Worker Nodes (Çalışma düğümü sayısı) | 2 |
Machine Series (Worker Nodes) [Makine Serisi (çalışma düğümleri)] | E2 |
Machine Type (Worker Nodes) [Makine türü (çalışma düğümleri)] | e2-standard-2 |
Primary disk size (Worker Nodes) [Birincil disk boyutu (çalışma düğümleri)] | 30 GB |
Internal IP only (Yalnızca dahili IP) | "Configure all instances to have only internal IP addresses"ın (Tüm örnekleri yalnızca dahili IP adresleri olacak şekilde yapılandır) seçimini kaldırın. |
us-central1
veya europe-west1
gibi farklı bölgeler de belirtebilirsiniz.
Yeni kümeniz Kümeler listesinde gösterilir. Kümenin oluşturulması birkaç dakika kadar sürebilir. Küme kullanıma hazır olana kadar, Durum olarak Hazırlanıyor ifadesi gösterilir. Bu ifade daha sonra Çalışıyor olarak değişir.
Tamamlanan görevi test etme
Tamamladığınız görevi doğrulamak için İlerleme durumumu kontrol et'i tıklayın.
Örnek Spark işi çalıştırmak için:
Soldaki bölmede İşler'i tıklayıp Dataproc'un işler görünümüne geçin ve sonra İşi gönder'i tıklayın.
İşi güncellemek için aşağıdaki alanları ayarlayın. Diğer tüm alanlar için varsayılan değerleri kabul edin:
Alan | Değer |
---|---|
Bölge | |
Küme | example-cluster |
İş türü | Spark |
Ana sınıf veya jar | org.apache.spark.examples.SparkPi |
Jar dosyaları | file:///usr/lib/spark/examples/jars/spark-examples.jar |
Bağımsız değişkenler | 1000 (Bu değer, görev sayısını belirler.) |
İşiniz, İşler listesinde görünecektir. Bu listede, projenizdeki işler küme, tür ve geçerli durum bilgileriyle birlikte gösterilir. İş durumu, önce Çalışıyor, iş tamamlandıktan sonra ise Başarılı olarak gösterilir.
Tamamlanan görevi test etme
Tamamladığınız görevi doğrulamak için İlerleme durumumu kontrol et'i tıklayın.
Tamamlanan iş çıkışını görüntülemek için:
İşler listesinde ilgili iş kimliğini tıklayın.
SATIR KAYDIR için AÇIK
değerini seçin veya ekranı en sağa kaydırarak Pi'nin hesaplanmış değerini görüntüleyin. SATIR KAYDIR AÇIK
olarak ayarlandığında çıkış şu şekilde görünür:
İşiniz, Pi değerini başarılı şekilde kabaca hesapladı.
Kümenizdeki çalışan örneklerinin sayısını değiştirmek için:
Soldaki gezinme bölmesinden Kümeler'i seçerek Dataproc Kümeleri görünümüne dönün.
Kümeler listesinde example-cluster'ı tıklayın. Sayfada varsayılan olarak kümenizin CPU kullanımıyla ilgili bir genel bakış gösterilir.
Kümenizin geçerli ayarlarını görmek için Yapılandırma'yı tıklayın.
Düzenle'yi tıklayın. Artık çalışma düğümü sayısını düzenleyebilirsiniz.
Çalışma düğümleri alanına 4 girin.
Kaydet'i tıklayın.
Artık kümeniz güncellenmiştir. Kümedeki sanal makine örneklerinin sayısını kontrol edin.
Tamamlanan görevi test etme
Tamamladığınız görevi doğrulamak için İlerleme durumumu kontrol et'i tıklayın.
Bir işi güncellenmiş bir kümeyle yeniden çalıştırmak istiyorsanız soldaki bölmeden İşler'i ve sonra İŞİ GÖNDER'i tıklayın.
İş gönderme bölümünde ayarladığınız alanları ayarlayın:
Alan | Değer |
---|---|
Bölge | |
Küme | example-cluster |
İş türü | Spark |
Ana sınıf veya jar | org.apache.spark.examples.SparkPi |
Jar dosyaları | file:///usr/lib/spark/examples/jars/spark-examples.jar |
Bağımsız değişkenler | 1000 (Bu değer, görev sayısını belirler.) |
Aşağıda, bu laboratuvarda ele alınan kavramlarla ilgili bilginizi pekiştirmeye yönelik çoktan seçmeli sorular verilmiştir. Bu soruları elinizden geldiğince yanıtlamaya çalışın.
Google Cloud konsolunu kullanarak Dataproc kümesi oluşturup güncellemeyi ve ardından bu kümeye bir iş göndermeyi öğrendiniz.
Bu laboratuvar, Qwik Starts laboratuvar serisinin de bir parçasıdır. Bu laboratuvarlar, Google Cloud'daki pek çok özelliği biraz olsun tanıtabilmek için tasarlamıştır. Katılabileceğiniz bir sonraki laboratuvarı bulmak için laboratuvar kataloğunda "Qwik Starts" araması yapın.
...Google Cloud teknolojilerinden en iyi şekilde yararlanmanıza yardımcı olur. Derslerimizde teknik becerilere odaklanırken en iyi uygulamalara da yer veriyoruz. Gerekli yetkinlik seviyesine hızlıca ulaşmanız ve öğrenim maceranızı sürdürebilmeniz için sizlere yardımcı olmayı amaçlıyoruz. Temel kavramlardan ileri seviyeye kadar farklı eğitim programlarımız mevcut. Ayrıca, yoğun gündeminize uyması için talep üzerine sağlanan, canlı ve sanal eğitim alternatiflerimiz de var. Sertifikasyonlar ise Google Cloud teknolojilerindeki becerilerinizi ve uzmanlığınızı doğrulamanıza ve kanıtlamanıza yardımcı oluyor.
Kılavuzun Son Güncellenme Tarihi: 2 Temmuz 2024
Laboratuvarın Son Test Edilme Tarihi: 2 Temmuz 2024
Telif Hakkı 2025 Google LLC. Tüm hakları saklıdır. Google ve Google logosu, Google LLC şirketinin ticari markalarıdır. Diğer tüm şirket ve ürün adları ilişkili oldukları şirketlerin ticari markaları olabilir.
This content is not currently available
We will notify you via email when it becomes available
Great!
We will contact you via email if it becomes available
One lab at a time
Confirm to end all existing labs and start this one