arrow_back

Dataprep: Qwik Start

Sign in Join
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Dataprep: Qwik Start

Lab 1 hour universal_currency_alt 1 Credit show_chart Introductory
info This lab may incorporate AI tools to support your learning.
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Bu laboratuvar, iş ortağımız Trifacta ile birlikte geliştirildi. Hesap profilinizde ürün güncellemelerini, duyuruları ve teklifleri almak için kaydolduysanız kişisel bilgileriniz, laboratuvar sponsoru Trifacta ile paylaşılabilir.

GSP105

Google Cloud Rehbersiz Laboratuvarları

Genel bakış

Trifacta Cloud Dataprep, verileri analiz için görsel olarak keşfetmek, temizlemek ve hazırlamak amacıyla kullanılabilecek akıllı bir veri hizmetidir. Cloud Dataprep sunucusuzdur ve her ölçekte çalışır. Dağıtılacak veya yönetilecek bir altyapı yoktur. Veriler, yalnızca tıklamalarla, hiçbir kod olmadan kolayca hazırlanır.

Bu laboratuvarda Dataprep kullanarak veri kümelerini değiştireceksiniz. Veri kümelerini içe aktaracak, uyumsuz verileri düzeltecek ve verileri dönüştürüp birleştireceksiniz. Bu işlemler konusunda bilginiz olmasa bile laboratuvarın sonunda bunların hepsini öğrenmiş olacaksınız.

Neler yapacaksınız?

Bu laboratuvarda, aşağıdaki görevleri tamamlamak için Dataprep'i nasıl kullanacağınızı öğreneceksiniz:

  • Verileri içe aktarma
  • Uyumsuz verileri düzeltme
  • Verileri dönüştürme
  • Verileri birleştirme

Kurulum ve şartlar

Laboratuvarı Başlat düğmesini tıklamadan önce

Buradaki talimatları okuyun. Laboratuvarlar süreli olduğundan duraklatılamaz. Laboratuvarı Başlat'ı tıkladığınızda başlayan zamanlayıcı, Google Cloud kaynaklarının ne süreyle kullanımınıza açık durumda kalacağını gösterir.

Bu uygulamalı laboratuvarı kullanarak, laboratuvar etkinliklerini gerçek bir bulut ortamında (Simülasyon veya demo ortamında değil.) gerçekleştirebilirsiniz. Bu olanağın sunulabilmesi için size yeni, geçici kimlik bilgileri verilir. Bu kimlik bilgilerini laboratuvar süresince Google Cloud'da oturum açmak ve Google Cloud'a erişmek için kullanırsınız.

Bu laboratuvarı tamamlamak için şunlar gerekir:

  • Standart bir internet tarayıcısına erişim (Chrome Tarayıcı önerilir).
Not: Bu laboratuvarı çalıştırmak için tarayıcıyı gizli pencerede açın. Aksi takdirde, kişisel hesabınızla öğrenci hesabınız arasında oluşabilecek çakışmalar nedeniyle kişisel hesabınızdan ek ücret alınabilir.
  • Laboratuvarı tamamlamak için yeterli süre. (Laboratuvarlar, başlatıldıktan sonra duraklatılamaz)
Not: Kişisel bir Google Cloud hesabınız veya projeniz varsa bu laboratuvarda kullanmayın. Aksi takdirde hesabınızdan ek ücret alınabilir.

Laboratuvarınızı başlatma ve Google Cloud Console'da oturum açma

  1. Laboratuvarı Başlat düğmesini tıklayın. Laboratuvar için ödeme yapmanız gerekiyorsa ödeme yöntemini seçebileceğiniz bir pop-up açılır. Soldaki Laboratuvar Ayrıntıları panelinde şunlar yer alır:

    • Google Cloud Console'u aç düğmesi
    • Kalan süre
    • Bu laboratuvarda kullanmanız gereken geçici kimlik bilgileri
    • Bu laboratuvarda ilerlemek için gerekebilecek diğer bilgiler
  2. Google Cloud Console'u aç'ı tıklayın (veya Chrome Tarayıcı'yı kullanıyorsanız sağ tıklayıp Bağlantıyı gizli pencerede aç'ı seçin).

    Laboratuvar, kaynakları çalıştırır ve sonra Oturum açın sayfasını gösteren başka bir sekme açar.

    İpucu: Sekmeleri ayrı pencerelerde, yan yana açın.

    Not: Hesap seçin iletişim kutusunu görürseniz Başka bir hesap kullan'ı tıklayın.
  3. Gerekirse aşağıdaki kullanıcı adını kopyalayıp Oturum açın iletişim kutusuna yapıştırın.

    {{{user_0.username | "Username"}}}

    Kullanıcı adını Laboratuvar ayrıntıları panelinde de bulabilirsiniz.

  4. İleri'yi tıklayın.

  5. Aşağıdaki şifreyi kopyalayıp Hoş geldiniz iletişim kutusuna yapıştırın.

    {{{user_0.password | "Password"}}}

    Şifreyi Laboratuvar ayrıntıları panelinde de bulabilirsiniz.

  6. İleri'yi tıklayın.

    Önemli: Laboratuvarın sizinle paylaştığı giriş bilgilerini kullanmanız gerekir. Google Cloud hesabınızın kimlik bilgilerini kullanmayın. Not: Bu laboratuvarda kendi Google Cloud hesabınızı kullanabilmek için ek ücret ödemeniz gerekebilir.
  7. Sonraki sayfalarda ilgili düğmeleri tıklayarak ilerleyin:

    • Şartları ve koşulları kabul edin.
    • Geçici bir hesap kullandığınızdan kurtarma seçenekleri veya iki faktörlü kimlik doğrulama eklemeyin.
    • Ücretsiz denemelere kaydolmayın.

Birkaç saniye sonra Google Cloud Console bu sekmede açılır.

Not: Google Cloud ürün ve hizmetlerinin listelendiği menüyü görmek için sol üstteki Gezinme menüsü'nü tıklayın. Gezinme menüsü simgesi

Cloud Shell'i etkinleştirme

Cloud Shell, çok sayıda geliştirme aracı içeren bir sanal makinedir. 5 GB boyutunda kalıcı bir ana dizin sunar ve Google Cloud üzerinde çalışır. Cloud Shell, Google Cloud kaynaklarınıza komut satırı erişimi sağlar.

  1. Google Cloud Console'un üst kısmından Cloud Shell'i etkinleştir Cloud Shell'i etkinleştir simgesi simgesini tıklayın.

Bağlandığınızda, kimliğiniz doğrulanmış olur. Proje ise PROJECT_ID'nize göre ayarlanmıştır. Çıkış, bu oturum için PROJECT_ID'yi tanımlayan bir satır içerir:

Your Cloud Platform project in this session is set to YOUR_PROJECT_ID

gcloud, Google Cloud'un komut satırı aracıdır. Cloud Shell'e önceden yüklenmiştir ve sekmeyle tamamlamayı destekler.

  1. (İsteğe bağlı) Etkin hesap adını şu komutla listeleyebilirsiniz:
gcloud auth list
  1. Yetkilendir'i tıklayın.

  2. Çıkışınız aşağıdaki gibi görünecektir:

Çıkış:

ACTIVE: * ACCOUNT: student-01-xxxxxxxxxxxx@qwiklabs.net To set the active account, run: $ gcloud config set account `ACCOUNT`
  1. (İsteğe bağlı) Proje kimliğini şu komutla listeleyebilirsiniz:
gcloud config list project

Çıkış:

[core] project = <project_ID>

Örnek çıkış:

[core] project = qwiklabs-gcp-44776a13dea667a6 Not: gcloud ile ilgili tüm belgeleri, Google Cloud'daki gcloud CLI'ya genel bakış rehberinde bulabilirsiniz.

1. görev: Projenizde Cloud Storage paketi oluşturma

  1. Cloud Console'da, gezinme menüsü (Gezinme menüsü simgesi) > Cloud Storage > Paketler'i seçin.

  2. Paket oluştur'u tıklayın.

  3. Paket oluşturun iletişim kutusunda Ad'ı tıklayarak pakete benzersiz bir ad verin. Diğer ayarları varsayılan değerlerinde bırakın.

Not: Paket adlandırma kuralları bölümünden paketleri adlandırma hakkında daha fazla bilgi edinin.
  1. "Nesnelere erişimi nasıl denetleyeceğinizi seçin" bölümünde, Bu pakette herkese açık erişim engeli uygula seçeneğinin işaretini kaldırın.

  2. Oluştur'u tıklayın.

Paketi oluşturdunuz. Pakete verdiğiniz adı unutmayın, sonraki adımlarda buna ihtiyacınız olacak.

Tamamlanan görevi test etme

Tamamladığınız görevi doğrulamak için İlerleme durumumu kontrol et'i tıklayın. Cloud Storage paketi oluşturma işlemi tamamlandıysa bir değerlendirme puanı gösterilir.

Cloud Storage paketi oluşturma

2. görev: Cloud Dataprep'i ilk kullanıma hazırlama

  1. Cloud Shell'i açıp şu komutu çalıştırın:
gcloud beta services identity create --service=dataprep.googleapis.com

Hizmet kimliğinin oluşturulduğuna dair bir mesaj gösterilir.

  1. Gezinme menüsü > Dataprep'i seçin.

  2. Google Dataprep Hizmet Şartları'nı kabul etmek için kutucuğu işaretleyip Kabul Et'i tıklayın.

  3. Hesap bilgilerinizin Trifacta ile paylaşılması için kutucuğu işaretleyerek yetki verin, ardından Kabul Et ve Devam Et'i tıklayın.

  4. Trifacta'nın proje verilerine erişmesine izin vermek için İzin ver'i tıklayın.

  5. Trifacta ile Cloud Dataprep'te oturum açmak için öğrenci kullanıcı adınızı tıklayın. Kullanıcı adınız, laboratuvarınızdaki sol panelde bulunan Kullanıcı adı alanında yer alır.

  6. Cloud Dataprep'in Google Cloud laboratuvar hesabınıza erişmesine izin vermek için İzin ver'i tıklayın.

  7. Trifacta Hizmet Şartları'nı kabul etmek için kutucuğu işaretleyip Kabul Et'i tıklayın.

  8. İlk kurulum ekranında Devam'ı tıklayarak varsayılan depolama konumunu oluşturun.

Dataprep açılır.

Tamamlanan görevi test etme

Tamamladığınız görevi doğrulamak için İlerleme durumumu kontrol et'i tıklayın. Varsayılan depolama konumu ile Cloud Dataprep'i ilk kullanıma başarıyla hazırladıysanız bir değerlendirme puanı görürsünüz.

Cloud Dataprep'i ilk kullanıma hazırlama

3. görev: Akış oluşturma

Cloud Dataprep, veri kümelerine erişmek ve bunları değiştirmek için bir akış çalışma alanı kullanır.

  1. Akışlar simgesini, ardından Oluştur düğmesini tıklayın ve Boş Akış'ı seçin.

Akışlar simgesi, Oluştur düğmesi, Boş Akış seçeneği

  1. Adsız Akış seçeneğini tıklayın, ardından akışın adını ve açıklamasını girin. Bu laboratuvarda Amerika Birleşik Devletleri 2016 Federal Seçimleri Komisyonu'nun (FEC) 2016 yılına ait verileri kullanıldığından akışı "FEC-2016" olarak adlandırın ve akış için "United States Federal Elections Commission 2016" açıklamasını girin.
  2. Tamam'ı tıklayın.

FEC-2016 akış sayfası açılır.

4. görev: Veri kümelerini içe aktarma

Bu bölümde FEC-2016 akışına veri içe aktaracak ve ekleyeceksiniz.

  1. Veri Kümesi Ekle'yi tıklayın, ardından Veri Kümelerini İçe Aktar bağlantısını seçin.

  2. Sol menü bölmesinde, Cloud Storage'dan veri kümelerini içe aktarmak için Cloud Storage'ı seçin ve ardından dosya yolunu düzenlemek amacıyla kalem simgesini tıklayın.

Cloud Storage sayfası

  1. Dosya veya klasör seçin metin kutusuna gs://spls/gsp105 yazıp Git'i tıklayın.

Git ve İptal düğmelerini görmek için tarayıcı penceresini genişletmeniz gerekebilir.

  1. us-fec/ seçeneğini tıklayın.

  2. Sağ bölmede gösterilecek bir veri kümesi oluşturmak için cn-2016.txt'nin yanındaki + simgesini tıklayın. Sağ bölmedeki veri kümesinin başlığını tıklayın ve veri kümesini "Candidate Master 2016" olarak yeniden adlandırın.

  3. Aynı şekilde itcont-2016-orig.txt veri kümesini ekleyin ve "Campaign Contributions 2016" olarak yeniden adlandırın.

  4. Her iki veri kümesi de sağ bölmede listelendikten sonra İçe Aktar ve Akışa Ekle'yi tıklayın.

Sağ bölmede listelenen iki veri kümesi

Her iki veri kümesinin akış olarak listelendiğini görürsünüz.

5. görev: Aday dosyasını hazırlama

  1. Varsayılan olarak Candidate Master 2016 veri kümesi seçilidir. Sağ bölmede Tarifi Düzenle'yi tıklayın.

Candidate Master 2016 veri kümesi sayfası

Candidate Master 2016 Dönüştürücü sayfası, tablo görünümünde açılır.

Tablo görünümünde Candidate Master 2016 Transformer sayfası

Dönüştürücü sayfasında dönüşüm tarifinizi oluşturabilir ve örneğe uygulanan sonuçları görebilirsiniz. Sonuçlar sizin için uygunsa işi veri kümenizde yürütün.

  1. Sütun başlıklarının her biri, veri türünü belirten bir ad ve değere sahiptir. Veri türlerini görüntülemek için sütun simgesini tıklayın:

column6

  1. Sütunun adını tıkladığınızda, sağ tarafta Ayrıntılar panelinin açıldığına da dikkat edin.

  2. Ayrıntılar panelini kapatmak için panelin sağ üst köşesindeki X'i tıklayın.

Sonraki adımlarda verileri tablo görünümünde keşfedecek ve dönüştürme adımlarını tarifinize uygulayacaksınız.

  1. column5 adlı sütun, 1990 ila 2064 dönemine ait verileri sunar. E-tablolarda olduğu gibi, yılları birbirinden ayırmak için column5 sütununu genişletin. En uzun bölmeyi (2016 yılını temsil eder) tıklayarak seçin.

column5

Böylece bu değerlerin seçileceği bir adım oluşturulur.

  1. Sağdaki Öneriler panelinin Satırları koru bölümünde, bu adımı tarifinize eklemek için Ekle'yi tıklayın.

 Öneriler paneli

Sağdaki Tarif panelinde artık aşağıdaki adım bulunur:

Keep rows where(DATE(2016, 1, 1) <= column5) && (column5 < DATE(2018, 1, 1))

  1. Eyaletlerin yer aldığı column6 sütununda, uyumsuz satırları seçmek için başlığın kırmızıyla gösterilen "mismatched" (uyumsuz) kısmının üzerine gelip tıklayın.

column6

En alta gidin (kırmızıyla vurgulanmıştır), eşleşmeyen değerleri bulun ve bu kayıtların çoğunda column7 sütununda "P" ve column6 sütununda "US" değerinin olduğuna dikkat edin. column6 sütununun "Eyalet" sütunu olarak işaretlenmesi (bayrak simgesiyle gösterilir), fakat eyalet dışı değerler (ör. "US") içermesi nedeniyle uyumsuzluk ortaya çıkar.

  1. Uyumsuzluğu gidermek için Öneriler panelinin üst kısmındaki X işaretini tıklayarak dönüşümü iptal edin. Ardından column6 sütunundaki bayrak simgesini tıklayın ve bunu "Dize" sütunu olarak değiştirin.

column6

Uyumsuzluk ortadan kalkar ve sütun işaretçisi yeşil rengini alır.

  1. Başkanlık adaylarını filtreleyin. Bunlar column7 sütununda "P" değerine sahip olan kayıtlardır. column7 histogramında, bölmelerden hangisinin "H", hangisinin "P" değeri için olduğunu görmek amacıyla ilgili bölmenin üzerine fareyle gelin. "P" bölmesini tıklayın.

column7

  1. Sağdaki Öneriler panelinde adımı tarife eklemek için Ekle'yi tıklayın.

Satırları koru kutusu

6. görev: Contributions dosyasını hazırlama ve Candidates dosyasıyla birleştirme

Birleştirme sayfasında, başka bir veri kümesiyle ortak olan bilgileri temel alarak mevcut veri kümenizi başka bir veri kümesi veya tarife ekleyebilirsiniz.

Contributions dosyasını Candidates dosyasıyla birleştirmeden önce Contributions dosyasını temizleyin.

  1. Tablo görünümü sayfasının üst kısmından FEC-2016'yı (veri kümesi seçici) tıklayın.

Tablo görünümü sayfasının üst kısmındaki FEC-2016

  1. Devre dışı olan Campaign Contributions 2016'yı seçmek için tıklayın.

  2. Sağ bölmeden Ekle > Tarif'i, ardından Tarifi Düzenle'yi tıklayın.

  3. Sayfanın sağ üst köşesinden tarif simgesini, ardından Yeni Adım Ekle'yi tıklayın.

Tarif simgesi ve Yeni Adım Ekle düğmesi

Veri kümesindeki fazladan sınırlayıcıları kaldırın.

  1. Wrangle dilindeki şu komutu Arama kutusuna ekleyin:
replacepatterns col: * with: '' on: `{start}"|"{end}` global: true

Dönüşüm Oluşturucu, Wrangle komutunu ayrıştırarak Bul ve Değiştir dönüşüm alanlarını doldurur.

Dönüşüm Oluşturucu

  1. Dönüşümü tarife eklemek için Ekle'yi tıklayın.

  2. Tarife yeni bir adım daha ekleyin. Yeni Adım'ı tıklayıp Arama kutusuna "Birleştir" yazın.

Dönüşüm ara kutusu

  1. Birleştirme sayfasını açmak için Veri kümelerini birleştir'i tıklayın.

  2. Campaign Contributions 2016 ile birleştirmek için "Candidate Master 2016"yı tıklayın. Ardından sağ alttan Kabul Et'i tıklayın.

Candidate Master 2016 satırı

  1. Sağ tarafta birleştirme anahtarları bölümünde fareyle üzerine gelip kalemi (Düzenle simgesi) tıklayın.

Birleştirme koşulları kutusu

Dataprep, ortak anahtarları çıkarır. Dataprep'in Birleştirme Anahtarları olarak önerdiği birçok ortak değer bulunur.

  1. Anahtar Ekle panelindeki Önerilen birleştirme anahtarları bölümünden column2 = column11'i tıklayın.

Anahtar Ekle paneli

  1. Kaydet ve Devam Et'i tıklayın.

2. ve 11. sütunlar incelemeniz için açılır.

  1. İleri'yi tıklayın, ardından her iki veri kümesindeki tüm sütunları birleştirilen veri kümesine eklemek için "Sütun" etiketinin solundaki onay kutusunu işaretleyin.

Sütun etiketi listesi

  1. İncele'yi tıklayın. Ardından tablo görünümüne dönmek için Tarif Ekle'yi tıklayın.

7. görev: Verilerin özeti

16. sütundaki bağışlarla toplama, ortalama alma ve hesaplama işlemleri gerçekleştirip adayları sırasıyla 2, 24, 8 numaralı sütunlardaki kimlik, ad ve parti üyeliği değerlerine göre gruplandırarak yararlı bir özet oluşturun.

  1. Sağdaki Tarif panelinin üst kısmında Yeni Adım'ı tıklayın ve Dönüşüm arama kutusuna aşağıdaki formülü girerek birleştirilmiş verileri önizleyin.
pivot value:sum(column16),average(column16),countif(column16 > 0) group: column2,column24,column8

Birleştirilip toplanmış verilerin bir örneği; ABD başkanlık adaylarının özet tablosunu ve adayların 2016 kampanyasına bağış metriklerini belirtecek şekilde gösterilir.

Campaign Contributions sayfası

  1. Önde gelen ABD başkanlık adaylarının ve adayların 2016 kampanyasına bağış metriklerinin özet tablosunu açmak için Ekle'yi tıklayın.

8. görev: Sütunları yeniden adlandırma

Sütunları yeniden adlandırarak verilerin kolayca yorumlanmasını sağlayabilirsiniz.

  1. Yeniden adlandırma ve yuvarlama adımlarının her birini, Yeni Adım'ı tıklayarak tarife ayrı ayrı ekleyin. Ardından şunu girin:
rename type: manual mapping: [column24,'Candidate_Name'], [column2,'Candidate_ID'],[column8,'Party_Affiliation'], [sum_column16,'Total_Contribution_Sum'], [average_column16,'Average_Contribution_Sum'], [countif,'Number_of_Contributions']
  1. Ardından Ekle'yi tıklayın.

  2. Ortalama Bağış miktarını yuvarlamak için son olarak aşağıdaki Yeni Adım'ı ekleyin:

set col: Average_Contribution_Sum value: round(Average_Contribution_Sum)
  1. Ardından Ekle'yi tıklayın.

Sonuçlarınız şuna benzer:

Candidate_Id, Candidate_Name, Part_Affiliation ve Total_Contribution_Sum sütunlarının yer aldığı sonuç tablosu

Tebrikler!

Veri kümesi eklemek için Dataprep'i kullandınız ve verileri anlamlı sonuçlara dönüştürmek amacıyla tarifler oluşturdunuz.

Sonraki adımlar / Daha fazla bilgi

Bu laboratuvar, Qwik Starts laboratuvar serisinin bir parçasıdır. Bu laboratuvarlar, Google Cloud'daki pek çok özelliği kısaca tanıtmak için tasarlanmıştır. Katılabileceğiniz bir sonraki laboratuvarı bulmak için laboratuvar kataloğunda "Qwik Starts" araması yapın.

Google Cloud eğitimi ve sertifikası

...Google Cloud teknolojilerinden en iyi şekilde yararlanmanıza yardımcı olur. Derslerimizde teknik becerilere odaklanırken en iyi uygulamalara da yer veriyoruz. Gerekli yetkinlik seviyesine hızlıca ulaşmanız ve öğrenim maceranızı sürdürebilmeniz için sizlere yardımcı olmayı amaçlıyoruz. Temel kavramlardan ileri seviyeye kadar farklı eğitim programlarımız mevcut. Ayrıca, yoğun gündeminize uyması için talep üzerine sağlanan, canlı ve sanal eğitim alternatiflerimiz de var. Sertifikasyonlar ise Google Cloud teknolojilerindeki becerilerinizi ve uzmanlığınızı doğrulamanıza ve kanıtlamanıza yardımcı oluyor.

Kılavuzun Son Güncellenme Tarihi: 6 Haziran 2024

Laboratuvarın Son Test Edilme Tarihi: 6 Haziran 2024

Telif Hakkı 2024 Google LLC Tüm hakları saklıdır. Google ve Google logosu, Google LLC şirketinin ticari markalarıdır. Diğer tüm şirket ve ürün adları ilişkili oldukları şirketlerin ticari markaları olabilir.

This content is not currently available

We will notify you via email when it becomes available

Great!

We will contact you via email if it becomes available