arrow_back

Dataprep: Qwik Start

Sign in Join
Get access to 700+ labs and courses

Dataprep: Qwik Start

Lab 1 hour universal_currency_alt 1 Credit show_chart Introductory
info This lab may incorporate AI tools to support your learning.
Get access to 700+ labs and courses

Bu laboratuvar, iş ortağımız Trifacta ile birlikte geliştirildi. Hesap profilinizde ürün güncellemelerini, duyuruları ve teklifleri almak için kaydolduysanız kişisel bilgileriniz, laboratuvar sponsoru Trifacta ile paylaşılabilir.

GSP105

Genel bakış

Trifacta Cloud Dataprep, verileri analiz için görsel olarak keşfetmek, temizlemek ve hazırlamak amacıyla kullanılabilecek akıllı bir veri hizmetidir. Cloud Dataprep sunucusuzdur ve her ölçekte çalışır. Dağıtılacak veya yönetilecek bir altyapı yoktur. Veriler, yalnızca tıklamalarla, hiçbir kod olmadan kolayca hazırlanır.

Bu laboratuvarda Dataprep kullanarak veri kümelerini değiştireceksiniz. Veri kümelerini içe aktaracak, uyumsuz verileri düzeltecek ve verileri dönüştürüp birleştireceksiniz. Bu işlemler konusunda bilginiz olmasa bile laboratuvarın sonunda bunların hepsini öğrenmiş olacaksınız.

Neler yapacaksınız?

Bu laboratuvarda, aşağıdaki görevleri tamamlamak için Dataprep'i nasıl kullanacağınızı öğreneceksiniz:

  • Verileri içe aktarma
  • Uyumsuz verileri düzeltme
  • Verileri dönüştürme
  • Verileri birleştirme

Kurulum ve şartlar

Laboratuvarı Başlat düğmesini tıklamadan önce

Buradaki talimatları okuyun. Laboratuvarlar süreli olduğundan duraklatılamaz. Start Lab'i (Laboratuvarı başlat) tıkladığınızda başlayan zamanlayıcı, Google Cloud kaynaklarının ne süreyle kullanımınıza açık durumda kalacağını gösterir.

Bu uygulamalı laboratuvarı kullanarak, laboratuvar etkinliklerini simülasyon veya demo ortamı yerine gerçek bir bulut ortamında gerçekleştirebilirsiniz. Bunu yapabilmeniz için size yeni, geçici kimlik bilgileri verilir. Bu kimlik bilgilerini laboratuvar süresince Google Cloud'da oturum açmak ve Google Cloud'a erişmek için kullanabilirsiniz.

Bu laboratuvarı tamamlamak için gerekenler:

  • Standart bir internet tarayıcısına erişim (Chrome Tarayıcı önerilir)
Not: Bu laboratuvarı çalıştırmak için tarayıcıyı gizli modda (önerilen) veya gizli tarama penceresinde açın. Aksi takdirde, kişisel hesabınızla öğrenci hesabınız arasında oluşabilecek çakışmalar nedeniyle kişisel hesabınızdan ek ücret alınabilir.
  • Laboratuvarı tamamlamak için yeterli süre (Laboratuvarlar başlatıldıktan sonra duraklatılamaz.)
Not: Bu laboratuvar için yalnızca öğrenci hesabını kullanın. Farklı bir Google Cloud hesabı kullanırsanız bu hesaptan ödeme alınabilir.

Laboratuvarınızı başlatma ve Google Cloud Console'da oturum açma

  1. Laboratuvarı Başlat düğmesini tıklayın. Laboratuvar için ödeme yapmanız gerekiyorsa ödeme yöntemini seçebileceğiniz bir iletişim kutusu açılır. Soldaki "Laboratuvar ayrıntıları" panelinde şunlar yer alır:

    • "Google Cloud konsolunu aç" düğmesi
    • Kalan süre
    • Bu laboratuvarda kullanmanız gereken geçici kimlik bilgileri
    • Bu laboratuvarda ilerlemek için gerekebilecek diğer bilgiler
  2. Google Cloud Console'u aç'ı tıklayın (veya Chrome Tarayıcı'yı kullanıyorsanız sağ tıklayıp Bağlantıyı gizli pencerede aç'ı seçin).

    Laboratuvar, kaynakları çalıştırır ve sonra "Oturum aç" sayfasını gösteren başka bir sekme açar.

    İpucu: Sekmeleri ayrı pencerelerde, yan yana açın.

    Not: Hesap seçin iletişim kutusunu görürseniz Başka bir hesap kullan'ı tıklayın.
  3. Gerekirse aşağıdaki kullanıcı adını kopyalayıp Oturum açın iletişim kutusuna yapıştırın.

    {{{user_0.username | "Username"}}}

    Kullanıcı adını "Laboratuvar ayrıntıları" panelinde de bulabilirsiniz.

  4. İleri'yi tıklayın.

  5. Aşağıdaki şifreyi kopyalayıp Hoş geldiniz iletişim kutusuna yapıştırın.

    {{{user_0.password | "Password"}}}

    Şifreyi "Laboratuvar ayrıntıları" panelinde de bulabilirsiniz.

  6. İleri'yi tıklayın.

    Önemli: Laboratuvarın sizinle paylaştığı giriş bilgilerini kullanmanız gerekir. Google Cloud hesabınızın kimlik bilgilerini kullanmayın. Not: Bu laboratuvarda kendi Google Cloud hesabınızı kullanabilmek için ek ücret ödemeniz gerekebilir.
  7. Sonraki sayfalarda ilgili düğmeleri tıklayarak ilerleyin:

    • Hükümler ve koşulları kabul edin.
    • Geçici bir hesap kullandığınızdan kurtarma seçenekleri veya iki faktörlü kimlik doğrulama eklemeyin.
    • Ücretsiz denemelere kaydolmayın.

Birkaç saniye sonra Google Cloud konsolu bu sekmede açılır.

Not: Google Cloud ürün ve hizmetlerine erişmek için gezinme menüsünü tıklayın veya Arama alanına hizmetin veya ürünün adını yazın.

Cloud Shell'i etkinleştirme

Cloud Shell, çok sayıda geliştirme aracı içeren bir sanal makinedir. 5 GB boyutunda kalıcı bir ana dizin sunar ve Google Cloud üzerinde çalışır. Cloud Shell, Google Cloud kaynaklarınıza komut satırı erişimi sağlar.

  1. Google Cloud konsolunun üst kısmından Activate Cloud Shell (Cloud Shell'i etkinleştir) simgesini tıklayın.

  2. Aşağıdaki pencereleri tıklayın:

    • Cloud Shell bilgi penceresinde devam edin.
    • Google Cloud API çağrıları yapmak için Cloud Shell'e kimlik bilgilerinizi kullanma yetkisi verin.

Bağlandığınızda kimliğiniz zaten doğrulanmıştır. Proje ise Project_ID'nize () göre ayarlanmıştır. Çıkış, bu oturum için Project_ID'yi tanımlayan bir satır içerir:

Your Cloud Platform project in this session is set to {{{project_0.project_id | "PROJECT_ID"}}}

gcloud, Google Cloud'un komut satırı aracıdır. Cloud Shell'e önceden yüklenmiştir ve sekmeyle tamamlamayı destekler.

  1. (İsteğe bağlı) Etkin hesap adını şu komutla listeleyebilirsiniz:
gcloud auth list
  1. Authorize'ı (Yetkilendir) tıklayın.

Çıkış:

ACTIVE: * ACCOUNT: {{{user_0.username | "ACCOUNT"}}} To set the active account, run: $ gcloud config set account `ACCOUNT`
  1. (İsteğe bağlı) Proje kimliğini şu komutla listeleyebilirsiniz:
gcloud config list project

Çıkış:

[core] project = {{{project_0.project_id | "PROJECT_ID"}}} Not: gcloud ile ilgili tüm belgeleri, Google Cloud'daki gcloud CLI'a genel bakış rehberinde bulabilirsiniz.

1. görev: Projenizde Cloud Storage paketi oluşturma

  1. Cloud Console'da, gezinme menüsü () > Cloud Storage > Paketler'i seçin.

  2. Paket oluştur'u tıklayın.

  3. Paket oluşturun iletişim kutusunda Ad'ı tıklayarak pakete benzersiz bir ad verin. Diğer ayarları varsayılan değerlerinde bırakın.

Not: Paket adlandırma kuralları bölümünden paketleri adlandırma hakkında daha fazla bilgi edinin.
  1. "Nesnelere erişimi nasıl denetleyeceğinizi seçin" bölümünde, Bu pakette herkese açık erişim engeli uygula seçeneğinin işaretini kaldırın.

  2. Oluştur'u tıklayın.

Paketi oluşturdunuz. Pakete verdiğiniz adı unutmayın, sonraki adımlarda buna ihtiyacınız olacak.

Tamamlanan görevi test etme

Tamamladığınız görevi doğrulamak için İlerleme durumumu kontrol et'i tıklayın. Cloud Storage paketi oluşturma işlemi tamamlandıysa bir değerlendirme puanı gösterilir.

Cloud Storage paketi oluşturma

2. görev: Cloud Dataprep'i ilk kullanıma hazırlama

  1. Cloud Shell'i açıp şu komutu çalıştırın:
gcloud beta services identity create --service=dataprep.googleapis.com

Hizmet kimliğinin oluşturulduğuna dair bir mesaj gösterilir.

  1. Gezinme menüsü > Dataprep'i seçin.

  2. Google Dataprep Hizmet Şartları'nı kabul etmek için kutucuğu işaretleyip Kabul Et'i tıklayın.

  3. Hesap bilgilerinizin Trifacta ile paylaşılması için kutucuğu işaretleyerek yetki verin, ardından Kabul Et ve Devam Et'i tıklayın.

  4. Trifacta'nın proje verilerine erişmesine izin vermek için İzin ver'i tıklayın.

  5. Trifacta ile Cloud Dataprep'te oturum açmak için öğrenci kullanıcı adınızı tıklayın. Kullanıcı adınız, laboratuvarınızdaki sol panelde bulunan Kullanıcı adı alanında yer alır.

  6. Cloud Dataprep'in Google Cloud laboratuvar hesabınıza erişmesine izin vermek için İzin ver'i tıklayın.

  7. Trifacta Hizmet Şartları'nı kabul etmek için kutucuğu işaretleyip Kabul Et'i tıklayın.

  8. İlk kurulum ekranında Devam'ı tıklayarak varsayılan depolama konumunu oluşturun.

Dataprep açılır.

Tamamlanan görevi test etme

Tamamladığınız görevi doğrulamak için İlerleme durumumu kontrol et'i tıklayın. Varsayılan depolama konumu ile Cloud Dataprep'i ilk kullanıma başarıyla hazırladıysanız bir değerlendirme puanı görürsünüz.

Cloud Dataprep'i ilk kullanıma hazırlama

3. görev: Akış oluşturma

Cloud Dataprep, veri kümelerine erişmek ve bunları değiştirmek için bir akış çalışma alanı kullanır.

  1. Akışlar simgesini, ardından Oluştur düğmesini tıklayın ve Boş Akış'ı seçin.

  1. Adsız Akış seçeneğini tıklayın, ardından akışın adını ve açıklamasını girin. Bu laboratuvarda Amerika Birleşik Devletleri 2016 Federal Seçimleri Komisyonu'nun (FEC) 2016 yılına ait verileri kullanıldığından akışı "FEC-2016" olarak adlandırın ve akış için "United States Federal Elections Commission 2016" açıklamasını girin.
  2. Tamam'ı tıklayın.

FEC-2016 akış sayfası açılır.

4. görev: Veri kümelerini içe aktarma

Bu bölümde FEC-2016 akışına veri içe aktaracak ve ekleyeceksiniz.

  1. Veri Kümesi Ekle'yi tıklayın, ardından Veri Kümelerini İçe Aktar bağlantısını seçin.

  2. Sol menü bölmesinde, Cloud Storage'dan veri kümelerini içe aktarmak için Cloud Storage'ı seçin ve ardından dosya yolunu düzenlemek amacıyla kalem simgesini tıklayın.

  1. Dosya veya klasör seçin metin kutusuna gs://spls/gsp105 yazıp Git'i tıklayın.

Git ve İptal düğmelerini görmek için tarayıcı penceresini genişletmeniz gerekebilir.

  1. us-fec/ seçeneğini tıklayın.

  2. Sağ bölmede gösterilecek bir veri kümesi oluşturmak için cn-2016.txt'nin yanındaki + simgesini tıklayın. Sağ bölmedeki veri kümesinin başlığını tıklayın ve veri kümesini "Candidate Master 2016" olarak yeniden adlandırın.

  3. Aynı şekilde itcont-2016-orig.txt veri kümesini ekleyin ve "Campaign Contributions 2016" olarak yeniden adlandırın.

  4. Her iki veri kümesi de sağ bölmede listelendikten sonra İçe Aktar ve Akışa Ekle'yi tıklayın.

Her iki veri kümesinin akış olarak listelendiğini görürsünüz.

5. görev: Aday dosyasını hazırlama

  1. Varsayılan olarak Candidate Master 2016 veri kümesi seçilidir. Sağ bölmede Tarifi Düzenle'yi tıklayın.

Candidate Master 2016 Dönüştürücü sayfası, tablo görünümünde açılır.

Dönüştürücü sayfasında dönüşüm tarifinizi oluşturabilir ve örneğe uygulanan sonuçları görebilirsiniz. Sonuçlar sizin için uygunsa işi veri kümenizde yürütün.

  1. Sütun başlıklarının her biri, veri türünü belirten bir ad ve değere sahiptir. Veri türlerini görüntülemek için sütun simgesini tıklayın:

  1. Sütunun adını tıkladığınızda, sağ tarafta Ayrıntılar panelinin açıldığına da dikkat edin.

  2. Ayrıntılar panelini kapatmak için panelin sağ üst köşesindeki X'i tıklayın.

Sonraki adımlarda verileri tablo görünümünde keşfedecek ve dönüştürme adımlarını tarifinize uygulayacaksınız.

  1. column5 adlı sütun, 1990 ila 2064 dönemine ait verileri sunar. E-tablolarda olduğu gibi, yılları birbirinden ayırmak için column5 sütununu genişletin. En uzun bölmeyi (2016 yılını temsil eder) tıklayarak seçin.

Böylece bu değerlerin seçileceği bir adım oluşturulur.

  1. Sağdaki Öneriler panelinin Satırları koru bölümünde, bu adımı tarifinize eklemek için Ekle'yi tıklayın.

Sağdaki Tarif panelinde artık aşağıdaki adım bulunur:

Keep rows where(DATE(2016, 1, 1) <= column5) && (column5 < DATE(2018, 1, 1))

  1. Eyaletlerin yer aldığı column6 sütununda, uyumsuz satırları seçmek için başlığın kırmızıyla gösterilen "mismatched" (uyumsuz) kısmının üzerine gelip tıklayın.

En alta gidin (kırmızıyla vurgulanmıştır), eşleşmeyen değerleri bulun ve bu kayıtların çoğunda column7 sütununda "P" ve column6 sütununda "US" değerinin olduğuna dikkat edin. column6 sütununun "Eyalet" sütunu olarak işaretlenmesi (bayrak simgesiyle gösterilir), fakat eyalet dışı değerler (ör. "US") içermesi nedeniyle uyumsuzluk ortaya çıkar.

  1. Uyumsuzluğu gidermek için Öneriler panelinin üst kısmındaki X işaretini tıklayarak dönüşümü iptal edin. Ardından column6 sütunundaki bayrak simgesini tıklayın ve bunu "Dize" sütunu olarak değiştirin.

Uyumsuzluk ortadan kalkar ve sütun işaretçisi yeşil rengini alır.

  1. Başkanlık adaylarını filtreleyin. Bunlar column7 sütununda "P" değerine sahip olan kayıtlardır. column7 histogramında, bölmelerden hangisinin "H", hangisinin "P" değeri için olduğunu görmek amacıyla ilgili bölmenin üzerine fareyle gelin. "P" bölmesini tıklayın.

  1. Sağdaki Öneriler panelinde adımı tarife eklemek için Ekle'yi tıklayın.

6. görev: Contributions dosyasını hazırlama ve Candidates dosyasıyla birleştirme

Birleştirme sayfasında, başka bir veri kümesiyle ortak olan bilgileri temel alarak mevcut veri kümenizi başka bir veri kümesi veya tarife ekleyebilirsiniz.

Contributions dosyasını Candidates dosyasıyla birleştirmeden önce Contributions dosyasını temizleyin.

  1. Tablo görünümü sayfasının üst kısmından FEC-2016'yı (veri kümesi seçici) tıklayın.

  1. Devre dışı olan Campaign Contributions 2016'yı seçmek için tıklayın.

  2. Sağ bölmeden Ekle > Tarif'i, ardından Tarifi Düzenle'yi tıklayın.

  3. Sayfanın sağ üst köşesinden tarif simgesini, ardından Yeni Adım Ekle'yi tıklayın.

Veri kümesindeki fazladan sınırlayıcıları kaldırın.

  1. Wrangle dilindeki şu komutu Arama kutusuna ekleyin:
replacepatterns col: * with: '' on: `{start}"|"{end}` global: true

Dönüşüm Oluşturucu, Wrangle komutunu ayrıştırarak Bul ve Değiştir dönüşüm alanlarını doldurur.

  1. Dönüşümü tarife eklemek için Ekle'yi tıklayın.

  2. Tarife yeni bir adım daha ekleyin. Yeni Adım'ı tıklayıp Arama kutusuna "Birleştir" yazın.

  1. Birleştirme sayfasını açmak için Veri kümelerini birleştir'i tıklayın.

  2. Campaign Contributions 2016 ile birleştirmek için "Candidate Master 2016"yı tıklayın. Ardından sağ alttan Kabul Et'i tıklayın.

  1. Sağ tarafta birleştirme anahtarları bölümünde fareyle üzerine gelip kalemi (Düzenle simgesi) tıklayın.

Dataprep, ortak anahtarları çıkarır. Dataprep'in Birleştirme Anahtarları olarak önerdiği birçok ortak değer bulunur.

  1. Anahtar Ekle panelindeki Önerilen birleştirme anahtarları bölümünden column2 = column11'i tıklayın.

  1. Kaydet ve Devam Et'i tıklayın.

2. ve 11. sütunlar incelemeniz için açılır.

  1. İleri'yi tıklayın, ardından her iki veri kümesindeki tüm sütunları birleştirilen veri kümesine eklemek için "Sütun" etiketinin solundaki onay kutusunu işaretleyin.

  1. İncele'yi tıklayın. Ardından tablo görünümüne dönmek için Tarif Ekle'yi tıklayın.

7. görev: Verilerin özeti

16. sütundaki bağışlarla toplama, ortalama alma ve hesaplama işlemleri gerçekleştirip adayları sırasıyla 2, 24, 8 numaralı sütunlardaki kimlik, ad ve parti üyeliği değerlerine göre gruplandırarak yararlı bir özet oluşturun.

  1. Sağdaki Tarif panelinin üst kısmında Yeni Adım'ı tıklayın ve Dönüşüm arama kutusuna aşağıdaki formülü girerek birleştirilmiş verileri önizleyin.
pivot value:sum(column16),average(column16),countif(column16 > 0) group: column2,column24,column8

Birleştirilip toplanmış verilerin bir örneği; ABD başkanlık adaylarının özet tablosunu ve adayların 2016 kampanyasına bağış metriklerini belirtecek şekilde gösterilir.

  1. Önde gelen ABD başkanlık adaylarının ve adayların 2016 kampanyasına bağış metriklerinin özet tablosunu açmak için Ekle'yi tıklayın.

8. görev: Sütunları yeniden adlandırma

Sütunları yeniden adlandırarak verilerin kolayca yorumlanmasını sağlayabilirsiniz.

  1. Yeniden adlandırma ve yuvarlama adımlarının her birini, Yeni Adım'ı tıklayarak tarife ayrı ayrı ekleyin. Ardından şunu girin:
rename type: manual mapping: [column24,'Candidate_Name'], [column2,'Candidate_ID'],[column8,'Party_Affiliation'], [sum_column16,'Total_Contribution_Sum'], [average_column16,'Average_Contribution_Sum'], [countif,'Number_of_Contributions']
  1. Ardından Ekle'yi tıklayın.

  2. Ortalama Bağış miktarını yuvarlamak için son olarak aşağıdaki Yeni Adım'ı ekleyin:

set col: Average_Contribution_Sum value: round(Average_Contribution_Sum)
  1. Ardından Ekle'yi tıklayın.

Sonuçlarınız şuna benzer:

Tebrikler!

Veri kümesi eklemek için Dataprep'i kullandınız ve verileri anlamlı sonuçlara dönüştürmek amacıyla tarifler oluşturdunuz.

Sonraki adımlar / Daha fazla bilgi

Bu laboratuvar, Qwik Starts laboratuvar serisinin bir parçasıdır. Bu laboratuvarlar, Google Cloud'daki pek çok özelliği kısaca tanıtmak için tasarlanmıştır. Katılabileceğiniz bir sonraki laboratuvarı bulmak için laboratuvar kataloğunda "Qwik Starts" araması yapın.

Google Cloud eğitimi ve sertifikası

...Google Cloud teknolojilerinden en iyi şekilde yararlanmanıza yardımcı olur. Derslerimizde teknik becerilere odaklanırken en iyi uygulamalara da yer veriyoruz. Gerekli yetkinlik seviyesine hızlıca ulaşmanız ve öğrenim maceranızı sürdürebilmeniz için sizlere yardımcı olmayı amaçlıyoruz. Temel kavramlardan ileri seviyeye kadar farklı eğitim programlarımız mevcut. Ayrıca, yoğun gündeminize uyması için talep üzerine sağlanan, canlı ve sanal eğitim alternatiflerimiz de var. Sertifikasyonlar ise Google Cloud teknolojilerindeki becerilerinizi ve uzmanlığınızı doğrulamanıza ve kanıtlamanıza yardımcı oluyor.

Kılavuzun Son Güncellenme Tarihi: 6 Haziran 2024

Laboratuvarın Son Test Edilme Tarihi: 6 Haziran 2024

Telif Hakkı 2025 Google LLC. Tüm hakları saklıdır. Google ve Google logosu, Google LLC şirketinin ticari markalarıdır. Diğer tüm şirket ve ürün adları ilişkili oldukları şirketlerin ticari markaları olabilir.

Before you begin

  1. Labs create a Google Cloud project and resources for a fixed time
  2. Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
  3. On the top left of your screen, click Start lab to begin

This content is not currently available

We will notify you via email when it becomes available

Great!

We will contact you via email if it becomes available

One lab at a time

Confirm to end all existing labs and start this one

Use private browsing to run the lab

Use an Incognito or private browser window to run this lab. This prevents any conflicts between your personal account and the Student account, which may cause extra charges incurred to your personal account.