Checkpoint
Generate text from text prompts
/ 10
Streaming
/ 10
Try your own prompts
/ 10
Safety filters
/ 10
Test chat prompts
/ 10
Generate text from local image and text
/ 10
Generate text from text and image(s)
/ 10
Combining multiple images and text prompts for few-shot prompting
/ 10
Generate text from a video file
/ 10
Direct analysis of publicly available web media
/ 10
Mulai Menggunakan Vertex AI Gemini API dan Python SDK
GSP1209
Ringkasan
Gemini adalah rangkaian model AI generatif yang dikembangkan oleh Google DeepMind dan dirancang untuk kasus penggunaan multimodal. Gemini API menyediakan akses ke model Gemini Pro Vision dan Gemini Pro. Di lab ini, Anda akan mempelajari cara menggunakan Vertex AI Gemini API dengan Vertex AI SDK for Python untuk berinteraksi dengan model Gemini 1.0 Pro (gemini-1.0-pro
) dan model Gemini 1.0 Pro Vision (gemini-1.0-pro-vision
).
Vertex AI Gemini API
Vertex AI Gemini API menyediakan antarmuka terpadu untuk berinteraksi dengan model-model Gemini. Saat ini ada dua model yang tersedia di Gemini API:
-
Model Gemini 1.0 Pro (
gemini-1.0-pro
): Dirancang untuk menangani tugas natural language, teks multiturn dan chat kode, serta pembuatan kode. -
Model Gemini 1.0 Pro Vision (
gemini-1.0-pro-vision
): Mendukung perintah multimodal. Anda dapat menyertakan teks, gambar, dan video dalam permintaan perintah dan mendapatkan respons teks atau kode.
Anda dapat berinteraksi dengan Gemini API menggunakan metode berikut:
- Menggunakan Vertex AI Studio untuk pengujian cepat dan pembuatan perintah
- Menggunakan perintah cURL
- Menggunakan Vertex AI SDK
Lab ini berfokus pada pemakaian Vertex AI SDK untuk Python guna memanggil Vertex AI Gemini API.
Untuk mengetahui informasi selengkapnya, lihat dokumentasi AI Generatif di Vertex AI.
Prasyarat
Sebelum memulai lab ini, Anda sebaiknya sudah memahami konsep berikut:
- Pemahaman dasar tentang pemrograman Python
- Pengetahuan umum tentang cara kerja API
- Menjalankan kode Python di notebook Jupyter di Vertex AI Workbench
Tujuan
Di lab ini, Anda akan belajar cara melakukan tugas berikut:
- Menginstal Vertex AI SDK for Python
- Menggunakan model Gemini 1.0 Pro (
gemini-1.0-pro
) untuk membuat teks - Menggunakan model multimodal Gemini 1.0 Pro Vision (
gemini-1.0-pro-vision
) untuk membuat teks dari kombinasi teks, gambar, dan video
Penyiapan dan persyaratan
Sebelum mengklik tombol Mulai Lab
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer, yang dimulai saat Anda mengklik Start Lab, akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab praktik ini dapat Anda gunakan untuk melakukan sendiri aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
- Akses ke browser internet standar (disarankan browser Chrome).
- Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Cara memulai lab dan login ke Google Cloud Console
-
Klik tombol Start Lab. Jika Anda perlu membayar lab, jendela pop-up akan terbuka untuk memilih metode pembayaran. Di sebelah kiri adalah panel Lab Details dengan info berikut:
- Tombol Open Google Cloud console
- Waktu tersisa
- Kredensial sementara yang harus Anda gunakan untuk lab ini
- Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
-
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account. -
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}} Anda juga dapat menemukan Username di panel Lab Details.
-
Klik Next.
-
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}} Anda juga dapat menemukan Password di panel Lab Details.
-
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda. Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan. -
Klik halaman berikutnya:
- Setujui persyaratan dan ketentuan.
- Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
- Jangan mendaftar uji coba gratis.
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Tugas 1. Membuka notebook di Vertex AI Workbench
-
Di Konsol Google Cloud, pada Navigation menu, klik Vertex AI > Workbench.
-
Cari instance
lalu klik tombol Open JupyterLab.
Antarmuka JupyterLab untuk instance Workbench Anda akan terbuka di tab browser baru.
Tugas 2. Menyiapkan notebook
-
Klik file
. -
Jalankan bagian Getting Started dan Import libraries pada notebook.
- Untuk Project ID, gunakan
, dan untuk Location, gunakan .
- Untuk Project ID, gunakan
Di bagian berikut, Anda akan menjalankan sel-sel notebook untuk mengetahui cara menggunakan Vertex AI Gemini API dengan Vertex AI SDK for Python.
Tugas 3. Menggunakan model Gemini 1.0 Pro
Model Gemini 1.0 Pro (gemini-1.0-pro
) dirancang untuk menangani tugas bahasa alami, teks multiturn dan chat kode, serta pembuatan kode. Dalam tugas ini, jalankan sel-sel notebook untuk melihat cara menggunakan model Gemini 1.0 Pro untuk membuat teks dari perintah teks.
Membuat teks dari perintah teks
Kirim perintah teks ke model. Model Gemini 1.0 Pro (gemini-1.0-pro
) menyediakan mekanisme respons streaming. Dengan pendekatan ini, Anda tidak perlu menunggu respons lengkap; Anda dapat mulai memproses fragmen segera setelah fragmen tersebut dapat diakses.
- Jalankan bagian Generate text from text prompts pada notebook.
Klik Check my progress untuk memverifikasi tujuan.
Tugas 4. Menggunakan model Gemini 1.0 Pro Vision
Gemini 1.0 Pro Vision (gemini-1.0-pro-vision
) adalah model multimodal yang mendukung perintah multimodal. Anda dapat menyertakan teks, gambar, dan video dalam permintaan perintah dan mendapatkan respons teks atau kode. Dalam tugas ini, jalankan sel-sel notebook untuk melihat cara menggunakan model Gemini 1.0 Pro Vision untuk membuat teks dari perintah teks dan gambar, lalu buat teks dari file video.
Membuat teks dari gambar dan teks lokal
- Jalankan bagian Generate text from local image and text pada notebook.
Klik Check my progress untuk memverifikasi tujuan.
Membuat teks dari prompt teks dan gambar
-
Jalankan bagian Generate text from text & image(s) pada notebook.
Buat teks dari teks dan gambar.
Menggabungkan beberapa prompt gambar dan teks untuk few-shot prompting
-
Jalankan bagian Combining multiple images and text prompts for few-shot prompting pada notebook.
Lakukan few-shot prompting.
Membuat teks dari file video
-
Jalankan bagian Generate text from a video file pada notebook.
Buat teks dari file video.
Selamat!
Di lab ini, Anda telah mempelajari pemakaian Vertex AI Gemini API bersama dengan Vertex AI SDK for Python untuk berinteraksi dengan dua model, yakni model Gemini 1.0 Pro (gemini-1.0-pro
) dan model Gemini 1.0 Pro Vision (gemini-1.0-pro-vision
). Melalui latihan ini, Anda memperoleh insight praktis tentang kemampuan Vertex AI Gemini API dan integrasinya yang lancar dengan Python SDK.
Langkah berikutnya/pelajari lebih lanjut
- Lihat dokumentasi Generative AI di Vertex AI.
- Pelajari AI Generatif lebih lanjut di channel YouTube Google Cloud Tech.
- Repositori resmi AI Generatif Google Cloud
- Contoh notebook Gemini
Sertifikasi dan pelatihan Google Cloud
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui pada 31 Mei 2024
Lab Terakhir Diuji pada 31 Mei 2024
Hak cipta 2024 Google LLC Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.