このコースでは拡散モデルについて説明します。拡散モデルは ML モデル ファミリーの一つで、最近、画像生成分野での有望性が示されました。拡散モデルは物理学、特に熱力学からインスピレーションを得ています。ここ数年、拡散モデルは研究と産業界の両方で広まりました。拡散モデルは、Google Cloud の最先端の画像生成モデルやツールの多くを支える技術です。このコースでは、拡散モデルの背景にある理論と、モデルを Vertex AI でトレーニングしてデプロイする方法について説明します。
Advanced: Generative AI for Developers Learning Path
このコースでは、機械翻訳、テキスト要約、質問応答などのシーケンス ツー シーケンス タスクに対応する、強力かつ広く使用されている ML アーキテクチャであるエンコーダ / デコーダ アーキテクチャの概要を説明します。エンコーダ / デコーダ アーキテクチャの主要なコンポーネントと、これらのモデルをトレーニングして提供する方法について学習します。対応するラボのチュートリアルでは、詩を生成するためのエンコーダ / デコーダ アーキテクチャの簡単な実装を、TensorFlow で最初からコーディングします。
このコースでは、Transformer アーキテクチャと Bidirectional Encoder Representations from Transformers(BERT)モデルの概要について説明します。セルフアテンション機構をはじめとする Transformer アーキテクチャの主要コンポーネントと、それが BERT モデルの構築にどのように使用されているのかについて学習します。さらに、テキスト分類、質問応答、自然言語推論など、BERT を適用可能なその他のタスクについても学習します。このコースの推定所要時間は約 45 分です。
このコースでは、生成 AI モデルのプロトタイピングやカスタマイズを行うためのツールである Vertex AI Studio をご紹介します。没入型レッスン、訴求力のあるデモやハンズオンラボを通して、生成 AI ワークフローを詳しく探るとともに、Gemini マルチモーダル アプリケーション、プロント設計、モデルのチューニングのために Vertex AI Studio を活用する方法を学びます。Vertex AI Studio を使用して、プロジェクトでこれらのモデルを最大限に活用できるようにすることを目的としています。

Inspect Rich Documents with Gemini Multimodality and Multimodal RAG スキルバッジを獲得できる中級コースを修了すると、次のスキルを実証できます。 Gemini を使用したマルチモダリティにより、マルチモーダル プロンプトを使用してテキストと視覚データから情報を抽出し、動画の説明を生成して、 動画の範囲を超えた追加情報を取得する。Gemini を使用したマルチモーダル検索拡張生成(RAG)により、テキストと画像を含むドキュメントのメタデータを作成し、関連するすべてのテキスト チャンクの取得して、 引用を出力する。 スキルバッジは、Google Cloud のプロダクトとサービスの習熟度を示す Google Cloud 発行の限定デジタルバッジで、インタラクティブなハンズオン環境での知識の応用力を証明するものです。 このスキルバッジ コースと最終評価チャレンジラボを修了してスキルバッジを獲得し、ネットワークで共有しましょう。