このコースでは、予測 AI と生成 AI の両方のプロジェクトを構築できる、Google Cloud の AI および機械学習(ML)サービスについて紹介します。AI の基盤、開発、ソリューションを含むデータから AI へのライフサイクル全体で利用可能なテクノロジー、プロダクト、ツールについて説明するとともに、魅力的な学習体験と実践的なハンズオン演習を通じて、データ サイエンティスト、AI 開発者、ML エンジニアの方々がスキルや知識を強化できるようサポートすることを目指しています。
よりスマートな生成 AI 出力の生成
この学習プログラムは、生成 AI を使用したアプリケーションを構築したいと考えているデベロッパーを対象としています。Google Cloud での AI プロジェクトの開発、画像生成のための拡散モデルの使用、ベクトル検索とベクトル エンベディングを使用した検索アプリケーションの構築の方法について学びます。その後、Gemini を使用したマルチモーダル プロンプトとマルチモーダル RAG について深く掘り下げ、テキストと視覚データを生成します。
01
Introduction to AI and Machine Learning on Google Cloud - 日本語版
02
Introduction to Image Generation - 日本語版
このコースでは拡散モデルについて説明します。拡散モデルは ML モデル ファミリーの一つで、最近、画像生成分野での有望性が示されました。拡散モデルは物理学、特に熱力学からインスピレーションを得ています。ここ数年、拡散モデルは研究と産業界の両方で広まりました。拡散モデルは、Google Cloud の最先端の画像生成モデルやツールの多くを支える技術です。このコースでは、拡散モデルの背景にある理論と、モデルを Vertex AI でトレーニングしてデプロイする方法について説明します。

04
Inspect Rich Documents with Gemini Multimodality and Multimodal RAG
Inspect Rich Documents with Gemini Multimodality and Multimodal RAG スキルバッジを獲得できる中級コースを修了すると、次のスキルを実証できます。 Gemini を使用したマルチモダリティにより、マルチモーダル プロンプトを使用してテキストと視覚データから情報を抽出し、動画の説明を生成して、 動画の範囲を超えた追加情報を取得する。Gemini を使用したマルチモーダル検索拡張生成(RAG)により、テキストと画像を含むドキュメントのメタデータを作成し、関連するすべてのテキスト チャンクの取得して、 引用を出力する。 スキルバッジは、Google Cloud のプロダクトとサービスの習熟度を示す Google Cloud 発行の限定デジタルバッジで、インタラクティブなハンズオン環境での知識の応用力を証明するものです。 このスキルバッジ コースと最終評価チャレンジラボを修了してスキルバッジを獲得し、ネットワークで共有しましょう。