2024年9月の Google Cloud 生成 AI アップデート/ブログ

Google Cloud

2024.9.30

Topics

2024年9月の Google Cloud 生成 AI アップデート/ブログをご紹介します。
本記事のアップデート情報/ブログはGoogle Cloud リリースノートGoogle Cloud Blogを参照しております。

Gemini

  • Gemini 1.5 Flash が制御された生成をサポートするように変更されました。これにより、一貫した形式の応答を受け取ることができるようになりました。
    Control generated output
  • 新しい安定バージョンである Gemini 1.5 Pro(gemini-1.5-pro-002) および Gemini 1.5 Flash(gemini-1.5-flash-002)が一般提供されました。これらのモデルでは、以前の001バージョンに比べて、ハルシネーションの減少、SQL生成、音声理解などの性能が向上しました。
    Model versions and lifecycle
  • Gemini 1.5 Pro および Gemini 1.5 Flash では、関数呼び出しによるマルチモーダル入力がサポートされるようになりました。
    Introduction to function calling

Vertex AI

  • Ray クラスターの自動スケーリング機能がサポートされるようになりました。
    Ray on Vertex AI overview
    Autoscaling
  • Vertex AI Workbench インスタンスのデータをバックアップおよび復元する機能がプレビューで利用できるようになりました。
    Back up and restore data on an instance
  • ラベルメタデータを API 呼び出しに追加することができるようになりました。これにより、開発環境や本番環境の API 呼び出しを管理できるようになりました。
    API呼び出しにラベルを追加する
  • 組織ポリシーが Model Garden のサポートを開始しました。これにより、管理者は特定のモデルや機能へのアクセスを制限できます。
    Model Garden モデルへのアクセスの制御
  • カスタムトレーニングおよび予測ジョブで必要なときに VM リソースを予約できるようになりました。予約により、Compute Engine リソースの容量を確実に取得できます。この機能は、A2 および A3 マシンシリーズの予約でプレビューとして利用できます。
    トレーニングで予約を使用する
    予測による予約の使用
  • トレーニングジョブと予測ジョブの実行コストを削減するために、Spot VM を使用できるようになりました。
    トレーニングで Spot VMを使用する
    予測機能を備えた Spot VM を使用する
  • Llama 3.2 90B モデルが、 Vertex AI でプレビューされました。Llama 3.2 90B はマルチモーダルなモデルで、画像推論などの機能を活用できる最新モデルです。
    Llama models
  • Vertex AI プロンプトオプティマイザーがリリースされました。Vertex AI プロンプトオプティマイザーは、最適な指示と例を使用してプロンプトを調整し、選択したモデルから最高のパフォーマンスを引き出します。
    Optimize prompts
  • モデルからの生成を特定のスキーマに準拠した形で出力させることができる、Controlled generation が一般公開されました。
    Controlled generation

Vertex AI Agent Builder

  • Vertex AI Search で、自然言語クエリフィルターがプレビューされました。
    Filter with natural-language understanding
  • RAG のドキュメントのランク付けと再ランク付けのためのモデルを更新できるようになりました。また、ランキング API モデルがアップグレードされました。この基礎モデルにより、上位ランクのドキュメントの関連性が大幅に向上し、より最適なスコアが提供されます。
    Rank and rerank documents with RAG
  • Vertex AI Agent Builder でグラウンドされた結果のリダイレクト URI が一般公開されました。Google 検索で Grounding を使用すると、結果に URI へ誘導するリダイレクト URI が含まれます。このリダイレクト URI は、Grounded 結果が生成されてから最大 30 日間アクセス可能です。
    RAGで根拠のある回答を生成する
  • Firestore および Cloud SQL からのデータのインポートが一般提供されました。
    Firestore からインポート
    Cloud SQL からのインポート
  • gemini-1.5-flash-002/answer_gen/v1モデルを回答生成に使用することができるようになりました。このモデルはgemini-1.5-flash-002モデルに基づいており、質問と回答のタスクに対応するためにさらに調整されています。
  • 回答生成のプレビュー モデルがgemini-1.5-pro-001からgemini-1.5-pro-002へ更新されました。
    Answer generation model versions and lifecycle

BigQuery

  • BigQuery 上で Vertex AI に基づくリモートモデルの ML.GENERATE_EMBEDDING関数を使用して、テキスト、画像、ビデオを同じセマンティック空間に埋め込むことができるようになりました。
    The ML.GENERATE_EMBEDDING function

Dialogflow

  • 生成 AI のデフォルトモデルであるtext-bison@002が2024年10月9日に廃止されます。text-bison@002を使用している Dialogflow は、gemini-1.5-flash-001にアップグレードされます。この変更は、自動的にアップグレードされ、Vertex AI Agent と Dialogflow CX に適用されます。
    Generative AI on Vertex AI – モデルバージョン

Looker Studio

注目の Google Cloud 公式ブログ

当社の9月の生成 AI 関連記事

関連記事
【生成 AI】Llama 3.2 が Google Cloud で利用できるようになりました #Vertex AI

↓先月の生成 AI アップデートはこちらから

関連記事
2024年8月の Google Cloud 生成 AI アップデート/ブログ

テックブログ新着情報のほか、AWSやGoogle Cloudに関するお役立ち情報を配信中!

Shun

Google Cloud Partner Top Engineer 2025、2024 AWS All Cert、ビール検定1冠

Recommends

こちらもおすすめ

Special Topics

注目記事はこちら