Google Cloud の Vertex AI のモデルや料金について解説

Google Cloud

2025.9.10

Topics

はじめに

こんにちは、皆さんお久しぶりです。
amaebiです!

今回は、Google Cloud の Vertex AI について、本ブログでご紹介します。

Vertex AI とは

本記事をご覧になってる方の中には、初めて Vertex AI を知る方もいらっしゃると思います。
そんな方のために、Vertex AI の概要について、少し触れていきたいと思います。

Vertex AI は、ML モデルと AI アプリケーションのトレーニングとデプロイを行い、AI を活用したアプリケーションで使用する大規模言語モデル(LLM)をカスタマイズできる機械学習(ML)プラットフォームです。
引用:Vertex AI の概要 – Google Cloud

Vertex AI の特徴は、AI モデルのチューニング、デプロイ、トレーニングといった開発から運用までのすべてのプロセスを一つのプラットフォームで完結できることにあります。特に、Vertex AI 内で作成したプロンプトをコードベース (Python、Node.js、Java など) で取得できるため、AI アプリケーションの開発・デプロイに簡単に活用できます。

また、Google が開発した AI モデル(Gemini など)に加えて、Claude や Llama などのサードパーティ製モデルも選択可能となっており、用途に合わせた最適な AI ソリューションを実現することができます。

さらに、弊社の Tech Blog にて、Vertex AI の使い方をご紹介したブログもございます。
興味がございましたら、こちらのブログもご覧ください。

関連記事
【生成 AI】Claude 3.5 SonnetをGoogle Cloudで使ってみた #Vertex AI

用途別モデル選択

用途別にどういったモデルを活用するのが最適なのかについても触れていきます。

Gemini

Google が開発したマルチモーダル AI モデルであり、テキスト、音声、画像、動画などの多種多様なデータ形式を扱うことができます。特に、長いコンテキストの取り扱いは非常に優れており、なんと100万トークンのコンテキスト ウィンドウを標準対応としております。

その他、Google が開発したモデルであるため、Vertex AI との親和性も非常に高く、他のGoogle Cloud サービスとの連携も効率的に行えます。

  • ユースケース
    • 大量のコンテキストや様々な入力を扱うケース
  • モデル例
    • Gemini 2.5 Pro
    • Gemini 2.5 Flash
    • Gemini 2.5 Flash-Lite

参考:Google models – Google Cloud

Llama

Meta が開発したオープンソースモデルであり、カスタマイズ性に優れているのが特徴です。
様々なコミュニティが改良、改変を加えており、目的に応じた様々な派生モデルが存在しております。

  • ユースケース
    • 業務プロセスや要件などに合わせて、柔軟にカスタマイズが必要なケース
  • モデル例
    • Llama 4 Scout
    • Llama 4 Maverick

参考:The Llama 4 herd: The beginning of a new era of natively multimodal AI innovation – AI at Meta

Claude

Anthropic が開発した AI モデルであり、「安全性」に特化していることが特徴です。
倫理的に危険かどうかを学習するよう設計されており、有害なコンテンツを生成されないようになっております。

  • ユースケース
    • 高度なコーディングや分析、読解などを行うケース
  • モデル例
    • Anthropic Claude Opus 4.1
    • Claude Opus 4
    • Claude Sonnet 4

参考:Anthropic の Claude モデル – Google Cloud

Vertex AI では、様々な AI モデルを利用できます。
もっと詳細な情報を知りたい方は、以下の公式ドキュメントをご覧ください。

料金体系の理解と Amazon Bedrock との比較

次に料金体系を見ていきましょう。
Vertex AI は、基本的に「従量課金制」を採用しており、利用した分だけユーザーに対し費用が発生します。
さらに、各サービスやモデルごとに料金が異なるため、利用状況の規模感やユースケース、予算に合わせた最適な利用方法を検討することが重要です。

では、Vertex AI と Amazon Bedrock の各モデル別の料金を比較していきます。
Claude Sonnet 4 のような同一モデルでは料金はほとんど変わりませんが、各 AI プラットフォームによって対応する AI モデルが若干異なってきます。
(比較する AI モデルによって、性能が異なっている場合がございます。そのため、厳密な比較を望まれる際は、Vertex AI と Amazon Bedrock の公式ドキュメントをご覧ください。)

Vertex AI モデル料金

モデル名 入力 1,000 トークンあたり 出力 1,000 トークンあたり パッチ入力 1,000 トークンあたり パッチ出力 1,000 トークンあたり キャッシュ入力 1,000 トークンあたり キャッシュ出力 1,000 トークンあたり
Gemini 2.5 Flash Lite 通常入力 0.0001 USD
オーディオ入力 0.0005 USD
0.0004
Claude Sonnet 4 0.003 USD 0.015 USD 0.0015 USD 0.0075 USD 0.00375 USD 0.0015 USD
Llama 4 Maverick 0.00035 USD 0.00115 USD

Amazon Bedrock モデル料金

モデル名 入力 1,000 トークンあたり 出力 1,000 トークンあたり パッチ入力 1,000 トークンあたり パッチ出力 1,000 トークンあたり キャッシュ入力 1,000 トークンあたり キャッシュ出力 1,000 トークンあたり
Amazon Nova Lite 0.00006 USD 0.00024 USD 0.000015 USD 0.00003 USD
Claude Sonnet 4 0.003 USD 0.015 USD 該当なし 該当なし 0.00375 USD 0.0003 USD
Llama 4 Maverick 17B 0.00024 USD 0.00097 USD 0.00012 USD 0.000485 USD

※全てバージニア北部リージョンで算出しております。
※一部のモデルは東京リージョンに対応していません。
※リージョンに応じて料金が変わる場合がございます。

一部の AI モデルに限定されてしまいますが、固定料金の固定期間サブスクリプション(プロビジョニングされたスループット)などの提供形態がございます。

オンデマンド vs プロビジョンドの使い分け

最後に、オンデマンド と プロビジョンドの使い分けに関して、ご紹介します。
Vertex AI では、生成 AI を利用した分だけ費用が発生する従量課金(オンデマンド)と、あらかじめ、月額または、週単位の決まった費用を前払いすることで、 オンデマンドよりも安く利用できる(プロビジョンド)の2種類がございます。
オンデマンドは不規則な利用や開発段階に適しており、実際の使用分のみ支払うため無駄があまり発生しません。プロビジョンドは、ある程度、AI モデルの利用するキャパシティや利用期間がコミットされている状態で利用したい場合に適しております。利用頻度とレスポンス時間要件に応じて、最適な課金方式を選択することが重要です。

オンデマンドに向いているユースケース

  • 利用が不規則なパターン
  • 開発・テスト段階
  • 小規模利用

プロビジョンドに向いているユースケース

  • 月額または週単位の固定料金で生成 AI の費用を管理し、超過料金を制御したいパターン
  • 高いパフォーマンスが必要な AI モデルを事前に確保したいパターン

参考:プロビジョニングされたスループットの概要 – Google Cloud

さいごに

本ブログでは、Vertex AI で利用できるモデルや料金についてご紹介しました。
最近の AI モデルは、安くて高性能なモデルがたくさんあるので、これを機に Vertex AI をたくさん使ってみたいと思います。

NHN テコラスの採用情報はこちら

テックブログ新着情報のほか、AWSやGoogle Cloudに関するお役立ち情報を配信中!

amaebi

amaebiと申します。クラウドエンジニアとしてまだまだ未熟ですが、これから精進していきたいです。

Recommends

こちらもおすすめ

Special Topics

注目記事はこちら