Google Cloud の Vertex AI のモデルや料金について解説

amaebi

Google Cloud

2025.9.10

Topics

はじめに
Vertex AI とは
用途別モデル選択
料金体系の理解と Amazon Bedrock との比較
オンデマンド vs プロビジョンドの使い分け
さいごに

はじめに

こんにちは、皆さんお久しぶりです。
amaebiです！

今回は、Google Cloud の Vertex AI について、本ブログでご紹介します。

Vertex AI とは

本記事をご覧になってる方の中には、初めて Vertex AI を知る方もいらっしゃると思います。
そんな方のために、Vertex AI の概要について、少し触れていきたいと思います。

Vertex AI は、ML モデルと AI アプリケーションのトレーニングとデプロイを行い、AI を活用したアプリケーションで使用する大規模言語モデル（LLM）をカスタマイズできる機械学習（ML）プラットフォームです。
引用：Vertex AI の概要 – Google Cloud

Vertex AI の特徴は、AI モデルのチューニング、デプロイ、トレーニングといった開発から運用までのすべてのプロセスを一つのプラットフォームで完結できることにあります。特に、Vertex AI 内で作成したプロンプトをコードベース (Python、Node.js、Java など) で取得できるため、AI アプリケーションの開発・デプロイに簡単に活用できます。

また、Google が開発した AI モデル(Gemini など)に加えて、Claude や Llama などのサードパーティ製モデルも選択可能となっており、用途に合わせた最適な AI ソリューションを実現することができます。

さらに、弊社の Tech Blog にて、Vertex AI の使い方をご紹介したブログもございます。
興味がございましたら、こちらのブログもご覧ください。

関連記事: 【生成 AI】Claude 3.5 SonnetをGoogle Cloudで使ってみた #Vertex AI

用途別モデル選択

用途別にどういったモデルを活用するのが最適なのかについても触れていきます。

Gemini

Google が開発したマルチモーダル AI モデルであり、テキスト、音声、画像、動画などの多種多様なデータ形式を扱うことができます。特に、長いコンテキストの取り扱いは非常に優れており、なんと100万トークンのコンテキストウィンドウを標準対応としております。

長いコンテキスト – Google Cloud

その他、Google が開発したモデルであるため、Vertex AI との親和性も非常に高く、他のGoogle Cloud サービスとの連携も効率的に行えます。

ユースケース
- 大量のコンテキストや様々な入力を扱うケース
モデル例
- Gemini 2.5 Pro
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite

参考：Google models – Google Cloud

Llama

Meta が開発したオープンソースモデルであり、カスタマイズ性に優れているのが特徴です。
様々なコミュニティが改良、改変を加えており、目的に応じた様々な派生モデルが存在しております。

ユースケース
- 業務プロセスや要件などに合わせて、柔軟にカスタマイズが必要なケース
モデル例
- Llama 4 Scout
- Llama 4 Maverick

参考：The Llama 4 herd: The beginning of a new era of natively multimodal AI innovation – AI at Meta

Claude

Anthropic が開発した AI モデルであり、「安全性」に特化していることが特徴です。
倫理的に危険かどうかを学習するよう設計されており、有害なコンテンツを生成されないようになっております。

ユースケース
- 高度なコーディングや分析、読解などを行うケース
モデル例
- Anthropic Claude Opus 4.1
- Claude Opus 4
- Claude Sonnet 4

参考：Anthropic の Claude モデル – Google Cloud

Vertex AI では、様々な AI モデルを利用できます。
もっと詳細な情報を知りたい方は、以下の公式ドキュメントをご覧ください。

Model Garden で AI モデルを確認する – Google Cloud

料金体系の理解と Amazon Bedrock との比較

次に料金体系を見ていきましょう。
Vertex AI は、基本的に「従量課金制」を採用しており、利用した分だけユーザーに対し費用が発生します。
さらに、各サービスやモデルごとに料金が異なるため、利用状況の規模感やユースケース、予算に合わせた最適な利用方法を検討することが重要です。

Vertex AI での AI モデルの構築とデプロイにかかる費用 – Google Cloud

では、Vertex AI と Amazon Bedrock の各モデル別の料金を比較していきます。
Claude Sonnet 4 のような同一モデルでは料金はほとんど変わりませんが、各 AI プラットフォームによって対応する AI モデルが若干異なってきます。
(比較する AI モデルによって、性能が異なっている場合がございます。そのため、厳密な比較を望まれる際は、Vertex AI と Amazon Bedrock の公式ドキュメントをご覧ください。)

Vertex AI モデル料金

モデル名	入力 1,000 トークンあたり	出力 1,000 トークンあたり	パッチ入力 1,000 トークンあたり	パッチ出力 1,000 トークンあたり	キャッシュ入力 1,000 トークンあたり	キャッシュ出力 1,000 トークンあたり
Gemini 2.5 Flash Lite	通常入力 0.0001 USD オーディオ入力 0.0005 USD	0.0004
Claude Sonnet 4	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD	0.00375 USD	0.0015 USD
Llama 4 Maverick	0.00035 USD	0.00115 USD

参考：Vertex AI での AI モデルの構築とデプロイにかかる費用 – Google Cloud

Amazon Bedrock モデル料金

モデル名	入力 1,000 トークンあたり	出力 1,000 トークンあたり	パッチ入力 1,000 トークンあたり	パッチ出力 1,000 トークンあたり	キャッシュ入力 1,000 トークンあたり	キャッシュ出力 1,000 トークンあたり
Amazon Nova Lite	0.00006 USD	0.00024 USD	0.000015 USD	0.00003 USD
Claude Sonnet 4	0.003 USD	0.015 USD	該当なし	該当なし	0.00375 USD	0.0003 USD
Llama 4 Maverick 17B	0.00024 USD	0.00097 USD	0.00012 USD	0.000485 USD

※全てバージニア北部リージョンで算出しております。
※一部のモデルは東京リージョンに対応していません。
※リージョンに応じて料金が変わる場合がございます。

参考：Amazon Bedrock の料金 – Amazon Web Services

一部の AI モデルに限定されてしまいますが、固定料金の固定期間サブスクリプション(プロビジョニングされたスループット)などの提供形態がございます。

プロビジョニングされたスループットの概要 – Google Cloud

オンデマンド vs プロビジョンドの使い分け

最後に、オンデマンドとプロビジョンドの使い分けに関して、ご紹介します。
Vertex AI では、生成 AI を利用した分だけ費用が発生する従量課金(オンデマンド)と、あらかじめ、月額または、週単位の決まった費用を前払いすることで、オンデマンドよりも安く利用できる(プロビジョンド)の2種類がございます。
オンデマンドは不規則な利用や開発段階に適しており、実際の使用分のみ支払うため無駄があまり発生しません。プロビジョンドは、ある程度、AI モデルの利用するキャパシティや利用期間がコミットされている状態で利用したい場合に適しております。利用頻度とレスポンス時間要件に応じて、最適な課金方式を選択することが重要です。