Google Cloud の Vertex AI のモデルや料金について解説
2025.9.10
はじめに
こんにちは、皆さんお久しぶりです。
amaebiです!
今回は、Google Cloud の Vertex AI について、本ブログでご紹介します。
Vertex AI とは
本記事をご覧になってる方の中には、初めて Vertex AI を知る方もいらっしゃると思います。
そんな方のために、Vertex AI の概要について、少し触れていきたいと思います。
Vertex AI は、ML モデルと AI アプリケーションのトレーニングとデプロイを行い、AI を活用したアプリケーションで使用する大規模言語モデル(LLM)をカスタマイズできる機械学習(ML)プラットフォームです。
引用:Vertex AI の概要 – Google Cloud
Vertex AI の特徴は、AI モデルのチューニング、デプロイ、トレーニングといった開発から運用までのすべてのプロセスを一つのプラットフォームで完結できることにあります。特に、Vertex AI 内で作成したプロンプトをコードベース (Python、Node.js、Java など) で取得できるため、AI アプリケーションの開発・デプロイに簡単に活用できます。
また、Google が開発した AI モデル(Gemini など)に加えて、Claude や Llama などのサードパーティ製モデルも選択可能となっており、用途に合わせた最適な AI ソリューションを実現することができます。
さらに、弊社の Tech Blog にて、Vertex AI の使い方をご紹介したブログもございます。
興味がございましたら、こちらのブログもご覧ください。
用途別モデル選択
用途別にどういったモデルを活用するのが最適なのかについても触れていきます。
Gemini
Google が開発したマルチモーダル AI モデルであり、テキスト、音声、画像、動画などの多種多様なデータ形式を扱うことができます。特に、長いコンテキストの取り扱いは非常に優れており、なんと100万トークンのコンテキスト ウィンドウを標準対応としております。
その他、Google が開発したモデルであるため、Vertex AI との親和性も非常に高く、他のGoogle Cloud サービスとの連携も効率的に行えます。
- ユースケース
- 大量のコンテキストや様々な入力を扱うケース
- モデル例
- Gemini 2.5 Pro
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
参考:Google models – Google Cloud
Llama
Meta が開発したオープンソースモデルであり、カスタマイズ性に優れているのが特徴です。
様々なコミュニティが改良、改変を加えており、目的に応じた様々な派生モデルが存在しております。
- ユースケース
- 業務プロセスや要件などに合わせて、柔軟にカスタマイズが必要なケース
- モデル例
- Llama 4 Scout
- Llama 4 Maverick
参考:The Llama 4 herd: The beginning of a new era of natively multimodal AI innovation – AI at Meta
Claude
Anthropic が開発した AI モデルであり、「安全性」に特化していることが特徴です。
倫理的に危険かどうかを学習するよう設計されており、有害なコンテンツを生成されないようになっております。
- ユースケース
- 高度なコーディングや分析、読解などを行うケース
- モデル例
- Anthropic Claude Opus 4.1
- Claude Opus 4
- Claude Sonnet 4
参考:Anthropic の Claude モデル – Google Cloud
Vertex AI では、様々な AI モデルを利用できます。
もっと詳細な情報を知りたい方は、以下の公式ドキュメントをご覧ください。
料金体系の理解と Amazon Bedrock との比較
次に料金体系を見ていきましょう。
Vertex AI は、基本的に「従量課金制」を採用しており、利用した分だけユーザーに対し費用が発生します。
さらに、各サービスやモデルごとに料金が異なるため、利用状況の規模感やユースケース、予算に合わせた最適な利用方法を検討することが重要です。
では、Vertex AI と Amazon Bedrock の各モデル別の料金を比較していきます。
Claude Sonnet 4 のような同一モデルでは料金はほとんど変わりませんが、各 AI プラットフォームによって対応する AI モデルが若干異なってきます。
(比較する AI モデルによって、性能が異なっている場合がございます。そのため、厳密な比較を望まれる際は、Vertex AI と Amazon Bedrock の公式ドキュメントをご覧ください。)
Vertex AI モデル料金
モデル名 | 入力 1,000 トークンあたり | 出力 1,000 トークンあたり | パッチ入力 1,000 トークンあたり | パッチ出力 1,000 トークンあたり | キャッシュ入力 1,000 トークンあたり | キャッシュ出力 1,000 トークンあたり |
---|---|---|---|---|---|---|
Gemini 2.5 Flash Lite | 通常入力 0.0001 USD オーディオ入力 0.0005 USD |
0.0004 | ||||
Claude Sonnet 4 | 0.003 USD | 0.015 USD | 0.0015 USD | 0.0075 USD | 0.00375 USD | 0.0015 USD |
Llama 4 Maverick | 0.00035 USD | 0.00115 USD |
Amazon Bedrock モデル料金
モデル名 | 入力 1,000 トークンあたり | 出力 1,000 トークンあたり | パッチ入力 1,000 トークンあたり | パッチ出力 1,000 トークンあたり | キャッシュ入力 1,000 トークンあたり | キャッシュ出力 1,000 トークンあたり |
---|---|---|---|---|---|---|
Amazon Nova Lite | 0.00006 USD | 0.00024 USD | 0.000015 USD | 0.00003 USD | ||
Claude Sonnet 4 | 0.003 USD | 0.015 USD | 該当なし | 該当なし | 0.00375 USD | 0.0003 USD |
Llama 4 Maverick 17B | 0.00024 USD | 0.00097 USD | 0.00012 USD | 0.000485 USD |
※全てバージニア北部リージョンで算出しております。
※一部のモデルは東京リージョンに対応していません。
※リージョンに応じて料金が変わる場合がございます。
一部の AI モデルに限定されてしまいますが、固定料金の固定期間サブスクリプション(プロビジョニングされたスループット)などの提供形態がございます。
オンデマンド vs プロビジョンドの使い分け
最後に、オンデマンド と プロビジョンドの使い分けに関して、ご紹介します。
Vertex AI では、生成 AI を利用した分だけ費用が発生する従量課金(オンデマンド)と、あらかじめ、月額または、週単位の決まった費用を前払いすることで、 オンデマンドよりも安く利用できる(プロビジョンド)の2種類がございます。
オンデマンドは不規則な利用や開発段階に適しており、実際の使用分のみ支払うため無駄があまり発生しません。プロビジョンドは、ある程度、AI モデルの利用するキャパシティや利用期間がコミットされている状態で利用したい場合に適しております。利用頻度とレスポンス時間要件に応じて、最適な課金方式を選択することが重要です。
オンデマンドに向いているユースケース
- 利用が不規則なパターン
- 開発・テスト段階
- 小規模利用
プロビジョンドに向いているユースケース
- 月額または週単位の固定料金で生成 AI の費用を管理し、超過料金を制御したいパターン
- 高いパフォーマンスが必要な AI モデルを事前に確保したいパターン
参考:プロビジョニングされたスループットの概要 – Google Cloud
さいごに
本ブログでは、Vertex AI で利用できるモデルや料金についてご紹介しました。
最近の AI モデルは、安くて高性能なモデルがたくさんあるので、これを機に Vertex AI をたくさん使ってみたいと思います。
NHN テコラスの採用情報はこちら
テックブログ新着情報のほか、AWSやGoogle Cloudに関するお役立ち情報を配信中!
Follow @twitteramaebiと申します。クラウドエンジニアとしてまだまだ未熟ですが、これから精進していきたいです。
Recommends
こちらもおすすめ
Special Topics
注目記事はこちら

データ分析入門
これから始めるBigQuery基礎知識
2024.02.28

AWSの料金が 10 %割引になる!
『AWSの請求代行リセールサービス』
2024.07.16