【生成 AI】Claude 3.5 SonnetをGoogle Cloudで使ってみた #Vertex AI
2024.6.28
はじめに
これまで、Claudeネタでいくつか記事を書いてきました。
そんな中「あれ、Google Cloudで利用する方法紹介してなくない?」となりましたので、ご紹介していきたいと思います!
AWSで利用する場合と根本の精度自体が変わるということはありませんが、「Google Cloudを使っている方もClaudeを試せるよ!」という観点でご参考にしていただければなと思います。
Anthropic’s Claude 3.5 Sonnet とは
Today, we’re launching Claude 3.5 Sonnet—our first release in the forthcoming Claude 3.5 model family. Claude 3.5 Sonnet raises the industry bar for intelligence, outperforming competitor models and Claude 3 Opus on a wide range of evaluations, with the speed and cost of our mid-tier model, Claude 3 Sonnet.
出展:Claude 3.5 Sonnet
ざっくり訳すと、
Claude 3 Opusや競合モデルを様々な評価で上回ったモデルで、速度とコストはClaude 3 Sonnetと同じです。
といったところでしょうか。
コスト観点で、Claude 3のSonnetとOpusは5倍の価格差があったので、「速度・コストがSonnetと同じ」「性能はOpusを上回る」というのはとても期待できそうですね!
Vertex AI上での利用料金
単純比較が難しいのですが、Google Cloudで最も選択肢に上がる「Gemini 1.5 Pro」との料金を見比べてみます。
(1) Claude 3.5 Sonnet
入力:$3 / 100 万 トークン
出力:$15 / 100 万 トークン
(2) Gemini 1.5 Pro
入力:$0.00125 / 1,000 文字
出力:$0.00375 / 1,000 文字
※128,000 コンテキストウィンドウ(チャットのセッションで保持する記憶量)以下の場合のみ記載
トークンあたり約4文字になるそうなので、Geminiで表示されている値段を4000倍すると同じ入出力文字数での利用料金比較ができそうです。
100 万 トークン単位でGemini 1.5 Proの料金を再算出してみます。
入力:$5 / 100 万 トークン(約400万文字)
出力:$15 / 100 万 トークン(約400万文字)
※あくまで概算値となりますのでご注意ください。
料金比較ですと、入力のみ若干Claude 3.5 Sonnetが安いという結果となりました。
とはいえ、400万文字程度入れて2ドルくらいの違いしかないので、あまり明確な差はなさそうですね。
ちなみに、Claude 3 OpusはClaude 3.5 Sonnetの5倍の料金となるため、そこと比較すると非常に価格メリットはありそうです。
参考:Vertex AI pricing
※言語設定を「English」に設定すると、「Claude 3.5 Sonnet」の利用料金を確認できます
Claude 3.5 Sonnetを使い始めるまで
Google Cloudコンソールの画面上部検索窓に「Vertex AI」と入力、表示された「Vertex AI」を選択
左側メニューバーを開き、「Model Garden」を選択
「モデルを検索」に「Claude 3.5 Sonnet」と入力し、表示された「Claude 3.5 Sonnet」を選択
「有効にする」を押下し、モデルを有効化
「This third party model is licensed from Anthropic and is provided under Anthropic’s terms of service.」の必要な部分を入力し、「次へ」を押下
利用規約への同意を実施し、「同意する」を押下
下記のポップアップが出てきたら準備OKです!
Claude 3.5 Sonnetを使うためのサンプルノートブック
Claude 3.5 Sonnetは執筆時点で「VERTEX AI STUDIO」で利用できなさそうなので、おなじみColab Enterpriseを使っていきたいと思います!
「使ったことないよ!」という読者の方は、ぜひ下記の記事を参考に利用環境を整えてみてください!
下記にノートブック上で実装するソースコードを記載します。
ソースコード
(1) 事前準備
!pip install -U 'anthropic[vertex]' !pip install "google-cloud-aiplatform"
(2) Claude 3.5 Sonnet呼び出し用関数の定義
下記を参照して実装しております。
Anthropic の Claude 3 モデルを使用する
from anthropic import AnthropicVertex import json def generate_text_claude(prompt: str) -> object: client = AnthropicVertex(region="us-east5", project_id="ご自身のプロジェクトIDを入力") message = client.messages.create( model="claude-3-5-sonnet@20240620", max_tokens=1024, messages=[ { "role": "user", "content": prompt, } ], ) # JSONデータをパース data = json.loads(message.model_dump_json(indent=2)) # "text"の中身を取得 text_content = data["content"][0]["text"] # 結果を返す print(text_content) return message
(3) プロンプトを実行
prompt = "日本の首都はどこですか?" generate_text_claude(prompt)
Gemini 1.5 ProとClaude 3.5 Sonnetの回答を見比べてみた
せっかくGoogle Cloudで利用するので、Gemini 1.5 Proと出力を比較してみましょう!
(1) 日本の首都はどこですか?
Claude 3.5 Sonnetの回答
日本の首都は東京(とうきょう)です。
東京に関する主な情報:
- 正式名称は東京都(とうきょうと)です。
-
人口約1,400万人で、日本最大の都市です。
-
政治、経済、文化の中心地として機能しています。
-
1868年に江戸から東京に改名され、首都となりました。
-
23の特別区と多摩地域、島しょ部で構成されています。
-
世界有数の国際都市で、多くの企業や金融機関の本社があります。
-
2020年(2021年に延期)には夏季オリンピック・パラリンピックの開催地でした。
-
皇居や国会議事堂など、重要な施設が集中しています。
東京は日本の政治、経済、文化の中心地として重要な役割を果たしており、世界的にも注目される大都市です。
Gemini 1.5 Proの回答
日本の首都は東京です。
(2) セミナーのタイトルを考えてください。
5月に弊社で行った「【生成AI活用】Google Cloudの生成AI(Vertex AI)で実現するセキュアな生成AI導入・活用」というセミナーの概要や詳細な情報を与えて、タイトルを考えてもらいました。
Claude 3.5 Sonnetの回答
「生成AIの安全な活用:Vertex AIで実現するセキュアな次世代テクノロジー」
このタイトルは以下の要素を含んでいます:
- 「生成AI」: セミナーの主要テーマを明確に示しています。
-
「安全な活用」: セキュリティの重要性を強調しています。
-
「Vertex AI」: Google Cloudの具体的なツールに言及しています。
-
「セキュアな次世代テクノロジー」: 最新技術と安全性の両立を示唆しています。
このタイトルは、セミナーの内容を簡潔に要約し、生成AIの可能性とセキュリティの両面に焦点を当てていることを伝えています。また、Vertex AIを使用した実践的なアプローチも強調しており、参加者の興味を引くことができるでしょう。
Gemini 1.5 Proの回答
## 生成AIセミナー タイトル案
### セキュリティ対策とGoogle Cloudで学ぶ、安全な生成AI活用セミナー
#### 副題例
* 生成AIの可能性とリスク、Vertex AIによる安全設計・実装まで
* 企業導入に必須! 生成AIセキュリティ対策と実践手法
* Google Cloudのエキスパートが解説! Vertex AIで実現するセキュアな生成AI活用
#### その他
* 上記を組み合わせ、「【Google Cloudパートナー主催】」などの文言を追加しても良いでしょう。
* ターゲット層に合わせて、「~入門編」、「~実践編」などの文言を追加するのも効果的です。
マークダウンで出力してくれるので、親切ですね!
まとめ
本記事では、Google Cloud上でClaude 3.5 Sonnetを利用する方法をご紹介しました。実際に生成AIアプリケーションを構築する上で、様々なモデルを比較することは必須と言えるのではないでしょうか。
Google Cloud上で様々なモデルを利用でき、出力の結果や精度を比較しながら最適なモデルを選ぶことができるのは非常にうれしいですよね!
今後も様々なモデルが登場すると考えられますので、ぜひぜひGoogle Cloudで各モデルを試してみてください!
テックブログ新着情報のほか、AWSやGoogle Cloudに関するお役立ち情報を配信中!
Follow @twitterインフラエンジニア歴5年のフクナガです。2024 Japan AWS Top Engineers / Google Cloud Partner Top Engineer 2025 に選出されました! 生成 AI 多めで発信していますが、CI/CDやIaCへの関心も高いです。休日はベースを弾いてます。
Recommends
こちらもおすすめ
Special Topics
注目記事はこちら
データ分析入門
これから始めるBigQuery基礎知識
2024.02.28
AWSの料金が 10 %割引になる!
『AWSの請求代行リセールサービス』
2024.07.16