Anthropic’s Claude 3 Sonnet modelがAmazon Bedrockで利用可能になったので使ってみた
はじめに
AWS公式からAnthropic’s Claude 3 Sonnet modelがAmazon Bedrock上で提供が開始されたとアナウンスがありました!
Anthropic’s Claude 3 Sonnet model now available on Amazon Bedrock
Claudeは、Amazon Bedrockを日本語利用する際、現在だと非常に多く使われるケースがあり、それの最新版の性能や機能は非常に気になるところです。
ざっくりと新機能や特徴などをまとめて、実際に使ってみようと思います!
Anthropic’s Claude 3の特徴
Anthropicが提供する「Models overview」から、モデルの特徴をご紹介していきます。
(1)視覚情報や画像入力に対応
Anthropicが提供する前のモデルとの差分として、「Vision」があげられます。
このVisionという機能により、視覚情報(画像など)の入力に対する分析や処理を実現できます。「Models overview」内「Claude 3: A new generation of AI」では、具体的にチャート・グラフ・写真を視覚情報として例示していました。
最も推している特徴らしく、Visionのみを説明するページも公開されております。
Vision
(2)多言語対応
翻訳や様々な言語でのコンテンツ作成に利用できます。モデルによっては、日本語非対応であったり、出力される結果が求めるレベルでなかったりするため、日本人としては非常にうれしいですね。
他モデルとSonnet modelの比較
Anthropic’s Claude 3では、「Sonnet」「Opus」「Haiku」の3モデルが提供されます。
※2024/3/5時点ではHaikuは未リリースです
「Models overview」内の「Model recommendations」と「Model comparison」で、記載されているモデルごとの特徴を解説します。
Amazon Bedrockで利用できるのは「Sonnet」のみですが、他モデルを理解することで、より納得感をもって本モデルを使えるかなと思いましたので、情報としてまとめてみます。
Claude 3 Opus
Claude 2、2.1に比べ高い性能を持ちますが、スピードは同程度のモデルです。
Sonnet、Haikuと比べて最も高い知能レベルを保有するかわりに、料金が高くなっています。
Claude 3 Sonnet
Claude 2、2.1に比べ性能・スピードともにより高いです。
知能レベルについてはOpusには及ばないものの、Haikuよりは高くなっています。
Claude 3 Haiku
最も速く、コスト効率の高いモデルです。
知能レベルについては他モデルのほうが高いですが、ユースケースに必要なパフォーマンスが出ると判断できれば、最も安価に利用可能です。
ユースケースごとに使い分けるというよりは、「コストとパフォーマンスのバランスに応じて使い分ける」イメージかなと思います。
最も早く提供したのが「Sonnet」だったのは、最もバランスの取れたモデルだからかもしれませんね。
料金
Sonnet modelの提供に伴い、料金ページも更新されています。記事執筆時点だと英語ドキュメントに切り替える必要がありますので、「Claude 3」が表示されない方はお試しください。
Amazon Bedrock Pricing
- インプットトークン
$ 0.003 / 1000 input -
アウトプットトークン
$ 0.015 / 1000 output
日本語入力だとこの「トークン」という概念は難しいため、私が以前執筆した「Amazon Bedrockの利用トークン数をCloudWatch Logs Insightsで集計してみる」などを参考に使いながらモニタリング、傾向を分析するのがコストを予測する上で最も近道かなと考えています。
準備
特徴や料金などの情報を押さえたので、さっそく使ってみましょう!!
モデルを利用するためには、「モデルアクセス」をまず設定する必要がありますので、その手順を簡単にご紹介します。
1. Amazon Bedrockコンソールへ遷移
2. 左側メニュー「モデルアクセス」を選択
3. 左側メニュー「モデルアクセスを管理」を選択
4. 「Claude 3 Sonnet」のチェックボックスを押下し、右下の「変更を保存」を押下
一定時間が経過すると、「アクセスが付与されました」と記載されます。
使ってみた
今回のアップデートで最も重要なのが「画像入力に対応した」点だと思いますので、そのあたりを色々試せればと思います!
せっかくなので、Anthropicが提供するドキュメント「Vision」の「Prompting Tips」を参考に試してみたいと思います。
(1)入力された画像の説明
昨年参加したre:Inventにあったレトロなゲーム機の画像を説明してもらいました。
プロンプト実行画面
[回答]
この画像は、レトロなアーケードゲーム機の「パックマン」を示しています。ゲーム機のキャビネットには、パックマンやゴースト、フルーツなどの特徴的なグラフィックデザインが描かれており、ネオンのような発行体がゲーム機を鮮やかに照らしています。周囲は紫がかった照明で、レトロな雰囲気を醸し出しています。このようなクラシックなアーケードゲームは、ゲームセンターやエンターテインメント施設によく置かれ、ノスタルジックな楽しみを与えてくれます。
この画像から「レトロなゲーム機」「パックマン」「会場の雰囲気」まで読み取ることができています。素晴らしいですね!
(2)画像比較
今回は、下記2つの画像の違いを説明してもらいました。
プロンプト実行画面
[回答]
これらの2つの画像は、同じ風景を描いた絵画のようです。大きな違いは特にありませんが、細かい部分では以下のような違いが見られます。
1. 鳥の数と位置が異なります。上の画像には5羽の鳥が飛んでいますが、下の画像には鳥がいません。
2. 山々の輪郭や色合いがわずかに異なっています。下の画像の方が山の輪郭がよりくっきりしています。
3. 村落の家並みの描き方に細かな違いがあり、下の画像の方が建物の質感がより詳細に描かれているように見えます。
4. 湖の色合いと反射の描き方が、わずかに異なっています。
全体的には同じ風景を描いた作品ですが、細部においてアーティストの描き分けの違いが現れている2つの類似した絵画だと思われます。
かなり細かい部分まで見られていそうですね。この機能は「異常検出」などの用途でも十分使える機能のように見えるので、切り出して記事化できたらよいなと思います!
まとめ
今回の記事では、Amazon Bedrockで利用可能となった「Anthropic’s Claude 3 Sonnet model」について概要や特徴、使用例をご紹介しました。
様々なインプットに対応できるモデルは、それだけ用途の可能性が広がります。実際に使ってみることで、テキスト入力のみでは実現できなかった業務効率化やシステムの精度向上に対する導入の可能性を検討するきっかけにつながるかもしれません。
私自身も積極的に使い、有効なケースが見つかったらまた発信しようかと思います。
おまけ
「使ってみた」パートの「画像比較」に使う画像は、Amazon Bedrockで利用可能な「SDXL 1.0」モデルを利用して作成しました。
デモ用の簡単なテストデータ作成も生成AIで完結するケースが多いので、非常に楽ですね。いい時代だ。。
テックブログ新着情報のほか、AWSやGoogle Cloudに関するお役立ち情報を配信中!
Follow @twitterインフラエンジニア歴5年のフクナガです。2024 Japan AWS Top Engineers選出されました! 生成 AI 多めで発信していますが、CI/CDやIaCへの関心も高いです。休日はベースを弾いてます。
Recommends
こちらもおすすめ
Special Topics
注目記事はこちら
データ分析入門
これから始めるBigQuery基礎知識
2024.02.28
AWSの料金が 10 %割引になる!
『AWSの請求代行リセールサービス』
2024.07.16