【生成AI】Llama 4 が Amazon Bedrock で 利用可能になりました!
はじめに
こんにちは、フクナガです。
Amazon Bedrock で利用できるモデルもかなり頻繁なアップデートがあり、キャッチアップが大変になってきましたね!
そのモデルの中でも注目度が高い「Llama」の最新シリーズである「Llama 4」から 2 モデルが Amazon Bedrock で利用できるようになりました!
Llama 4 models from Meta now available in Amazon Bedrock serverless
今回使えるようになったモデルと今後期待されるリリースについてご紹介していきたいと思います!
他プロバイダーから出されているモデルとも比較しながら、特長をお伝えします!
Llama とは
Meta 社から提供されている基盤モデルです。
コストパフォーマンスの高いモデルと紹介されており、OpenAI 社の GPT や Anthropic 社の Claude と並んで注目度の高いモデルです。
参考:Llama 4: Leading intelligence.Unrivaled speed and efficiency.
モデルの種類と違い
Llama 4 には、3 種類のモデルがあります。
それぞれの特長などをご紹介します。
参考:Amazon Bedrock の Meta’s Llama
① Llama 4 Scout
Llama 4 の中では最も軽量なモデルとなります。
ただ、他プロバイダーの軽量なモデルとは異なり、純粋な低スペック・低コストではないのが大きな特徴のようです。
最大トークン数が Maverick よりも大幅に多いため、「複数文書の分析」などのユースケースに強いと案内されています。
Llama 4 の場合は、コストを抑えるという目的よりも用途によって使い分ける方が多いのかもしれませんね。
② Llama 4 Maverick
Llama 4 Scout よりも多くのパラメーターでトレーニングされたモデルとなります。
イメージやテキスト理解に利用できることが公式で案内されているので、ふわっとした表現にはなりますが「難しい処理」をさせたい場合はこちらのモデルが良いのかもしれません。
➂ Llama 4 Behemoth
※Amazon Bedrock では 2025/5/16 時点では利用することができません
現在、Meta 社側でプレビュー中のモデルですが、各モデルの蒸留の教師モデルとして使えると公式が案内しているので、最も性能が高いモデルであることがわかります。
出典:The Llama 4 herd: The beginning of a new era of natively multimodal AI innovation
Llama 4 の特長としては、下記となると思います。
利用料金
各モデルや他プロバイダーが出すモデルの料金をご紹介します。
参考:Amazon Bedrock の料金
モデル | インプット料金/1000トークン | アウトプット料金/1000トークン |
---|---|---|
Llama 4 Scout | $0.00017 | $0.00066 |
Llama 4 Maverick | $0.00024 | $0.00097 |
Amazon Nova Premier | $0.0025 | $0.0125 |
Amazon Nova Pro | $0.0008 | $0.0032 |
Amazon Nova Lite | $0.00006 | $0.00024 |
Amazon Nova Micro | $0.000035 | $0.00014 |
Claude 3.7 Sonnet | $0.003 | $0.015 |
Claude 3.5 Haiku | $0.0008 | $0.004 |
Claude 3 Opus | $0.015 | $0.075 |
こうして比較してみると、Llama 4 の各モデルは他プロバイダーのモデルと比べると安価に使えそうですね。
また、Scout と Maverick の価格差はあまりないため、やはりコスト最適のための使い分けではそこまでメリットは生まれなさそうですね。
使ってみた
Amazon Bedrock でのモデル有効化や利用方法については下記のブログをご参照ください。
先日 Amazon Nova Premier を紹介するブログを執筆しましたが、その際と同様、「NHN テコラスの Web サイトにて公開された生成 AI に関する事例記事の要約」というタスクで試してみます。
AIをフル活用し、新聞配達店の窓口対応をチャットボットにより無人化 感情分析に基づいた緊急度自動判定も可能に – オルタナティブ導入事例
今回の比較は、「Llama 4 Scout」「Llama 4 Maverick」「Claude 3.5 Haiku」(価格が比較的近いため)の 3 種類で実施します!
プロンプト
下記は NHN テコラスが公開した事例記事となります。 30秒で要点がわかる要約版を作成してください。 <article> 事例記事の文字起こしを記載 </article>
出力スピード
メトリクス | Llama 4 Scout | Llama 4 Maverick | Claude 3.5 Haiku |
---|---|---|---|
レイテンシー | 1303 ms | 2761 ms | 5157 ms |
Llama 4 の各モデルが、Claude 3.5 Haiku よりも早いのは驚きでした!
回答内容
【Llama 4 Scout】
オルタナティブ社は、新聞配達店の窓口対応をチャットボットで無人化するシステムを構築しました。NHNテコラスの技術支援により、開発期間を約1ヶ月短縮し、データの整形・加工の精度を向上させました。システム導入により、人件費を含めたTCOを約35%削減し、顧客対応のオペレーション効率化にも成功しました。今後は、AWSを活用したデータ活用戦略を展開していく予定です。
【Llama 4 Maverick】
## オルタナティブのAIチャットボット導入事例
オルタナティブは、新聞配達店の顧客対応を自動化するために、Amazon ConnectとAmazon Lexを使ったAIチャットボットを導入しました。NHN テコラスの支援により、開発期間を1ヶ月短縮し、TCOを約35%削減することに成功しました。
### 主な成果
* 顧客対応の無人化
* TCOの約35%削減
* システムの品質向上
### 導入の背景
新聞配達業界では、デジタル化やメディア接触環境の多様化により、紙媒体の購読数が減少しています。オルタナティブは、顧客企業の新聞配達店のコスト削減と新規ビジネスの創出を目指して、AIチャットボットの導入を提案しました。
### システムの概要
* Amazon Connectで電話問い合わせを受け付け
* Amazon Lexで発話内容をテキスト化
* AWS Lambdaで顧客データのマッピング処理
* Amazon BedrockのClaudeでデータの整形・加工
* Amazon Comprehendで話者の感情分析
### NHN テコラスの支援
NHN テコラスは、Amazon Connectの導入と生成AI活用について技術的な支援を提供しました。具体的には、チャットボットの回答スピード改善や聞き取り・対話の精度改善において、丁寧なアドバイスを行いました。
### 今後の展望
オルタナティブは、今後もAWSを活用したシステム構築を計画しています。具体的には、新聞販売店の顧客応対記録や顧客情報をAWSクラウド上に集約し、リアルタイムでの意思決定支援やAIを活用した予測分析など、より高度なデータ活用戦略を展開していく予定です。
【Claude 3.5 Haiku】
【30秒要約】
オルタナティブ社は、新聞配達店のコンタクトセンターをAWSサービスとチャットボットで完全無人化。NHN テコラスの技術支援により、以下の成果を達成:
1. Amazon Connect/Lexを活用した自動応対システム構築
2. 感情分析による緊急度判定機能の実装
3. 人件費を含むTCOを35%削減
4. 開発期間を約1ヶ月短縮
インターン生も参画し、生成AIの可能性と課題を学びながら、顧客対応の革新的な仕組みを実現した事例。
所感
コストの低さからは考えられないクオリティだなと感じました!
「安いから悪いだろう」ではなく、しっかりと想定タスクに対する出力を試してから利用するモデルを決めることが重要だなと改めて感じました。
また、Llama 4 の対応言語リストに日本語が入っていないのにも関わらず、全く問題なく使えているのにも驚きました。
参考:Amazon Bedrock の Meta’s Llama
性能しかり、コストしかり、使わない理由はないんじゃないんですかね!?
Llama 4 の最高性能のモデルである「Behemoth」の登場が待ち遠しいですね!
Llama 固有の規約について
下記に Amazon Bedrock についての記述がされていますが、他のモデルと違い Llama はいくつか例外の記載があります。
AWS のサービス条件
内容をざっくり要約すると、Llama の ライセンスに準拠するという内容となります。
Llama 4 > LICENSE
各モデルによって、独自のサービス条件があったりするので上記によく目を通しておくのをおすすめします!
まとめ
今回のブログでは、新しく Amazon Bedrock で使えるようになった Llama 4 について紹介しました!
コストパフォーマンスが非常に高いモデルとして、生成 AI 活用時の選択肢に確実に入ってくるモデルだなと感じました。
日本語対応しているモデルが増えてきているので、それぞれの特長をおさえて選んでいく必要がありそうですね!
テックブログ新着情報のほか、AWSやGoogle Cloudに関するお役立ち情報を配信中!
Follow @twitter2024 Japan AWS Top Engineers / Google Cloud Partner Top Engineer 2025 に選出されました! 生成 AI 多めで発信していますが、CI/CDやIaCへの関心も高いです。休日はベースを弾いてます。
Recommends
こちらもおすすめ
Special Topics
注目記事はこちら

データ分析入門
これから始めるBigQuery基礎知識
2024.02.28

AWSの料金が 10 %割引になる!
『AWSの請求代行リセールサービス』
2024.07.16