【Google Cloud Next ’24】Gemini 1.5 Proがパブリックプレビューになりました!

Google Cloud

2024.4.12

Topics

はじめに

Google Cloud Next ’24 が開幕しましたね! 1日目のキーノートをリアルタイムで視聴したのですが、生成AIにかなり力を入れていることが伝わってきて、とても興味深かったです。

その中でも特に注目を集めていたのが、「Gemini 1.5 Proのパブリックプレビュー」です。
Gemini 1.5 Pro Now Available in 180+ Countries; With Native Audio Understanding, System Instructions, JSON Mode and More

数か月前に公開されたGeminiの衝撃的なデモ動画を見てからというもの、Gemini Advanced を個人的に契約してしまうほど興味を持っていたのですが、今回の発表で「早く使いたい!」という気持ちがさらに高まりました。

この記事では、Gemini 1.5 Pro の基本的な情報と、実際に使ってみた感想をシェアしたいと思います。

Google Cloudにおける生成AIの選択肢を整理

Vertex AI、Bard、そしてGeminiなどGoogle Cloudでは生成AIに関わる様々な用語が存在します。
この機会に総復習しておきましょう!

Vertex AIとGeminiの関係

Vertex AIは、生成を利用するためのGoogle Cloud マネージドサービスのことです。
Geminiは、そのサービスから利用することのできる大規模言語モデルとなります。

「Google CloudのVertex AIからGeminiを利用する。」

という短文を暗唱できるようになれば、関係性を理解したと言えるでしょう。

GeminiとBard

もともとは、Bard(生成AIアプリ)にGemini(モデル)が搭載されている、という関係性でした。
しかし、BardはGeminiとして生まれ変わりました。そのため、Googleの生成AIはGemini、Google Cloudの生成AIはVertex AIという理解をすると早いかなと思います。

Geminiのバージョンやモデルについて

Geminiは現在、「Ultra」「Pro」「Nano」の3タイプのモデルを提供しています。
しかし、バージョン1.5で提供しているのは「Pro」のみです。
今後、それぞれのモデルのバージョン1.5を出すのか、それともProに統一するのか気になるところです。

参考:https://deepmind.google/technologies/gemini/#gemini-1.0

Gemini 1.5 Proは何がすごい?

詳細はこちらを参照いただくのが良いと思いますが、簡単にまとめたいと思います。

  • オーディオと映像解析が可能

  • 出力形式の指定が可能
    特に「JSON mode」という出力をJSONのみに限定するモードが話題になっていた印象です。JSONで出力することで、別プログラムに直接値を渡すことができるなど、様々なユースケースがあると考えられます。

  • Gemini 1.0 Ultraと同等のパフォーマンス
    様々なテストの結果がGPT-4を上回ったことで話題になったGemini 1.0 Ultraと同等のクオリティを持ちます。

Our teams continue pushing the frontiers of our latest models with safety at the core. They are making rapid progress. In fact, we’re ready to introduce the next generation: Gemini 1.5. It shows dramatic improvements across a number of dimensions and 1.5 Pro achieves comparable quality to 1.0 Ultra, while using less compute.
引用:Our next-generation model: Gemini 1.5

料金体系

Gemini 1.5 Proの料金は、従量課金となっております。
参考: Vertex AI pricing
※2024/04/11時点では英語版にのみ記載されております。

Type Price
テキスト入力 $0.0025/1000文字
画像入力 $0.00265/枚
映像入力 $0.00265/秒
音声入力 $0.00025/秒
テキスト出力 $0.0075/1000文字

使ってみた

準備

1. Google Cloudコンソール上部の検索窓で「Vertex AI」と検索し、表示された「Vertex AI」を選択

2. 左側のメニューから「マルチモーダル」を選択し、「プロンプトの設計(シングルターン)」の下部にある「オープン」を選択する

3. 画面右側の「モデル」を選択し、「gemini-1.5-pro-preview-0409」を選択する


これで準備完了です!!

様々な入力を試してみる

(1) 文字入力

今回私が執筆したこの記事の章立てだけ与えて、記事を創作してもらいました。
プロンプトはこちらです。


<h2>はじめに</h2>

<h2>Google Cloudにおける生成AIの選択肢を整理</h2>


<h3>Gemini 1.5 Proは何がすごい?</h3>

<h3>料金体系</h3>

<h2>使ってみた</h2>

<h2>まとめ</h2>

皆さんお気づきでしょうか。そう、本当はもっと前提や詳細を打ちたかったのですが、誤ってこの状態で実行を押してしまいました。
普通なら打ち直すのですが、返ってきた内容が衝撃的過ぎたのでそのままご紹介します。

執筆する際のアドバイスまでくれました。

(2) 画像入力

マルチモーダルなモデルですので、画像も入力してみようと思います。
今回は、弊社のGoogle Cloud生成AI活用支援のWebページをスクリーンショットしたものを使ってみようと思います。
Google Cloud 生成AI活用支援
プロンプトはこちらです。


この画像で紹介しているサービスについて、顧客に魅力が伝わるように紹介してください。

かなり精度が高い返答がきました!


まとめ

今回は、Gemini 1.5 Pro の基本的な情報と、実際に使ってみた例をご紹介しました。底の知れない、とてつもないクオリティを持ったモデルだと思いますので、積極的に活用していきたいと思います。
また、料金についてもこの高いクオリティを考えると比較的良心的だと感じました。コスト観点でもクオリティ観点でもとても素晴らしいモデルですので、皆さんもぜひぜひ使ってみてください!

テックブログ新着情報のほか、AWSやGoogle Cloudに関するお役立ち情報を配信中!

フクナガ

インフラエンジニア歴5年のフクナガです。AWS(特にBedrockとCodePipeline)とGoogle Cloud(Vertex AI)が得意分野。休日はベースを弾いてます。技術力と発信力を高め、Top Engineerを目指しています。

Recommends

こちらもおすすめ

Special Topics

注目記事はこちら