『生成 AI』における『ガードレール』とは?

Column

2024.12.14

Topics

この記事はNHN テコラス Advent Calendar 2024 の14日目の記事です。

はじめに

こんにちは、YUJIです。

最近、Amazon Bedrockをはじめとする生成 AIの活用情報や
生成 AIにおけるガードレール関連のアップデート情報をキャッチする機会が増えたため
前提として、そもそも『生成 AIにおけるガードレールとは何なのか』をまとめてみました。

そもそも、生成 AIにおけるガードレールとは?

生成 AIにおけるガードレールとは
『AIの利用において想定外の動作やリスクを防ぐための仕組みや制御手段』を指します。

まずは、語源の通りにガードレール(安全柵)を思い浮かべていただくのが一番直感的かと思います。

例えば、車の運転が上手な人ばかりなら人に危害を加えたり事故を起こしてしまうことはありませんが
すべての人が運転が上手という訳ではないので、ガードレールを設置しておくに越したことはありません。
生成 AIの活用にも、同じ事が言えるかと思います。

今後、ITリテラシーの高い人材のみならず、すべての人が生成 AIを活用していく上で
ガードレールは適切に、責任を持って実装しておきたいですね。

生成 AIにおけるリスク

例えば、生成 AIを活用する上で、以下のようなリスクがあります。

不適切な内容が生成されてしまう

・暴力的・性的に有害なコンテンツ
・法律や規約に違反する内容
・誹謗中傷やヘイトスピーチ など

最近も、AIが急に質問者に向かって暴言を吐くような回答を出力してしまい、それがSNS上で拡散されてしまったという事がありました。
企業のイメージ毀損に繋がってしまうので、気をつけたいポイントですね。

意図しないやり方で利用されてしまう

・過剰な負荷を起こす
・無駄な課金を引き起こす など

生成 AIは、利用量に応じた従量課金であることが一般的なので、上記のような利用のされ方をしてしまうと
金銭的な被害に直結してしまいます。

回答を通して、個人情報が漏洩してしまう

・攻撃者が巧妙なプロンプトを入力し、生成 AIから個人情報を不正に引き出す
・生成 AIが、学習データに含まれる個人情報を誤って出力してしまう
・ユーザーが入力した情報が、意図せず他のユーザーに公開されてしまう など

生成 AIが大量のデータを学習している場合、その中に個人情報が含まれている可能性が高く
適切な対策を講じなければ、意図せず漏洩してしまうリスクがあります。

AIが間違った情報を答えてしまう

・医療や法律に関する誤解を招くアドバイス
・製品やサービスについての誤った説明
・他者を誤解させるような情報の生成 など

上記のような誤った情報提示は、ユーザーの信頼を失墜させる可能性があります。

リスクに応じた、ガードレールの実装例

例として挙げたリスクに対して、それぞれに対するガードレールの実装例を紹介します。

不適切な内容が生成されてしまう

対策としては、有害なコンテンツのブロック設定をしておくことが挙げられます。

「生成 AIが出力した回答に有害な言葉を含めないようにする」というのはもちろんのこと
「ユーザー側で入力された不適切な言葉をブロックする」という設定も
生成 AI自身の学習に有害なコンテンツが使われてしまうことを避けるのにも役立ちます。

意図しないやり方で利用されてしまう

対策としては、利用制限やレートリミット(使用回数制限)を設けることが有効です。
例えば、一度に大量のリクエストを送るといった行為や、APIの過剰使用を防ぐ仕組みを導入します。
加えて、利用目的に応じたアクセス権限や認証機能を設定することで、不正な利用を未然に防ぐことができます。

回答を通して個人情報が漏洩してしまう

生成 AIに個人情報を含むデータを学習させる場合、そのデータに適切なマスキング処理(特定の情報を伏せる処理)を施すことが必要です。
また、AIが出力する回答から個人情報が含まれないように
特定の形式(電話番号やメールアドレスなど)の情報を検出して、出力を遮断することも考えられます。

■例
000-0000-0000(電話番号) → {PHONE_NUMBER}
aaa@example.com(メールアドレス) → {EMAIL_ADDRESS}
のように、機微情報を検知→文字を置換する処理を加える など

AIが間違った情報を答えてしまう

AIの出力結果に誤りが含まれるリスクを軽減するためには
AIの回答に対して「情報の信頼性スコア」を付与する仕組みや、「参考文献」や「出典」を提示する機能が役立ちます。
また、ユーザーが生成結果の確認・編集を容易に行えるよう、インターフェースを工夫することも重要です。

まとめ

生成 AIにおけるガードレールについて、基本的な概念とリスク対策の例を解説しました。

本記事では概念の説明に留めていますので、少し抽象的な内容の記事だったかと思いますが
「じゃあ実際にAmazon Bedrockではガードレール実装しようと思った時に、どの程度簡単に実装できるか、どう操作すれば良いか。」
などを、次回以降の記事で解説できればと思います!

最後まで読んでいただき、ありがとうございました。

テックブログ新着情報のほか、AWSやGoogle Cloudに関するお役立ち情報を配信中!

YUJI

2023年9月に入社 邦ロックとVtuber好き

Recommends

こちらもおすすめ

Special Topics

注目記事はこちら