『生成 AI』における『ガードレール』とは？

YUJI

コラム

2024.12.14

Topics

はじめに
そもそも、生成 AIにおけるガードレールとは？
生成 AIにおけるリスク
リスクに応じた、ガードレールの実装例
まとめ

この記事はNHN テコラス Advent Calendar 2024 の14日目の記事です。

はじめに

こんにちは、YUJIです。

最近、Amazon Bedrockをはじめとする生成 AIの活用情報や
生成 AIにおけるガードレール関連のアップデート情報をキャッチする機会が増えたため
前提として、そもそも『生成 AIにおけるガードレールとは何なのか』をまとめてみました。

そもそも、生成 AIにおけるガードレールとは？

生成 AIにおけるガードレールとは
『AIの利用において想定外の動作やリスクを防ぐための仕組みや制御手段』を指します。

まずは、語源の通りにガードレール(安全柵)を思い浮かべていただくのが一番直感的かと思います。

例えば、車の運転が上手な人ばかりなら人に危害を加えたり事故を起こしてしまうことはありませんが
すべての人が運転が上手という訳ではないので、ガードレールを設置しておくに越したことはありません。
生成 AIの活用にも、同じ事が言えるかと思います。

今後、ITリテラシーの高い人材のみならず、すべての人が生成 AIを活用していく上で
ガードレールは適切に、責任を持って実装しておきたいですね。

生成 AIにおけるリスク

例えば、生成 AIを活用する上で、以下のようなリスクがあります。

不適切な内容が生成されてしまう

・暴力的・性的に有害なコンテンツ
・法律や規約に違反する内容
・誹謗中傷やヘイトスピーチ　など

最近も、AIが急に質問者に向かって暴言を吐くような回答を出力してしまい、それがSNS上で拡散されてしまったという事がありました。
企業のイメージ毀損に繋がってしまうので、気をつけたいポイントですね。

意図しないやり方で利用されてしまう

・過剰な負荷を起こす
・無駄な課金を引き起こす　など

生成 AIは、利用量に応じた従量課金であることが一般的なので、上記のような利用のされ方をしてしまうと
金銭的な被害に直結してしまいます。

回答を通して、個人情報が漏洩してしまう

・攻撃者が巧妙なプロンプトを入力し、生成 AIから個人情報を不正に引き出す
・生成 AIが、学習データに含まれる個人情報を誤って出力してしまう
・ユーザーが入力した情報が、意図せず他のユーザーに公開されてしまう　など

生成 AIが大量のデータを学習している場合、その中に個人情報が含まれている可能性が高く
適切な対策を講じなければ、意図せず漏洩してしまうリスクがあります。

AIが間違った情報を答えてしまう

・医療や法律に関する誤解を招くアドバイス
・製品やサービスについての誤った説明
・他者を誤解させるような情報の生成　など

上記のような誤った情報提示は、ユーザーの信頼を失墜させる可能性があります。

リスクに応じた、ガードレールの実装例

例として挙げたリスクに対して、それぞれに対するガードレールの実装例を紹介します。

不適切な内容が生成されてしまう

対策としては、有害なコンテンツのブロック設定をしておくことが挙げられます。

「生成 AIが出力した回答に有害な言葉を含めないようにする」というのはもちろんのこと
「ユーザー側で入力された不適切な言葉をブロックする」という設定も
生成 AI自身の学習に有害なコンテンツが使われてしまうことを避けるのにも役立ちます。

意図しないやり方で利用されてしまう

対策としては、利用制限やレートリミット（使用回数制限）を設けることが有効です。
例えば、一度に大量のリクエストを送るといった行為や、APIの過剰使用を防ぐ仕組みを導入します。
加えて、利用目的に応じたアクセス権限や認証機能を設定することで、不正な利用を未然に防ぐことができます。

回答を通して個人情報が漏洩してしまう

生成 AIに個人情報を含むデータを学習させる場合、そのデータに適切なマスキング処理（特定の情報を伏せる処理）を施すことが必要です。
また、AIが出力する回答から個人情報が含まれないように
特定の形式（電話番号やメールアドレスなど）の情報を検出して、出力を遮断することも考えられます。

■例
000-0000-0000(電話番号) → {PHONE_NUMBER}
aaa@example.com(メールアドレス) → {EMAIL_ADDRESS}
のように、機微情報を検知→文字を置換する処理を加える　など

AIが間違った情報を答えてしまう

AIの出力結果に誤りが含まれるリスクを軽減するためには
AIの回答に対して「情報の信頼性スコア」を付与する仕組みや、「参考文献」や「出典」を提示する機能が役立ちます。
また、ユーザーが生成結果の確認・編集を容易に行えるよう、インターフェースを工夫することも重要です。

まとめ

生成 AIにおけるガードレールについて、基本的な概念とリスク対策の例を解説しました。

本記事では概念の説明に留めていますので、少し抽象的な内容の記事だったかと思いますが
「じゃあ実際にAmazon Bedrockではガードレール実装しようと思った時に、どの程度簡単に実装できるか、どう操作すれば良いか。」
などを、次回以降の記事で解説できればと思います！

最後まで読んでいただき、ありがとうございました。

テックブログ新着情報のほか、AWSやGoogle Cloudに関するお役立ち情報を配信中！

Follow @twitter

YUJI

2025 AWS Community Builder / 2024 Japan AWS All Certifications Engineer

Recommends

Special Topics

注目記事はこちら

データ分析入門
これから始めるBigQuery基礎知識

2024.02.28

ホワイトペーパー

　AWSの料金が 10 %割引になる！
『AWSの請求代行リセールサービス』

2024.07.16

サービス

『生成 AI』における『ガードレール』とは？

はじめに

そもそも、生成 AIにおけるガードレールとは？

生成 AIにおけるリスク

不適切な内容が生成されてしまう

意図しないやり方で利用されてしまう

回答を通して、個人情報が漏洩してしまう

AIが間違った情報を答えてしまう

リスクに応じた、ガードレールの実装例

不適切な内容が生成されてしまう

意図しないやり方で利用されてしまう

回答を通して個人情報が漏洩してしまう

AIが間違った情報を答えてしまう

まとめ

Recommends

【手順付き】AWS Organizations 環境改善、AWS Trusted Advisor 組織ビューで始めよう！

【AWS Summit Japan 2024】プロトタイプ開発から見えてきた公共向け生成 AI ユースケースと知見共有（AWS-52）

Cloud Spanner の構成を徹底解説！

[AWS re:Invent 2024]re:Invent のパフォーマンスと筋肥大を最大化する方法

【生成AI】Amazon OpenSearch Serverless と Amazon Aurora を RAG 用途で比較してみた

【Google Cloud Next Tokyo ’24】「Vertex AIの業務への活用・導入のポイント」というタイトルで登壇してきました！

Special Topics

データ分析入門
これから始めるBigQuery基礎知識

AWSの料金が 10 %割引になる！
『AWSの請求代行リセールサービス』

『生成 AI』における『ガードレール』とは？

はじめに

そもそも、生成 AIにおけるガードレールとは？

生成 AIにおけるリスク

不適切な内容が生成されてしまう

意図しないやり方で利用されてしまう

回答を通して、個人情報が漏洩してしまう

AIが間違った情報を答えてしまう

リスクに応じた、ガードレールの実装例

不適切な内容が生成されてしまう

意図しないやり方で利用されてしまう

回答を通して個人情報が漏洩してしまう

AIが間違った情報を答えてしまう

まとめ

Recommends

【手順付き】AWS Organizations 環境改善、AWS Trusted Advisor 組織ビューで始めよう！

【AWS Summit Japan 2024】プロトタイプ開発から見えてきた公共向け生成 AI ユースケースと知見共有（AWS-52）

Cloud Spanner の構成を徹底解説！

[AWS re:Invent 2024]re:Invent のパフォーマンスと筋肥大を最大化する方法

【生成AI】Amazon OpenSearch Serverless と Amazon Aurora を RAG 用途で比較してみた

【Google Cloud Next Tokyo ’24】「Vertex AIの業務への活用・導入のポイント」というタイトルで登壇してきました！

Special Topics

データ分析入門これから始めるBigQuery基礎知識

AWSの料金が 10 %割引になる！『AWSの請求代行リセールサービス』

データ分析入門
これから始めるBigQuery基礎知識

　AWSの料金が 10 %割引になる！
『AWSの請求代行リセールサービス』