Guardrails for Amazon Bedrock が一般提供開始（GA）になりました

こんばんは、小寺です。
先週のアップデートを振り返ってみようと思います。
https://aws.amazon.com/jp/about-aws/whats-new/2024/04/guardrails-amazon-bedrock-available-safety-privacy-controls/

Guardrails for Amazon Bedrock とは

昨年12月のre:Inventで発表されたサービスですね。自然言語によるやり取りを行う際に、AI の利用ポリシーに合わせてカスタマイズして有害、危険なコンテンツをブロックする機能です。

「責任あるAI」という言葉をお聞きになったことがある方も多くいるかと思います。もちろん、各モデルには有害な、危険な、悪意のあるユーザー入力には応答しないような仕組みが提供されています。

しかし、LLMが搭載している有害、危険、悪意のあるという判断基準は一般的なものなので、各ユースケースに基づいた「機密情報」や「特定業務ナレッジ」のような固有の情報を制御するには不十分な面があります。そのため Guardrails for Amazon Bedrock機能を利用することで、拒否トピックとコンテンツフィルターを定義して、ユーザーとアプリケーション間のやり取りから望ましくない有害なコンテンツを削除したり、マスクすることができます。