https://hiddenlayer.com/innovation-hub/novel-universal-bypass-for-all-major-llms/
Novel Universal Bypass for All Major LLMs
HiddenLayerの研究者たちが、主要なLLMの命令階層と安全ガードレールを回避する、初の汎用的で転移可能なプロンプトインジェクション技術を開発しました。
この技術は、OpenAI、Google、Microsoft、Anthropic、Metaなど、主要なAIモデルで効果を発揮します。
ポリシー技術とロールプレイングを組み合わせることで、モデルのアライメントを回避し、AI安全ポリシーに違反するコンテンツを生成できます。